廣東工業大學房小兆獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廣東工業大學申請的專利一種基于位置信息與置信度感知的圖文檢索方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117009570B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310971193.4,技術領域涉及:G06F16/583;該發明授權一種基于位置信息與置信度感知的圖文檢索方法及裝置是由房小兆;駱衍良;胡曦;曾峙翔;周郭許;謝勝利設計研發完成,并于2023-08-03向國家知識產權局提交的專利申請。
本一種基于位置信息與置信度感知的圖文檢索方法及裝置在說明書摘要公布了:本發明公開了一種基于位置信息與置信度感知的圖文檢索方法及裝置,包括:獲取待檢索對象;待檢索對象為待檢索圖像或待檢索文本;當待檢索對象為待檢索圖像時,提取待檢索圖像的圖像區域特征;在預設語料庫的各文本信息中提取文本單詞特征;采用文本單詞特征生成句子級文本特征;計算圖像區域特征與句子級文本特征的第一置信度;根據第一置信度確定待檢索圖像對應的文本信息;當待檢索對象為待檢索文本時,提取待檢索文本的單詞特征;在預設圖像庫中的各圖像中提取單詞特征對應的局部圖像特征;采用局部圖像特征生成全局圖像特征;計算待檢索文本與全局圖像特征的第二置信度;根據第二置信度確定待檢索文本對應的圖像。提高了跨模態檢索的性能。
本發明授權一種基于位置信息與置信度感知的圖文檢索方法及裝置在權利要求書中公布了:1.一種基于位置信息與置信度感知的圖文檢索方法,其特征在于,包括: 獲取待檢索對象;所述待檢索對象為待檢索圖像或待檢索文本; 當所述待檢索對象為待檢索圖像時,提取所述待檢索圖像的圖像區域特征; 在預設語料庫的各文本信息中提取文本單詞特征; 采用所述文本單詞特征生成句子級文本特征; 計算所述圖像區域特征與所述句子級文本特征的第一置信度; 根據所述第一置信度確定所述待檢索圖像對應的文本信息; 當所述待檢索對象為待檢索文本時,提取所述待檢索文本的單詞特征; 在預設圖像庫中的各圖像中提取所述單詞特征對應的局部圖像特征; 采用所述局部圖像特征生成全局圖像特征; 計算所述待檢索文本與所述全局圖像特征的第二置信度; 根據所述第二置信度確定所述待檢索文本對應的圖像; 其中,所述提取所述待檢索圖像的圖像區域特征的步驟,包括: 將所述待檢索圖像劃分為多個區域,并提取各所述區域的視覺特征; 獲取各區域的位置索引,并采用所述位置索引生成各區域的位置信息; 拼接各區域對應的視覺特征和位置信息,得到各區域的圖像區域特征; 其中,所述計算所述圖像區域特征與所述句子級文本特征的第一置信度的步驟,包括: 計算各所述圖像區域特征和各所述文本單詞特征之間的相似度矩陣; 對所述相似度矩陣進行歸一化,得到歸一化相似度矩陣; 根據所述歸一化相似度矩陣生成各所述圖像區域特征和各所述文本單詞特征之間的相似性分數; 以所述相似性分數為權重,對所述文本單詞特征進行加權平均,得到與所述圖像區域特征匹配的語義相關文本; 計算所述圖像區域特征與所述語義相關文本之間的局部語義相似向量; 計算所述待檢索圖像的全局圖像特征向量和所述文本信息的全局文本特征向量; 計算所述全局圖像特征向量和所述全局文本特征向量之間的全局語義相似向量; 采用所述局部語義相似向量和所述全局語義相似向量計算所述圖像區域特征與所述句子級文本特征的第一置信度。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廣東工業大學,其通訊地址為:510060 廣東省廣州市越秀區東風東路729號大院;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。