粵港澳大灣區數字經濟研究院(福田)劉文龍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉粵港澳大灣區數字經濟研究院(福田)申請的專利一種圖像理解方法、裝置、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119579867B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411672475.5,技術領域涉及:G06V10/25;該發明授權一種圖像理解方法、裝置、設備及存儲介質是由劉文龍;馬正宇;申珺怡;高晗;黃宏杰;俞青;張磊設計研發完成,并于2024-11-21向國家知識產權局提交的專利申請。
本一種圖像理解方法、裝置、設備及存儲介質在說明書摘要公布了:本申請公開了一種圖像理解方法、裝置、設備及存儲介質,所述方法包括獲取待理解圖像以及任務令牌;獲取所述待理解圖像的多尺度圖像特征、多尺度圖像編碼特征以及目標區域位置信息;基于所述多尺度圖像特征和所述目標區域位置信息確定局部細粒度圖像特征,并基于所述多尺度圖像編碼特征和所述目標區域位置信息確定語義特征;基于所述語義特征、所述局部細粒度圖像特征以及所述任務令牌,確定所述待理解圖像的任務處理結果。本申請通過以目標區域位置信息作為區域指示信息,集中對目標區域位置信息對應的局部區域圖像進行局部理解,提高了局部區域圖像的理解準確性,進而可以提高任務處理結果的準確性。
本發明授權一種圖像理解方法、裝置、設備及存儲介質在權利要求書中公布了:1.一種圖像理解方法,其特征在于,所述圖像理解方法具體包括: 獲取待理解圖像以及任務令牌; 獲取所述待理解圖像的多尺度圖像特征、多尺度圖像編碼特征以及目標區域位置信息; 基于所述多尺度圖像特征和所述目標區域位置信息確定局部細粒度圖像特征,并基于所述多尺度圖像編碼特征和所述目標區域位置信息確定語義特征; 基于所述語義特征、所述局部細粒度圖像特征以及所述任務令牌,確定所述待理解圖像的任務處理結果; 其中,所述基于所述多尺度圖像特征和所述目標區域位置信息確定局部細粒度圖像特征具體包括: 將所述目標區域位置信息和所述多尺度圖像特征輸入局部細粒度特征提取器,通過所述局部細粒度特征提取器在所述多尺度圖像特征中選取一張目標圖像特征; 通過所述局部細粒度特征提取器在所述目標圖像特征中提取所述目標區域位置信息對應的局部圖像特征,以得到局部細粒度圖像特征; 所述基于所述多尺度圖像編碼特征和所述目標區域位置信息確定語義特征具體包括: 初始化內容編碼向量以及獲取所述目標區域位置信息對應的位置編碼向量; 基于所述內容編碼向量、所述位置編碼向量以及所述多尺度圖像編碼特征,確定語義特征。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人粵港澳大灣區數字經濟研究院(福田),其通訊地址為:518045 廣東省深圳市福田區福保街道市花路長富金茂大廈1號樓39樓3901單元;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。