北京大學深圳研究生院李革獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京大學深圳研究生院申請的專利一種基于上下文Transformer網絡的細粒度視頻-文本檢索方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114282060B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111613304.1,技術領域涉及:G06F16/783;該發明授權一種基于上下文Transformer網絡的細粒度視頻-文本檢索方法是由李革;陳明亮;任俞睿設計研發完成,并于2021-12-27向國家知識產權局提交的專利申請。
本一種基于上下文Transformer網絡的細粒度視頻-文本檢索方法在說明書摘要公布了:一種基于上下文Transformer網絡的細粒度視頻?文本檢索方法,包括S1.獲得視頻數據的全局層級特征、局部物體層級特征和局部動作層級特征;S2.將全局層級特征、局部物體層級特征和局部動作層級特征進行不同層級特征之間的上下文信息編碼;S3.將文本的全局特征、名詞特征、動詞特征輸入到基于注意力機制的圖推理模型中,得到文本數據的細粒度層級特征;以及S4.將細粒度層級特征輸入多層級跨模態匹配模塊進行相似度計算。本發明方法在跨模態視頻?文本檢索任務上取得更好的性能。
本發明授權一種基于上下文Transformer網絡的細粒度視頻-文本檢索方法在權利要求書中公布了:1.一種基于上下文Transformer網絡的細粒度視頻-文本檢索方法,其特征在于,包括以下步驟: S1.基于不同層級的預訓練模型,獲得視頻數據的全局層級特征、局部物體層級特征和局部動作層級特征; S2.將全局層級特征、局部物體層級特征和局部動作層級特征進行不同層級特征之間的上下文信息編碼; 將所述全局層級特征、所述局部物體層級特征和所述局部動作層級特征輸入視頻層級編碼框架,經由基于上下文的多層級Transformer網絡進行不同層級特征之間的上下文信息編碼; 所述基于上下文的多層級Transformer網絡由基于全局上下文的層級Transformer網絡和基于局部上下文的層級Transformer網絡共同組合而成; 所述基于全局上下文的層級Transformer輸入為局部層級和全局層級的特征,首先基于多頭自注意力網絡、正則化層、前饋神經網絡進行局部特征的基于自注意力機制的增強,然后再基于多頭交叉注意力網絡去構造產生全局與局部層級之間的上下文交互特征,具體地,通過基于全局上下文的層級Transformer網絡,當輸入為局部物體層級和全局層級特征時,可獲得全局-物體上下文特征;當輸入為局部動作層級和全局層級特征時,可獲得全局-動作上下文特征; 所述基于局部上下文的層級Transformer網絡輸入為兩個局部層級的特征,分別基于多頭自注意力網絡、正則化層、前饋神經網絡進行局部特征的基于自注意力機制的增強,然后再基于多頭交叉注意力網絡去構造產生局部與局部層級之間的上下文交互特征,在物體層級獲得動作-物體上下文特征,在動作層級獲得物體-動作上下文特征; 根據特征融合操作,在局部物體層級上融合全局-物體上下文特征、動作-物體上下文特征以構建基于上下文的局部物體層級特征;在局部動作層級上融合全局-動作上下文特征、物體-動作上下文特征,以構建基于上下文的局部動作層級特征; S3.將文本的全局特征、名詞特征、動詞特征輸入到基于注意力機制的圖推理模型中,得到文本數據的細粒度層級特征; S4.將所述細粒度層級特征輸入多層級跨模態匹配模塊進行特征相似度計算,輸出最終的視頻數據與文本數據的相似度結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京大學深圳研究生院,其通訊地址為:518055 廣東省深圳市南山區西麗鎮麗水路深圳大學城北大校區;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。