京東科技信息技術有限公司李浩然獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉京東科技信息技術有限公司申請的專利基于多模態信息的文本摘要生成方法、訓練方法及其裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115270719B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210886234.5,技術領域涉及:G06F40/126;該發明授權基于多模態信息的文本摘要生成方法、訓練方法及其裝置是由李浩然設計研發完成,并于2022-07-26向國家知識產權局提交的專利申請。
本基于多模態信息的文本摘要生成方法、訓練方法及其裝置在說明書摘要公布了:本申請公開了一種基于多模態信息的文本摘要生成方法、訓練方法及其裝置,涉及文本處理技術領域。具體實現方案為:獲取輸入文本的編碼隱層狀態向量,并提取輸入圖像的全局圖像特征向量;根據編碼隱層狀態向量和全局圖像特征向量,基于跨模態的注意力機制,獲得當前時間步的文本注意力向量、當前時間步的視覺注意力向量和當前時間步的解碼隱層狀態向量;根據解碼隱層狀態向量,獲取生成概率;根據文本注意力向量獲取文本復制概率;根據視覺注意力向量和輸入文本與全局圖像特征向量之間的關聯概率,獲取視覺復制概率;根據生成概率、文本復制概率和視覺復制概率,獲取解碼概率,在詞匯表和輸入文本中進行篩選以獲得當前時間步的摘要單詞。
本發明授權基于多模態信息的文本摘要生成方法、訓練方法及其裝置在權利要求書中公布了:1.一種基于多模態信息的文本摘要生成方法,其特征在于,包括: 獲取輸入文本的編碼隱層狀態向量,并提取輸入圖像的全局圖像特征向量;所述輸入文本和所述輸入圖像為同一對象的不同模態信息; 根據所述編碼隱層狀態向量和所述全局圖像特征向量,基于跨模態的注意力機制,獲得當前時間步的文本注意力向量、當前時間步的視覺注意力向量和當前時間步的解碼隱層狀態向量; 根據所述解碼隱層狀態向量,獲取生成概率;所述生成概率為解碼生成的單詞從詞匯表中生成的概率; 根據所述文本注意力向量獲取文本復制概率,所述文本復制概率為解碼生成的單詞從所述輸入文本中復制的概率; 根據所述視覺注意力向量和所述輸入文本與所述全局圖像特征向量之間的關聯概率,獲取視覺復制概率; 根據所述生成概率、所述文本復制概率和所述視覺復制概率,獲取解碼概率,并基于所述解碼概率在所述詞匯表和所述輸入文本中進行篩選以獲得當前時間步的摘要單詞。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人京東科技信息技術有限公司,其通訊地址為:100176 北京市北京經濟技術開發區科創十一街18號院2號樓6層601;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。