中科南京人工智能創新研究院;中國科學院自動化研究所胡慶浩獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中科南京人工智能創新研究院;中國科學院自動化研究所申請的專利用于多模態決策模型的輸入重排與緩存復用方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120524439B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202511014715.7,技術領域涉及:G06F18/25;該發明授權用于多模態決策模型的輸入重排與緩存復用方法是由胡慶浩;關偉凡;王培松;程健設計研發完成,并于2025-07-23向國家知識產權局提交的專利申請。
本用于多模態決策模型的輸入重排與緩存復用方法在說明書摘要公布了:本發明公開了一種用于多模態決策模型的輸入重排與緩存復用方法,包括:將文本輸入序列置于圖像輸入序列之前進行序列拼接,生成文本優先的拼接后輸入序列;在初始推理時,利用多層Transformer編碼器計算并緩存與文本輸入序列對應的文本Key?Value向量至靜態緩存區;在后續推理時,對新輸入的當前圖像幀執行幀間語義一致性檢測,并根據檢測結果對圖像部分的Key?Value向量執行按需或局部的更新;將緩存的文本Key?Value向量與更新后的圖像Key?Value向量進行拼接組裝,以完成最終決策。本發明有效避免了對不變指令的冗余計算,實現了緩存的精細化、智能化復用,提升了多模態決策模型在動態任務中的推理速度與吞吐率。
本發明授權用于多模態決策模型的輸入重排與緩存復用方法在權利要求書中公布了:1.用于多模態決策模型的輸入重排與緩存復用方法,其特征在于,包括: 接收文本輸入序列與圖像輸入序列,并以文本優先順序執行序列拼接,生成拼接后輸入序列; 將預設的可學習位置偏置分別與原始文本和圖像位置嵌入進行融合,構造與拼接后輸入序列的排列順序相適配的重構后位置嵌入序列; 結合拼接后輸入序列與重構后位置嵌入序列,形成模型總輸入表示; 利用多層Transformer編碼器處理模型總輸入表示,從其文本部分提取并生成文本Key-Value向量,并將其存入靜態緩存區以供后續推理復用,同時基于模型總輸入表示生成最終注意力輸出; 將最終注意力輸出傳遞至決策頭,生成最終的決策結果; 在后續推理復用文本Key-Value向量時,利用多層Transformer編碼器處理的過程進一步包括: 對當前圖像幀與前一圖像幀執行幀間語義一致性檢測,生成更新判決信號; 響應于更新判決信號指示需要更新,則對當前圖像幀進行編碼,生成新的圖像Key-Value向量; 響應于更新判決信號指示無需更新,則直接復用與前一圖像幀相對應的已緩存的圖像Key-Value向量; 將文本Key-Value向量與新的或復用的圖像Key-Value向量進行拼接組裝,獲得當前幀完整Key-Value集; 利用當前幀完整Key-Value集計算最終的注意力,生成決策結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中科南京人工智能創新研究院;中國科學院自動化研究所,其通訊地址為:211135 江蘇省南京市江寧區創研路266號麒麟人工智能產業園3號樓3樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。