創意信息技術股份有限公司花福軍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉創意信息技術股份有限公司申請的專利一種基于上下文提示的世界模型增強方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120373360B 。
龍圖騰網通過國家知識產權局官網在2025-09-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510855255.4,技術領域涉及:G06N3/0455;該發明授權一種基于上下文提示的世界模型增強方法及裝置是由花福軍;胡小剛;羅欽;王波;孫明;惠孛設計研發完成,并于2025-06-25向國家知識產權局提交的專利申請。
本一種基于上下文提示的世界模型增強方法及裝置在說明書摘要公布了:本發明提供了一種基于上下文提示的世界模型增強方法及裝置,屬于深度強化學習技術領域。方法根據當前圖像輸入得到圖像描述語句;通過卷積神經網絡得到當前圖像輸入的向量表示,利用語言模型得到圖像描述語句的向量表示,將圖向量表示與語句向量表示拼接,得到新的向量表示;將新的向量表示利用循環神經網絡實現對世界模型的建模,世界模型根據當前的向量輸入,在歷史動作和環境信息上下文基礎上進行動作決策,有效減輕了智能體探索時的軌跡回退現象出現的頻率。在環境變化時,智能體能根據上下文信息及時進行調整,提高智能體的適應性與靈活性。本發明有效減少了智能體錯誤決策的可能性,有效提升了在限定步數之內智能體的背景任務完成數量。
本發明授權一種基于上下文提示的世界模型增強方法及裝置在權利要求書中公布了:1.一種基于上下文提示的世界模型增強方法,其特征在于,包括: 獲取仿真環境的背景任務描述語句、環境觀測圖像和智能體的歷史動作指令信息,并利用多模態大語言模型從所述環境觀測圖像中提取出圖像描述語句上下文信息;其中,所述歷史動作指令信息拼接在圖像描述語句上下文信息的語句末尾; 利用卷積神經網絡對所述環境觀測圖像進行視覺特征提取,得到圖像特征向量,并對所述背景任務描述語句和圖像描述語句上下文信息進行文本特征提取,分別得到背景任務特征向量和上下文文本特征向量,同時將背景任務特征向量與上下文文本特征向量拼接為第一文本特征向量,并將第一文本特征向量與所述圖像特征向量進行融合,得到融合特征向量; 將智能體的歷史動作指令信息和融合特征向量輸入循環神經網絡中進行確定性狀態更新,并根據確定性狀態更新結果對當前仿真環境進行建模,得到世界模型; 智能體基于世界模型,利用演員評論家算法進行想象學習,并根據想象學習結果確定智能體的當前最佳動作序列;依據當前最佳動作序列在仿真環境中執行動作,同時獲取執行動作后仿真環境給出的動作反饋、環境狀態更新信息和更新后的智能體可視圖像,判斷動作執行后是否成功完成仿真環境中的背景任務,若動作執行后未成功完成背景任務,則依據更新后的智能體可視圖像進行動作決策,根據動作決策結果調整當前最佳動作序列,并執行下一動作;若動作執行后成功完成背景任務,則仿真環境同時返回值為1的獎勵。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人創意信息技術股份有限公司,其通訊地址為:610000 四川省成都市青羊區紅星路一段86號1棟222號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。