復旦大學;復旦大學義烏研究院洪智銘獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉復旦大學;復旦大學義烏研究院申請的專利開放環境中行為演化的時空融合推理與終身認知學習方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115526270B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211300756.9,技術領域涉及:G06N5/04;該發明授權開放環境中行為演化的時空融合推理與終身認知學習方法是由洪智銘;楊濤;吳曉峰;胡波設計研發完成,并于2022-10-24向國家知識產權局提交的專利申請。
本開放環境中行為演化的時空融合推理與終身認知學習方法在說明書摘要公布了:本發明提供一種開放環境中動作演化的時空融合推理與終身認知學習方法,根據歷史認知經驗與實時動作觀測相結合來構造時空融合視角,判定是否發生環境狀態轉移;在響應周期內,微調推理出抽象的自由度與任務級策略,然后根據環境獎勵回報校準響應的置信度,快速修正當前策略并適應環境。本發明構建了“多目標全局感知、多維度決策部署”的可演繹終身學習架構,提高了智能機器人對未知場景的風險探索與認知的效率。本方案提供了一個新的范式,利用跨層級的最佳響應動作與條件隨機場置信區間來促進自主學習的有效性,證明了在開放環境的隨機稀疏獎勵反饋下,構造不同任務間的快速遷移學習與自適應演化的動作機制。
本發明授權開放環境中行為演化的時空融合推理與終身認知學習方法在權利要求書中公布了:1.一種開放環境中動作演化的時空融合推理與終身認知學習方法,其特征在于,包括以下步驟: 步驟S1,系統中的各個智能體通過其計算機視覺裝置對開放環境進行實時性觀測,基于實時性觀測結果及半馬爾可夫決策模型得到累積獎勵動作庫,并對該累積獎勵動作庫進行蒙特卡羅采樣,得到觀測-動作歷史序列; 步驟S2,在預定時刻,所述智能體將所述實時性觀測結果與所述觀測-動作歷史序列進行回放得到歷史動作-觀測經驗序列,并基于該序列生成圍繞所述開放環境中目標的時空融合視角的n步聯合系統級策略,其中,所述歷史動作-觀測經驗序列包含有所述開放環境的條件隨機場的置信度; 步驟S3,各個所述智能體實時評估所述條件隨機場的置信分布水平,并基于該置信分布水平調整其自主學習的自由度; 步驟S4,各個所述智能體在其自主學習過程中,提取置信度及獎勵高于預定值的動作模式,將該動作模式映射到所述開放環境中的任務,在所述智能體的聯合空間內,基于所述條件隨機場構建層級主導聯合策略; 步驟S5,重復步驟S1~S4,基于所述聯合系統級策略和所述層級主導聯合策略推理出不同層次間的內在動機驅動,并構造當前所述開放環境下所述系統的最優聯合策略。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人復旦大學;復旦大學義烏研究院,其通訊地址為:200433 上海市楊浦區邯鄲路220號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。