羅伯特·博世有限公司;皇家飛利浦有限公司M·赫爾曼獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉羅伯特·博世有限公司;皇家飛利浦有限公司申請的專利具有等變策略的物理環境交互獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114467094B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202080063639.8,技術領域涉及:G06N3/006;該發明授權具有等變策略的物理環境交互是由M·赫爾曼;M·韋林;H·范胡夫;E·范德珀;D·沃拉爾;F·A·奧利霍克設計研發完成,并于2020-09-08向國家知識產權局提交的專利申請。
本具有等變策略的物理環境交互在說明書摘要公布了:本發明涉及一種根據策略與物理環境交互的計算機實施的方法800。所述策略基于所述物理環境的可觀測狀態來確定相應動作的多個動作概率。所述策略包括由參數集合參數化的神經網絡。所述神經網絡通過從可觀測狀態確定最終層輸入并且將所述神經網絡的最終層應用于所述最終層輸入來確定所述動作概率。通過將等變的基礎權重矩陣的集合的線性組合應用于所述最終層輸入來應用所述最終層。所述基礎權重矩陣是等變的,在這個意義上,對于所述最終層輸入的多個預定義變換的集合,每個變換導致用于所述最終層輸入的基礎權重矩陣輸出的對應預定義動作置換。
本發明授權具有等變策略的物理環境交互在權利要求書中公布了:1.一種根據策略與物理環境交互的計算機實施的方法800,所述策略基于所述物理環境的可觀測狀態來確定相應動作的多個動作概率,其中所述策略包括由參數集合參數化的神經網絡,所述神經網絡通過從可觀測狀態確定最終層輸入并且將所述神經網絡的最終層應用于所述最終層輸入來確定所述動作概率,該方法包括: -訪問810所述策略的參數集合; -獲得820代表用于所述神經網絡的所述最終層的基礎權重矩陣的集合的基礎權重矩陣數據,其中對于所述最終層輸入的多個預定義變換的集合,每個變換導致用于所述最終層輸入的基礎權重矩陣輸出的對應預定義動作置換; -控制830與所述物理環境的交互,所述控制通過重復地: -從一個或多個傳感器獲得832指示所述物理環境的可觀測狀態的傳感器數據; -基于所述可觀測狀態確定834所述動作概率,包括通過將基礎權重矩陣的所述集合的線性組合應用于所述最終層輸入來應用所述神經網絡的最終層,所述線性組合的系數包含在所述參數集合中; -向致動器提供836導致所述致動器基于所確定的動作概率在所述物理環境中實現動作的致動器數據。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人羅伯特·博世有限公司;皇家飛利浦有限公司,其通訊地址為:德國斯圖加特;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。