鵬城實驗室許浩然獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉鵬城實驗室申請的專利基于視覺強化學習的模型訓練方法、裝置、設備及介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120543954B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202511038413.3,技術領域涉及:G06V10/764;該發明授權基于視覺強化學習的模型訓練方法、裝置、設備及介質是由許浩然;李論通;彭佩璽;夏燦銘;常亦謙;孫博;譚光;黎文博;許芬;田永鴻設計研發完成,并于2025-07-28向國家知識產權局提交的專利申請。
本基于視覺強化學習的模型訓練方法、裝置、設備及介質在說明書摘要公布了:本申請實施例提供了一種基于視覺強化學習的模型訓練方法、裝置、設備及介質。包括:獲取樣本圖像幀及語義類別信息,將語義類別信息輸入視覺大語言模型,得到第一卷積核參數,及將樣本圖像幀輸入第一特征卷積核得到第一特征熱力圖;通過預設視覺強化學習模型得到樣本圖像幀的第二卷積核參數和第二特征熱力圖;基于第一卷積核參數與第二卷積核參數構建第一蒸餾損失,及基于第一特征熱力圖與第二特征熱力圖構建第二蒸餾損失;通過樣本動作數據和樣本狀態數據預測和計算,構建自監督損失和目標策略損失;基于第一蒸餾損失、第二蒸餾損失、自監督損失和目標策略損失,對預設視覺強化學習模型進行參數調節,得到目標視覺強化學習模型。
本發明授權基于視覺強化學習的模型訓練方法、裝置、設備及介質在權利要求書中公布了:1.一種基于視覺強化學習的模型訓練方法,其特征在于,所述方法包括: 獲取樣本圖像幀以及對應的語義類別信息,并將所述語義類別信息輸入至視覺大語言模型的初始第一卷積核中進行文本特征提取,得到提取文本特征后的第一特征卷積核的第一卷積核參數,以及將所述樣本圖像幀輸入至所述第一特征卷積核中,得到第一特征熱力圖; 通過預設視覺強化學習模型的視覺編碼器包含的初始第二特征卷積核對所述樣本圖像幀進行處理,得到處理圖像后的第二特征卷積核的第二卷積核參數和第二特征熱力圖; 基于所述第一卷積核參數與所述第二卷積核參數之間的差異構建第一蒸餾損失,以及基于所述第一特征熱力圖與所述第二特征熱力圖之間的差異構建第二蒸餾損失; 通過預設自監督模型對所述第二特征熱力圖對應的樣本動作數據和樣本狀態數據進行下一時刻的狀態和獎勵預測,得到每個樣本圖像幀的預測結果,并根據多個樣本圖像幀對應的多個預測結果構建自監督損失; 通過所述預設視覺強化學習模型的策略解碼器,基于所述樣本動作數據和所述樣本狀態數據進行動作價值和動作采樣計算,得到每個樣本圖像幀的計算結果,并根據多個樣本圖像幀對應的多個計算結果構建目標策略損失; 基于所述第一蒸餾損失、所述第二蒸餾損失、所述自監督損失和所述目標策略損失,對所述預設視覺強化學習模型的參數進行調節,得到目標視覺強化學習模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人鵬城實驗室,其通訊地址為:518000 廣東省深圳市南山區興科一街2號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。