天津大學劉若楠獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉天津大學申請的專利一種基于follower模型的視覺語言導航方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115824213B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211447071.7,技術領域涉及:G01C21/20;該發明授權一種基于follower模型的視覺語言導航方法是由劉若楠;李澤康設計研發完成,并于2022-11-18向國家知識產權局提交的專利申請。
本一種基于follower模型的視覺語言導航方法在說明書摘要公布了:本發明公開一種基于follower模型的視覺語言導航方法,follower模型由編碼器和解碼器組成,編碼器和解碼器均采用長短期記憶網絡結構,編碼器用于對視覺圖像特征進行預處理,編碼器用于預測下一時間步動作;還包括跨模態對比學習模塊和視覺變分自編碼器模塊,follower模型、跨模態對比學習模塊和視覺變分自編碼器模塊共同組成智能體導航模型,所述跨模態對比學習模塊用于學習語言和視覺兩種跨模態信息;所述視覺變分自編碼器模塊包括視覺編碼器和視覺解碼器,用于學習視覺圖像特征的分布;智能體導航模型的損失函數由Loss1、Loss2和Loss3組成,Loss1是視覺變分自編碼器模塊的損失函數,Loss2是follower模型的損失函數,Loss3是跨模態對比學習模塊的損失函數。
本發明授權一種基于follower模型的視覺語言導航方法在權利要求書中公布了:1.一種基于follower模型的視覺語言導航方法,follower模型由編碼器和解碼器組成,編碼器和解碼器均采用長短期記憶網絡結構,編碼器用于對視覺圖像特征進行預處理,解碼器用于預測下一時間步動作;其特征在于,還包括跨模態對比學習模塊和視覺變分自編碼器模塊,follower模型、跨模態對比學習模塊和視覺變分自編碼器模塊共同組成智能體導航模型,所述跨模態對比學習模塊用于學習語言和視覺兩種跨模態信息;所述視覺變分自編碼器模塊包括視覺編碼器和視覺解碼器,用于學習視覺圖像特征的分布; 智能體導航模型的損失函數由、和組成,是視覺變分自編碼器模塊的損失函數,包括視覺特征重建損失和衡量分布相似性的KL散度;是follower模型的損失函數,并增設有一個隨時間遞增的超參數,用以約束智能體導航模型,避免智能體導航模型的導航誤差隨時間累積過大,是跨模態對比學習模塊的損失函數,采用對比學習損失函數,所述跨模態對比學習模塊能夠拉近相似跨模態信息在隱空間中的距離,拉遠不相似跨模態信息在隱空間中的距離,使智能體導航模型能有效地編碼語言信息和視覺信息。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人天津大學,其通訊地址為:300350 天津市津南區海河教育園雅觀路135號天津大學北洋園校區;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。