濟南大學張菁獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉濟南大學申請的專利基于協(xié)同對齊與自適應融合的視覺語言導航方法及系統(tǒng)獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產(chǎn)權局授予,授權公告號為:CN120427010B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權局官網(wǎng)在2025-09-12發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202510918794.8,技術領域涉及:G01C21/20;該發(fā)明授權基于協(xié)同對齊與自適應融合的視覺語言導航方法及系統(tǒng)是由張菁;李霖霖;畢研青;李丹;陳彬設計研發(fā)完成,并于2025-07-04向國家知識產(chǎn)權局提交的專利申請。
本基于協(xié)同對齊與自適應融合的視覺語言導航方法及系統(tǒng)在說明書摘要公布了:本發(fā)明提出了基于協(xié)同對齊與自適應融合的視覺語言導航方法及系統(tǒng),屬于人工智能與計算機視覺領域。方法包括:獲取自然語言指令、全景視圖、導航歷史及動態(tài)拓撲地圖數(shù)據(jù),提取指令特征、視覺特征、導航歷史特征和地圖節(jié)點特征;將指令特征、視覺特征進行特征增強預對齊并輸入編碼器進行深度融合,生成全局多模態(tài)融合特征和輔助決策信號;將全局多模態(tài)融合特征和輔助決策信號輸入到粗細粒度結合的專家網(wǎng)絡中,輸出最終預測的導航動作;其中利用專家網(wǎng)絡得到預測值;構建多源不確定性向量生成融合權重,融合預測值,得到最終預測的導航動作。有效解決了傳統(tǒng)方法中模態(tài)鴻溝問題,提高復雜指令理解準確率、導航的穩(wěn)定性和成功率。
本發(fā)明授權基于協(xié)同對齊與自適應融合的視覺語言導航方法及系統(tǒng)在權利要求書中公布了:1.基于協(xié)同對齊與自適應融合的視覺語言導航方法,其特征在于,包括: 獲取自然語言指令、全景視圖、導航歷史及動態(tài)拓撲地圖數(shù)據(jù),提取指令特征、視覺特征、導航歷史特征和地圖節(jié)點特征; 將所述指令特征、視覺特征進行特征增強預對齊,得到增強后的指令特征和視覺特征; 將增強后的指令特征和視覺特征輸入統(tǒng)一Transformer編碼器進行深度融合,生成全局多模態(tài)融合特征和輔助決策信號; 將所述全局多模態(tài)融合特征和輔助決策信號輸入到粗細粒度結合的專家網(wǎng)絡中,輸出最終預測的導航動作;其中分別利用粗粒度專家單元和細粒度專家單元對全局多模態(tài)融合特征和輔助決策信號進行處理,得到第一綜合預測值和第二綜合預測值,其過程為: 粗粒度專家單元結合全局多模態(tài)融合特征和地圖節(jié)點目標概率分布,在全局拓撲圖上預測下一目標節(jié)點或停止,輸出第一綜合預測值; 細粒度專家單元結合全局多模態(tài)融合特征和區(qū)域匹配信息,在當前局部動作空間選擇動作或判斷停止,輸出第二綜合預測值; 構建多源不確定性向量動態(tài)生成粗細粒度專家網(wǎng)絡預測結果的權重,基于所述權重融合第一綜合預測值和第二綜合預測值,得到最終預測的導航動作。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或?qū)@麢嗳?a target="_blank" rel="noopener noreferrer nofollow" href="https://iptop.www.hzsmkbearing.com.cn/list?keyword=%E6%B5%8E%E5%8D%97%E5%A4%A7%E5%AD%A6&temp=1">濟南大學,其通訊地址為:250000 山東省濟南市市中區(qū)南辛莊西路336號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。