廈門視誠科技有限公司胡宏清獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廈門視誠科技有限公司申請的專利一種AI多模態融合交互方法、裝置、系統及設備獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120179079B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510647041.8,技術領域涉及:G06F3/01;該發明授權一種AI多模態融合交互方法、裝置、系統及設備是由胡宏清設計研發完成,并于2025-05-20向國家知識產權局提交的專利申請。
本一種AI多模態融合交互方法、裝置、系統及設備在說明書摘要公布了:本發明公開一種AI多模態融合交互方法、裝置、系統及設備,邊緣設備獲取用戶在當前場景模式下的多模態信息;將多模態信息進行預處理,輸出符合當前場景模式的結果數據;當邊緣設備開啟上傳權限且AI功能模塊無法滿足多模態信息處理要求時,將結果數據發送至云服務設備,使云服務設備按照多模態信息的優先級處理策略進行處理生成多模態融合數據,并返回邊緣設備進行存儲,使邊緣設備根據業務需求決定是否發布多模態融合數據,并同步至移動終端設備。本發明能夠根據不同的場景需求靈活切換至對應場景模式,并在邊緣設備集成各AI功能模塊,以觸發對應的AI功能模塊對多模態信息進行處理,發送至云服務設備融合處理,實現多模態信息的高效處理與融合。
本發明授權一種AI多模態融合交互方法、裝置、系統及設備在權利要求書中公布了:1.一種AI多模態融合交互方法,應用于邊緣設備,其特征在于,包括: 獲取用戶的第一語音信息; 識別所述第一語音信息的關鍵信息,基于所述關鍵信息切換至對應的場景模式,邊緣設備預存多種場景模式及其對應的關鍵信息,場景模式包括國內會議場景、跨國會議場景、內容創作場景、智能家居場景、智能駕駛場景、醫療問診場景或在線教育場景,場景的切換邏輯模塊比對提取的關鍵信息與預設特征,匹配時,觸發對應場景模式,其中,所述關鍵信息指用戶的語音指令提取的實時信息,所述預設特征指邊緣設備中預先定義和存儲的特征信息,所述關鍵信息和所述預設特征與各個場景模式相對應,用于標識和區分不同的場景模式; 基于當前的場景模式下,觸發至少一種AI功能模塊,以獲取用戶在當前所述場景模式下的多模態信息; 將所述多模態信息進行預處理,并按照預設規則輸出符合當前所述場景模式的結果數據; 當所述邊緣設備開啟上傳權限且所述AI功能模塊無法滿足所述多模態信息處理要求時,將所述結果數據發送至云服務設備,使所述云服務設備按照所述多模態信息的優先級處理策略進行處理生成多模態融合數據,返回給所述邊緣設備進行存儲,并根據業務需求決定是否發布所述多模態融合數據;所述使所述云服務設備按照所述多模態信息的優先級處理策略進行處理生成多模態融合數據包括:根據各模態信息的優先級處理策略匹配對應的模態算力分配規則,按照模態算力分配規則對各模態信息進行處理,輸出多模態融合數據;其中,模態算力分配規則基于當前所述場景模式下各模態信息的算力需求設置,以匹配每個所述模態信息處理的算力需求; 將所述多模態融合數據和其發布信息同步至移動終端設備; 其中,所述關鍵信息包括執行動作信息、場景信息或設備信息;所述AI功能模塊包括AI聽覺模塊、AI語音模塊、AI視覺模塊、AI創作模塊中的至少一種;所述多模態信息包括聲音信息、音頻信息和圖像信息;其中,所述多模態信息的優先級處理策略基于當前所述場景模式確定; 當邊緣設備能夠滿足當前場景模式下各AI功能模塊功能實現的算力需求時,此時的結果數據為邊緣設備根據用戶在當前場景下的多模態融合數據,邊緣設備會根據實際業務需求決定是否將該多模態融合數據發布到各多媒體平臺上,同時會將該多模態融合數據和其發布信息同步至移動終端設備,由移動終端設備側的客戶對該多模態融合數據進行確認。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廈門視誠科技有限公司,其通訊地址為:361000 福建省廈門市火炬高新區新科廣場3號樓坂上社37-3號601A室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。