北京面壁智能科技有限責任公司孫昊鈞獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京面壁智能科技有限責任公司申請的專利一種多模態人臉語義通信方法、設備及介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120318893B 。
龍圖騰網通過國家知識產權局官網在2025-09-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510789542.X,技術領域涉及:G06V40/16;該發明授權一種多模態人臉語義通信方法、設備及介質是由孫昊鈞設計研發完成,并于2025-06-13向國家知識產權局提交的專利申請。
本一種多模態人臉語義通信方法、設備及介質在說明書摘要公布了:本發明公開了一種多模態人臉語義通信方法、設備及介質,屬于語義通信技術領域,用于解決目前的人臉語義通信方案在靈活性、協同性、通信效率以及信道適應性方面均存在不足,無法適應當前用戶對人臉傳輸服務的多樣化需求的技術問題。包括:對人臉視頻流中的人臉圖像進行語義轉化,得到對應的圖像語義表征信息;基于語言重塑指令中的語義特征及人臉圖像中的人臉特征確定語義偏移量;根據語義偏移量對圖像語義表征信息進行優化;對發送端與接收端之間的傳輸信道進行編碼策略優化,基于信道噪聲對接收端的解碼器進行參數微調;通過優化的傳輸信道將圖像語義表征優化信息發送到接收端,并通過參數微調后的解碼器對語義表征優化信息進行解碼及圖像重建。
本發明授權一種多模態人臉語義通信方法、設備及介質在權利要求書中公布了:1.一種多模態人臉語義通信方法,其特征在于,所述方法包括: 獲取發送端的人臉視頻流以及語言重塑指令; 通過生成式語義蒸餾編碼器對所述人臉視頻流中的人臉圖像進行語義轉化,得到對應的圖像語義表征信息; 基于所述語言重塑指令中的語義特征以及所述人臉圖像中的人臉特征,確定語義偏移量;根據所述語義偏移量,對所述圖像語義表征信息進行優化,得到圖像語義表征優化信息; 對發送端與接收端之間的傳輸信道進行編碼策略優化,并基于信道噪聲對接收端的解碼器進行參數微調,具體包括: 在所述發送端嵌入輕量級的信道狀態預測器,并通過所述信道狀態預測器實時估計所述傳輸信道的狀態參數;其中,所述狀態參數至少包括時變信噪比;具體包括:在所述信道狀態預測器中,根據,實時估計所述傳輸信道的時變信噪比;其中,為比特信噪比,為歷史誤碼率滑動均值,為多層感知機預測器; 根據所述狀態參數,在預設的編碼策略庫中動態選擇對應的信道編碼策略,以對所述傳輸信道進行編碼策略優化; 在所述接收端的解碼器中構建微分噪聲模擬層,并在解碼器訓練階段注入混合高斯噪聲:; 其中,為模擬的信道噪聲,為混合模擬噪聲分量的數量,為第個混合模擬噪聲分量的權重,為第個混合模擬噪聲分量的方差,為高斯分布函數,I為單位矩陣; 通過所述混合高斯噪聲,在所述解碼器訓練階段對解碼器進行訓練數據增強,并通過參數隔離微調方法,微調所述解碼器中的少量參數,以適應所述傳輸信道中的噪聲環境; 通過優化后的傳輸信道將所述圖像語義表征優化信息發送到所述接收端,并通過參數微調后的解碼器對所述語義表征優化信息進行解碼及圖像重建,實現人臉數據傳輸。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京面壁智能科技有限責任公司,其通訊地址為:100080 北京市海淀區中關村東路1號院6號樓6層601;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。