聯通在線信息科技有限公司冉夢佳獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉聯通在線信息科技有限公司申請的專利一種基于融合置信度的聲源定位方法和系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120352834B 。
龍圖騰網通過國家知識產權局官網在2025-09-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510835741.X,技術領域涉及:G01S5/18;該發明授權一種基于融合置信度的聲源定位方法和系統是由冉夢佳;王靜怡;李虎明;王姣姣;王希芝;楊紫璇設計研發完成,并于2025-06-20向國家知識產權局提交的專利申請。
本一種基于融合置信度的聲源定位方法和系統在說明書摘要公布了:本發明聲源定位技術領域,提供一種基于融合置信度的聲源定位方法和系統。該方法包括:當檢測到預設喚醒詞時,啟動聲源定位處理,根據所檢測的當前語音信號,計算水平方位角,確定聲源定位區域;計算相匹配的已有用戶聲紋,確認當前語音信號所對應的當前用戶;計算與當前語音信號相對應的用戶偏好融合系數,計算當前語音信號的融合置信度,以動態調整云臺攝像頭的掃描范圍,以在掃描過程中以固定間隔捕獲當前用戶的圖像幀,執行人臉檢測,得到待處理人臉圖像,進行面部特征提取,進行視覺身份協同確認,在滿足身份一致性條件時,停止云臺攝像頭的轉動,鎖定當前方位為聲源定位位置。本發明在降低硬件復雜度的同時有效提升了定位精度。
本發明授權一種基于融合置信度的聲源定位方法和系統在權利要求書中公布了:1.一種基于融合置信度的聲源定位方法,其特征在于,包括: 當檢測到預設喚醒詞時,啟動聲源定位處理,具體包括根據所檢測的當前語音信號,計算水平方位角,確定聲源定位區域; 對當前語音信號進行多維語音信號提取以生成指定維度聲紋特征向量,計算與所述當前語音信號相匹配的已有用戶聲紋,以確認所述當前語音信號所對應的當前用戶; 計算與所述當前語音信號相對應的方位修正系數,并根據計算與所述當前語音信號相匹配的已有用戶聲紋所得到的匹配度,進一步計算所述當前語音信號的融合置信度,包括: 采用以下表達式計算所述當前語音信號的融合置信度: Cfusion=k*Sloc+w*Svioice+α*Δθ 其中,Cfusion表征所述當前語音信號的融合置信度;Sloc為通過第一麥克風、第二麥克風收集所述當前語音信號時確定的信號信噪比、時差所生成的聲源定位評分;Svioice表示所計算的所述當前語音信號與已有用戶聲紋的匹配度;Δθ表示當前水平方位角與特定時間段內歷史水平方位角均值之間的絕對偏差值,Δθ=∣θ-μ∣,θ表示當前水平方位角,μ表示特定時間段內歷史水平方位角分布均值、即歷史水平方位角均值;k表示與通過雙麥克風收集所述當前語音信號時確定的信號信噪比、時差所生成的聲源定位評分相對應的第一參數;w表示與所計算的所述當前語音信號與已有用戶聲紋的匹配度相對應的第二參數;α表示方位修正系數,用于修正所述當前水平方位角與特定時間段內歷史水平方位角均值之間的絕對偏差值; 根據所計算的當前語音信號的融合置信度,動態調整云臺攝像頭的掃描范圍,以在掃描過程中以固定間隔捕獲當前用戶的圖像幀,執行人臉檢測,得到待處理人臉圖像; 對所述待處理人臉圖像進行面部特征提取,以進行視覺身份協同確認,在所述待處理人臉圖像的視覺身份協同確認結果為滿足身份一致性條件時,停止云臺攝像頭的轉動,鎖定當前方位以作為所確定的聲源位置。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人聯通在線信息科技有限公司,其通訊地址為:100032 北京市大興區經濟技術開發區中和街1號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。