太保科技有限公司金越獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉太保科技有限公司申請的專利一種基于音視頻的預質(zhì)檢方法及裝置獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN115546891B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-19發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202211164581.3,技術(shù)領(lǐng)域涉及:G06V40/20;該發(fā)明授權(quán)一種基于音視頻的預質(zhì)檢方法及裝置是由金越;徐國強設計研發(fā)完成,并于2022-09-23向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于音視頻的預質(zhì)檢方法及裝置在說明書摘要公布了:本申請公開了一種基于音視頻的預質(zhì)檢方法及裝置,在該方法中,在識別到視頻中人臉圖像的第一人臉標識包括業(yè)務辦理人和業(yè)務受理人后,識別音頻是否包括預設關(guān)鍵詞;在識別到音頻包括預設關(guān)鍵詞后,確定預設關(guān)鍵詞對應的時間段;從視頻獲取時間段對應的視頻片段;若視頻片段中處于說話狀態(tài)的人臉圖像的第二人臉標識包括業(yè)務辦理人且業(yè)務辦理人的唇語識別結(jié)果包括預設關(guān)鍵詞,確定預質(zhì)檢通過;若唇語識別結(jié)果不包括預設關(guān)鍵詞或第二人臉標識不包括業(yè)務辦理人,確定預質(zhì)檢不通過。可見,該方法能夠識別出業(yè)務受理人代替業(yè)務辦理人回答預設關(guān)鍵詞的情況,從而提高預質(zhì)檢結(jié)果的準確性。
本發(fā)明授權(quán)一種基于音視頻的預質(zhì)檢方法及裝置在權(quán)利要求書中公布了:1.一種基于音視頻的預質(zhì)檢方法,其特征在于,音視頻包括音頻和視頻,所述方法包括: 在識別到所述視頻中人臉圖像的第一人臉標識包括業(yè)務辦理人和業(yè)務受理人后,識別所述音頻是否包括預設關(guān)鍵詞; 在識別到所述音頻包括所述預設關(guān)鍵詞后,確定所述預設關(guān)鍵詞對應的時間段; 從所述視頻獲取所述時間段對應的視頻片段; 若所述視頻片段中處于說話狀態(tài)的人臉圖像的第二人臉標識包括所述業(yè)務辦理人且所述業(yè)務辦理人的唇語識別結(jié)果包括所述預設關(guān)鍵詞,確定預質(zhì)檢通過; 若所述唇語識別結(jié)果不包括所述預設關(guān)鍵詞或所述第二人臉標識不包括所述業(yè)務辦理人,確定預質(zhì)檢不通過; 所述視頻片段中處于說話狀態(tài)的人臉圖像的第二人臉標識的確定步驟,包括: 根據(jù)所述視頻片段的多個視頻幀中人臉圖像的嘴部關(guān)鍵點,獲得所述多個視頻幀中人臉圖像的嘴部變化縱橫比MAR; 將所述多個視頻幀中人臉圖像的第一嘴部區(qū)域圖輸入說話動作識別模型,獲得所述說話動作識別模型輸出的說話動作識別結(jié)果; 將所述多個視頻幀中人臉圖像的嘴部變化縱橫比MAR符合預設變化狀態(tài),且和所述說話動作識別結(jié)果為存在說話動作的人臉圖像,確定為處于說話狀態(tài)的人臉圖像; 根據(jù)所述處于說話狀態(tài)的人臉圖像,確定所述第二人臉標識。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人太保科技有限公司,其通訊地址為:200010 上海市黃浦區(qū)中山南路1號11層(名義樓層)11V6室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。