騰訊科技(深圳)有限公司郭卉獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉騰訊科技(深圳)有限公司申請的專利一種數據處理方法和裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119094814B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411203388.5,技術領域涉及:H04N21/234;該發明授權一種數據處理方法和裝置是由郭卉設計研發完成,并于2024-08-29向國家知識產權局提交的專利申請。
本一種數據處理方法和裝置在說明書摘要公布了:本申請實施例公開了一種數據處理方法和裝置,涉及計算機技術領域,該方法包括:獲取目標文本,通過目標文本得到P個連續幀文本;獲取P個噪聲圖像,從P個連續幀文本中獲取目標幀文本,從P個噪聲圖像中確定目標噪聲圖像;通過目標視頻生成模型對目標噪聲圖像進行處理,得到目標前向噪聲向量;通過目標視頻生成模型對業務文本、業務圖像和目標幀文本進行處理,得到融合編碼特征,根據目標前向噪聲向量和融合編碼特征對目標噪聲圖像進行去噪處理,得到目標幀文本所對應的目標預測圖像,將目標預測圖像作為待生成視頻中位于業務圖像的下一幀圖像。采用本申請,可以提升文生視頻整體基調一致性,保證文生視頻的質量。
本發明授權一種數據處理方法和裝置在權利要求書中公布了:1.一種數據處理方法,其特征在于,所述方法包括: 獲取目標文本,對所述目標文本進行拆分處理,得到具有視頻幀排序順序的P個連續幀文本;P為正整數; 獲取P個噪聲圖像,從所述P個連續幀文本中獲取按序遍歷到的目標幀文本,從所述P個噪聲圖像中確定與所述目標幀文本相關聯的目標噪聲圖像; 將所述目標噪聲圖像輸入至目標視頻生成模型,通過所述目標視頻生成模型對所述目標噪聲圖像進行特征提取,得到目標噪聲特征,對所述目標噪聲特征進行前向擴散處理,得到目標前向噪聲向量; 將業務文本、業務圖像和所述目標幀文本輸入至所述目標視頻生成模型,通過所述目標視頻生成模型對所述目標幀文本進行文本編碼,得到文本編碼特征,對所述業務文本和所述業務圖像進行多模態特征提取,得到圖文編碼特征;所述業務圖像屬于待生成視頻中已生成的幀圖像;所述業務文本為P個連續幀文本中用于表征所述業務圖像的連續幀文本,且所述業務文本為排序在所述目標幀文本之前的連續幀文本; 根據所述目標前向噪聲向量、所述文本編碼特征和所述圖文編碼特征對所述目標噪聲圖像進行去噪處理,得到所述目標幀文本所對應的目標預測圖像,將所述目標預測圖像作為所述待生成視頻中位于所述業務圖像的下一幀圖像。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人騰訊科技(深圳)有限公司,其通訊地址為:518057 廣東省深圳市南山區高新區科技中一路騰訊大廈35層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。