湖南馬欄山視頻先進技術研究院有限公司鄧正秋獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉湖南馬欄山視頻先進技術研究院有限公司申請的專利基于小波變換和頻率分解的一致性視頻生成方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120264095B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510388116.5,技術領域涉及:H04N21/81;該發明授權基于小波變換和頻率分解的一致性視頻生成方法及裝置是由鄧正秋;黎維設計研發完成,并于2025-03-31向國家知識產權局提交的專利申請。
本基于小波變換和頻率分解的一致性視頻生成方法及裝置在說明書摘要公布了:本發明提供了基于小波變換和頻率分解的一致性視頻生成方法及裝置,涉及圖像處理技術領域,本發明通過小波多級頻帶解耦?融合框架和動態跨模態注意力機制,結合分布感知適配器的動態對齊機制與層次化擴散的HJB優化策略,在保證參數效率的同時實現跨時空維度的身份表征融合,解決了傳統視頻生成方法中高頻細節漂移、動態場景身份失真及長序列生成穩定性差的問題,顯著提升了生成視頻的質量和穩定性,為視頻處理和相關應用提供了更為先進的技術支持。
本發明授權基于小波變換和頻率分解的一致性視頻生成方法及裝置在權利要求書中公布了:1.基于小波變換和頻率分解的一致性視頻生成方法,其特征在于,包括以下步驟: S1、基于多尺度Haar小波分解的頻帶解耦,提取參考圖像的低頻輪廓特征與高頻紋理特征,并通過CLIP文本編碼器獲取文本提示的文本嵌入,并對所述低頻輪廓特征、高頻紋理特征、文本嵌入進行跨模態注意力得到多尺度小波特征Fwavelet; S2、通過頻帶自適應卷積模塊與逆向小波重構融合多尺度小波特征Fwavelet的多級特征并保留跨尺度細節輸出融合圖像特征Ffused; S3、將ArcFace網絡獲取的參考圖像的面部嵌入Earc與CLIP-ViT編碼器獲取的參考圖像的全局上下文特征Eclip通過Q-Former融合生成精細化面部嵌入Efinal; S4、將擴散潛變量Zt、融合圖像特征Ffused及身份嵌入Efinal輸入至雙路交叉注意力模塊進行潛變量空間的身份分布對齊與時序平滑約束得到對齊潛變量Zaligned; 步驟S4具體包括以下步驟: S41、將擴散潛變量Zt注入雙路交叉注意力模塊,分別與融合圖像特征Ffused交互得到圖像特征擴散變量Zimg,與身份嵌入Efinal交互得到身份嵌入擴散變量Zface;所述雙路交叉注意力模塊包括圖像路徑交叉注意力與身份路徑交叉注意力; S42、將圖像特征擴散變量Zimg和身份嵌入擴散變量Zface輸入至動態分布對齊模塊,先通過統計量計算公式計算圖像特征均值μimg及身份嵌入均值μface與圖像特征標準差σimg及身份嵌入標準差σface,通過分布投影公式得到投影分布融合殘差并加入門控權重γ,輸出對齊潛變量Zaligned; S43、為對齊潛變量Zaligned添加時域平滑約束:其中,時域平滑約束公式如下: 其中,Lalign為時域平滑約束的損失函數,用于衡量對齊潛變量與其在不同時間步的平均池化結果之間的差異;為對齊潛變量Zaligned在第t個時間步的表示;AvgPool為平均池化操作函數;T為擴散模型的總去噪步數; S5、將對齊潛變量Zaligned與文本嵌入Etext注入時空DiT架構生成初步時序潛變量Ztime,并將擴散潛變量Zt通過Hamilton-Jacobi優化生成優化潛變量Zt-1,再將初步時序潛變量Ztime與優化潛變量Zt-1通過多幀自回歸生成器生成高質量視頻Voutput。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人湖南馬欄山視頻先進技術研究院有限公司,其通訊地址為:410000 湖南省長沙市開福區月湖街道濱河北路280興旺科技園A棟5樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。