廣東海洋大學師文慶獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廣東海洋大學申請的專利一種基于潛在擴散模型的圖像重構方法、設備及介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120510039B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510961437.X,技術領域涉及:G06T3/4076;該發明授權一種基于潛在擴散模型的圖像重構方法、設備及介質是由師文慶;孫宇婷;蔡涵榮;陳靜玲設計研發完成,并于2025-07-14向國家知識產權局提交的專利申請。
本一種基于潛在擴散模型的圖像重構方法、設備及介質在說明書摘要公布了:本申請公開了一種基于潛在擴散模型的圖像重構方法、設備及介質,涉及圖像數據處理領域,該方法包括:采用編碼器網絡得到均值和標準差張量,基于這兩個張量和隨機噪聲生成潛在變量;采用余弦調度策略動態控制噪聲的添加強度,對潛在變量進行前向擴散;將受損圖像輸入條件編碼器,得到條件信息后,進行高維空間投影操作得到條件嵌入;使用交叉注意力機制基于條件嵌入對前向擴散后的潛在變量進行條件增強;將時間步編碼、條件增強的潛在變量以及條件嵌入輸入噪聲預測網絡,得到預測噪聲后,采用去噪擴散隱式模型進行逆擴散,得到重構圖像。本申請能夠減少計算開銷,提高圖像重構效率,并保留原始圖像的重要細節,進而提高圖像的重構質量。
本發明授權一種基于潛在擴散模型的圖像重構方法、設備及介質在權利要求書中公布了:1.一種基于潛在擴散模型的圖像重構方法,其特征在于,包括: 獲取數據源; 對所述數據源進行標準化處理,得到標準化圖像; 將所述標準化圖像輸入編碼器網絡,得到均值張量和標準差張量; 基于所述均值張量、所述標準差張量以及從標準正態分布中采樣的隨機噪聲生成潛在變量; 采用余弦調度策略動態控制噪聲的添加強度,對每一時間步的所述潛在變量進行前向擴散,直至收斂至標準正態分布后,得到更新后的潛在變量以及受損圖像; 將所述受損圖像輸入條件編碼器,得到條件信息; 對所述條件信息進行高維空間投影操作,生成條件嵌入; 使用交叉注意力機制對所述條件嵌入和更新后的潛在變量進行對齊和特征交互,得到條件增強的潛在變量,包括:將更新后的潛在變量經可學習投影矩陣映射為查詢向量;將所述條件嵌入通過獨立投影矩陣生成鍵和值;對查詢向量、鍵和值經縮放進行點積注意力計算,得到注意力輸出;所述注意力輸出通過可學習縮放因子加權后,與更新后的潛在變量進行殘差連接,得到條件增強的潛在變量; 對時間步進行編碼,得到時間步編碼; 將所述時間步編碼、條件增強的潛在變量以及條件嵌入輸入噪聲預測網絡,得到預測噪聲; 采用去噪擴散隱式模型,基于預測噪聲進行逆擴散,得到重構后的圖像; 其中,采用余弦調度策略動態控制噪聲的添加強度,對每一時間步的所述潛在變量進行前向擴散,直至收斂至標準正態分布后,得到更新后的潛在變量的過程包括: 采用余弦調度策略動態控制噪聲的添加強度,得到噪聲衰減系數; 基于噪聲衰減系數,采用離散擴散公式對每一時間步的潛在變量進行迭代更新,直至迭代更新的潛在變量收斂至標準正態分布后,得到更新后的潛在變量; 式中,為時間步的潛在變量,為時間步的潛在變量,為時間步的噪聲衰減系數,為時間步時添加的噪聲,,為標準正態分布,表示單位方差。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廣東海洋大學,其通訊地址為:524088 廣東省湛江市麻章區海大路1號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。