杭州電子科技大學吳子朝獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州電子科技大學申請的專利一種文本驅動的多概念個性化圖像編輯方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN118196238B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202410370133.1,技術領域涉及:G06T11/60;該發明授權一種文本驅動的多概念個性化圖像編輯方法是由吳子朝;徐亮東;楊萍;章國道;顧曉玲設計研發完成,并于2024-03-29向國家知識產權局提交的專利申請。
本一種文本驅動的多概念個性化圖像編輯方法在說明書摘要公布了:本發明公開了一種文本驅動的多概念個性化圖像編輯方法,該方法首先訓練包含個性化目標的概念模型,得到對應的文本嵌入向量。其次使用文本嵌入向量,修改源輸入文本,得到修改后的文本。然后使用穩定擴散模型加載訓練的包含個性化目標的概念模型參數得到擴散模型,將源輸入文本和修改后的文本分別輸入到文本編碼器中得到文本嵌入,將文本嵌入輸入擴散模型中引導去噪過程,并在去噪過程中進行替換注意力圖和噪聲的操作。最后重復迭代N次,得到目標圖像,在進行解碼得到真實目標圖像,完成圖像編輯。本發明實現用戶通過文本輸入實現多目標個性化編輯的需求,擴展AIGC領域圖像編輯的應用范圍。
本發明授權一種文本驅動的多概念個性化圖像編輯方法在權利要求書中公布了:1.一種文本驅動的多概念個性化圖像編輯方法,其特征在于,包括以下步驟: 步驟1、訓練包含個性化目標的概念模型,得到對應的文本嵌入向量new1,new2引導圖像編輯,具體包括以下步驟: 步驟1.1、收集多張包含同一目標的圖像作為訓練集,將多個目標的訓練集路徑統一寫到的.JSON文件中; 步驟1.2、選擇文本嵌入[new1],[new2]指代步驟1.1中的不同目標; 步驟1.3、將.JSON文件和[new1],[new2]文本嵌入作為輸入條件,輸入到多概念生成模型中進行訓練,得到包含個性化目標的概念模型以及文本嵌入向量new1,new2; 步驟2、使用文本嵌入向量new1和new2,修改源輸入文本P源,得到修改后的文本P目標,具體包括以下步驟: 步驟2.1、確定源輸入文本P源,源輸入文本P源包含個性化目標的基類; 步驟2.2、對于源輸入文本P源,使用文本嵌入向量new1,new2分別指代源輸入文本P源中的對應目標,在保持源輸入文本P源其他嵌入不變的情況下,得到包含基類嵌入的修改后的文本P目標; 步驟3、使用穩定擴散模型加載訓練的包含個性化目標的概念模型參數得到擴散模型,將源輸入文本P源和修改后的文本P目標分別輸入到文本編碼器中得到文本嵌入,將文本嵌入輸入擴散模型中引導去噪過程,并在去噪過程中進行替換注意力圖和噪聲的操作; 所述進行替換注意力圖和噪聲的操作具體包括以下步驟: 步驟3.1、將源輸入文本P源和修改后的文本P目標同時輸入到擴散模型中的U-net網絡模型中,分別進行推理; 步驟3.2、在U-net的逐步去噪過程中,同一時刻同時產生兩個結果;將源輸入文本P源去噪過程中的交叉注意力圖和自注意力圖結果復制到修改后的文本P目標的對應位置,得到兩個去除部分噪聲的噪聲圖像; 步驟3.3、保持源輸入文本P源中個性化目標的基類的交叉注意力圖目標區域不變,將其余部分區域的噪聲替換到修改后的文本P目標的噪聲圖像的對應區域; 步驟4、重復步驟3的操作,迭代N次,得到目標圖像; 步驟5、對目標圖像進行解碼得到真實目標圖像,完成圖像編輯。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州電子科技大學,其通訊地址為:310018 浙江省杭州市錢塘區白楊街道2號大街1158號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。