浙江大學(xué)王東霞獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉浙江大學(xué)申請(qǐng)的專利一種基于孿生擴(kuò)散模型的多視角人物圖像重建方法及裝置獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120125473B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-16發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510594067.0,技術(shù)領(lǐng)域涉及:G06T5/77;該發(fā)明授權(quán)一種基于孿生擴(kuò)散模型的多視角人物圖像重建方法及裝置是由王東霞;徐智鴻;郭青設(shè)計(jì)研發(fā)完成,并于2025-05-09向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種基于孿生擴(kuò)散模型的多視角人物圖像重建方法及裝置在說明書摘要公布了:本發(fā)明公開了一種基于孿生擴(kuò)散模型的多視角人物圖像重建方法及裝置,該方法獲取二維RGB參考人物圖像和二維RGB目標(biāo)人物圖像構(gòu)成訓(xùn)練數(shù)據(jù)對(duì),基于二維RGB目標(biāo)人物圖像得到對(duì)應(yīng)的姿態(tài)圖像,提取總體人體語義分割掩碼圖和局部區(qū)域分割圖,對(duì)訓(xùn)練數(shù)據(jù)對(duì)編碼為潛在特征并添加隨機(jī)噪聲,基于孿生擴(kuò)散模型進(jìn)行特征融合和去噪過程,進(jìn)行圖像復(fù)原,最后基于解碼器得到最終目標(biāo)人物圖像。本發(fā)明采用孿生擴(kuò)散模型框架來克服先前傳統(tǒng)方法保留細(xì)粒度信息能力弱的固有缺點(diǎn),有效提高了具有復(fù)雜圖案衣服的人物外觀一致性,克服了傳統(tǒng)先前方法在參考人物姿態(tài)與目標(biāo)姿態(tài)變化過大時(shí)無法合理生成的問題,顯著提升了生成圖片的質(zhì)量。
本發(fā)明授權(quán)一種基于孿生擴(kuò)散模型的多視角人物圖像重建方法及裝置在權(quán)利要求書中公布了:1.一種基于孿生擴(kuò)散模型的多視角人物圖像重建方法,其特征在于,該方法包括模型訓(xùn)練和模型推理兩部分: (1)模型訓(xùn)練 步驟1.1:獲取二維RGB參考人物圖像和二維RGB目標(biāo)人物圖像,并推理得到二維RGB目標(biāo)姿態(tài)圖像; 步驟1.2:基于二維RGB參考人物圖像、二維RGB目標(biāo)姿勢(shì)圖像獲得總體人體語義分割掩碼圖和局部區(qū)域分割圖; 步驟1.3:將二維RGB參考人物圖像和二維RGB目標(biāo)人物圖像輸入編碼器得到潛在參考人物圖像特征和目標(biāo)人物圖像特征,并對(duì)目標(biāo)人物圖像特征添加噪聲得到潛在變量;將二維RGB目標(biāo)姿態(tài)圖像輸入姿態(tài)多層卷積網(wǎng)絡(luò)得到姿態(tài)特征; 步驟1.4:基于孿生擴(kuò)散模型融合步驟1.2的結(jié)果和步驟1.3得到的潛在參考人物圖像特征、潛在變量和姿態(tài)特征,并通過逆向擴(kuò)散過程去除噪聲,復(fù)原生成目標(biāo)人物圖像特征;孿生擴(kuò)散模型采用兩個(gè)UNet網(wǎng)絡(luò),分別為特征提取網(wǎng)絡(luò)和生成網(wǎng)絡(luò),基于人物解析掩碼引導(dǎo)的注意力融合機(jī)制和CLIP引導(dǎo)的局部對(duì)齊機(jī)制兩階段實(shí)現(xiàn)細(xì)粒度的特征融合;第一階段人物解析掩碼引導(dǎo)的注意力融合機(jī)制利用插值方法將總體人體語義分割圖重塑為生成網(wǎng)絡(luò)中每一層的特征變量形狀,第二階段利用CLIP提取重合局部區(qū)域的特征并與潛在變量融合實(shí)現(xiàn)局部區(qū)域的特征對(duì)齊增強(qiáng); (2)模型推理 步驟2.1:獲取需要重建的二維RGB參考人物圖像和二維RGB目標(biāo)姿態(tài)圖像,以及獲取總體人體語義分割掩碼圖和局部區(qū)域分割圖,基于訓(xùn)練后的編碼器和姿態(tài)多層卷積網(wǎng)絡(luò)獲得潛在參考人物圖像特征和姿態(tài)特征;并通過隨機(jī)初始化得到隨機(jī)噪聲; 步驟2.2:基于訓(xùn)練后的孿生擴(kuò)散模型進(jìn)行特征融合,并通過逆向擴(kuò)散過程去除噪聲,復(fù)原生成完整潛在圖像特征,輸入到解碼器中得到最終目標(biāo)人物圖像。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人浙江大學(xué),其通訊地址為:310058 浙江省杭州市西湖區(qū)余杭塘路866號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 廣東美的制冷設(shè)備有限公司郭紹勝獲國家專利權(quán)
- 雅馬哈株式會(huì)社柘植秀幸獲國家專利權(quán)
- 法雷奧熱系統(tǒng)公司J.貝努阿利獲國家專利權(quán)
- 勝高股份有限公司山下健兒獲國家專利權(quán)
- 特萊索恩基金會(huì)A.奧里克奇奧獲國家專利權(quán)
- 索達(dá)-索拉電子有限公司伊利亞·紐姆曼獲國家專利權(quán)
- 山東師范大學(xué)盛卸晃獲國家專利權(quán)
- 廣東美的制冷設(shè)備有限公司閆長林獲國家專利權(quán)
- 廣東美的制冷設(shè)備有限公司翟富興獲國家專利權(quán)
- 廣東多尼斯網(wǎng)絡(luò)科技有限公司陳四龍獲國家專利權(quán)


熱門推薦
- 松下知識(shí)產(chǎn)權(quán)經(jīng)營株式會(huì)社松下瞬平獲國家專利權(quán)
- 廣東美的制冷設(shè)備有限公司閆長林獲國家專利權(quán)
- 旭化成株式會(huì)社張珣獲國家專利權(quán)
- 施瑞源獲國家專利權(quán)
- 蘇州澤璟生物制藥股份有限公司呂彬華獲國家專利權(quán)
- 廣東美的制冷設(shè)備有限公司陳志航獲國家專利權(quán)
- 中興通訊股份有限公司石靖獲國家專利權(quán)
- 歌爾科技有限公司蔡曉東獲國家專利權(quán)
- 三星顯示有限公司樸注燦獲國家專利權(quán)
- 武漢統(tǒng)信軟件技術(shù)有限公司江玉龍獲國家專利權(quán)