華中科技大學(xué);中國平安財(cái)產(chǎn)保險(xiǎn)股份有限公司魏巍獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉華中科技大學(xué);中國平安財(cái)產(chǎn)保險(xiǎn)股份有限公司申請的專利一種基于統(tǒng)一解碼器的場景圖生成方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN119359904B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-29發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202411333511.5,技術(shù)領(lǐng)域涉及:G06T17/00;該發(fā)明授權(quán)一種基于統(tǒng)一解碼器的場景圖生成方法是由魏巍;廖心瑤;陳當(dāng)陽;付園園設(shè)計(jì)研發(fā)完成,并于2024-09-24向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于統(tǒng)一解碼器的場景圖生成方法在說明書摘要公布了:本發(fā)明公開了一種基于統(tǒng)一解碼器的場景圖生成方法,該方法包括以下步驟:1圖像特征提取;2提取得到圖像特征之后,使用解碼器預(yù)測關(guān)系三元組;3根據(jù)關(guān)系三元組估計(jì)獲得的視覺三元組,得到最終生成的場景圖。本發(fā)明提出了一種新穎的單階段場景圖生成架構(gòu),由具有任務(wù)特定查詢的統(tǒng)一解碼器構(gòu)建,為關(guān)系三元組預(yù)測中的弱耦合問題提供了一個(gè)可用的解決方案,利用特定于任務(wù)的查詢來分別定位實(shí)體,并在三元組中融合語義特征以共享耦合特征,以更少的參數(shù)實(shí)現(xiàn)了更優(yōu)的性能。
本發(fā)明授權(quán)一種基于統(tǒng)一解碼器的場景圖生成方法在權(quán)利要求書中公布了:1.一種基于統(tǒng)一解碼器的場景圖生成方法,其特征在于,包括以下步驟: 1圖像特征提取; 對于給定的原始圖片將其映射到高層級圖像特征 其中,3表示3個(gè)顏色通道,Ho為圖像的像素高度,W0為圖像的像素寬度;C表示特征圖X的通道的數(shù)量,H,W對應(yīng)于特征圖X的空間維度; 然后,采用Transformer編碼器將空間尺寸展開,對特征X提取更緊湊的特征并在每一層添加位置編碼 其中,d為特征Y的維數(shù); 2提取得到圖像特征之后,使用解碼器預(yù)測關(guān)系三元組; 所述解碼器包括采用三個(gè)固定大小的特定任務(wù)查詢,即主語查詢Qs∈RN×d、賓語查詢Qo∈RN×d和謂詞查詢Qp∈RN×d作為輸入,并利用參數(shù)共享解碼器一次生成特定任務(wù)的表示; 具體如下: 2.1生成三組特定于任務(wù)的查詢:主語查詢、賓語查詢和謂詞查詢;三組學(xué)習(xí)的查詢嵌入Qs、Qo、Qp,每組查詢都有N個(gè)d維表示,qs,i,qo,i,qp,i表示第i個(gè)三元組查詢; 其中, 2.2對解碼器層l采用多層感知器MLP連接前一層解碼器層輸出的查詢; 2.3運(yùn)行自注意機(jī)制來模擬三元組內(nèi)主語賓語謂詞的相互作用; 在特定的解碼器層l,的大小為bs,N,d,將特定于任務(wù)的三組查詢重塑為1,bs×N,d的維度,隨后將它們連接成具有維度3,bs×N,d的三元組查詢將每個(gè)三元組組織為序列; 其中bs是批量大小的數(shù)量; 在每個(gè)三元組中運(yùn)行自注意力機(jī)制,并顯式地模擬不同子任務(wù)之間空間和語義信息的交互; 由于transformer架構(gòu)具有位置不變性,與查詢共享相同形狀的位置編碼經(jīng)歷與查詢類似的變形過程以形成然后添加到每個(gè)注意力層的輸入中; 其中,分別表示解碼器層l中,的位置編碼; 2.4通過自注意力操作分別捕獲主語、賓語和謂詞的上下文,并通過交叉注意力操作并行地從圖像表示中提取視覺特征,以建模特定于每個(gè)子任務(wù)的解耦特征; 其中,主語自注意力操作和交叉注意力操作表示如下: 解碼器最后一層的輸出為獲得特定任務(wù)的表示:Zs,Zo,Zp; 2.5將參數(shù)共享解碼器一次生成特定任務(wù)的表示Zx,x∈{s,o,p}輸入前饋網(wǎng)絡(luò)FNN,生成一組關(guān)系三元組估計(jì) 其中,表示根據(jù)特定任務(wù)查詢和輸入的圖像特征Y獲得的關(guān)系三元組估計(jì); 3根據(jù)關(guān)系三元組估計(jì)獲得的視覺三元組,得到最終生成的場景圖。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人華中科技大學(xué);中國平安財(cái)產(chǎn)保險(xiǎn)股份有限公司,其通訊地址為:430074 湖北省武漢市武昌珞喻路1037號華中科技大學(xué);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 青島海爾滾筒洗衣機(jī)有限公司徐安沅獲國家專利權(quán)
- 弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會阿德里安·姆塔薩獲國家專利權(quán)
- 福特全球技術(shù)公司阿里·納杰馬巴迪獲國家專利權(quán)
- 株式會社日本顯示器青木義典獲國家專利權(quán)
- 英特爾公司E.奧爾德-艾哈邁德-瓦爾獲國家專利權(quán)
- 中山大學(xué)附屬第五醫(yī)院單鴻獲國家專利權(quán)
- 特邁馳有限責(zé)任公司丹尼爾·詹姆斯·迪金森獲國家專利權(quán)
- 深圳邁瑞生物醫(yī)療電子股份有限公司丁鐘奎獲國家專利權(quán)
- 蘇州瑞博生物技術(shù)股份有限公司張鴻雁獲國家專利權(quán)
- 斯凱孚公司李海洋獲國家專利權(quán)


熱門推薦
- 奧動新能源汽車科技有限公司張建平獲國家專利權(quán)
- 科迪亞克生物科學(xué)公司努魯?shù)隙鳌·萊維斯獲國家專利權(quán)
- 唐納森公司D·W·米勒獲國家專利權(quán)
- 網(wǎng)易(杭州)網(wǎng)絡(luò)有限公司梁旭獲國家專利權(quán)
- 新思考電機(jī)有限公司王在偉獲國家專利權(quán)
- 奕森科技(上海)有限公司許杰獲國家專利權(quán)
- 中興通訊股份有限公司呂何平獲國家專利權(quán)
- 蘇州樂琻半導(dǎo)體有限公司姜鎬在獲國家專利權(quán)
- 聯(lián)想(北京)有限公司邵志強(qiáng)獲國家專利權(quán)
- 深圳邁瑞生物醫(yī)療電子股份有限公司謝崇軍獲國家專利權(quán)