徐工消防安全裝備有限公司;燕山大學(xué)王國寶獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉徐工消防安全裝備有限公司;燕山大學(xué)申請的專利一種多模態(tài)目標(biāo)檢測方法、裝置、終端及儲(chǔ)存介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120318503B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-02發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號(hào)為:202510807532.4,技術(shù)領(lǐng)域涉及:G06V10/25;該發(fā)明授權(quán)一種多模態(tài)目標(biāo)檢測方法、裝置、終端及儲(chǔ)存介質(zhì)是由王國寶;肖宏;高志剛設(shè)計(jì)研發(fā)完成,并于2025-06-17向國家知識(shí)產(chǎn)權(quán)局提交的專利申請。
本一種多模態(tài)目標(biāo)檢測方法、裝置、終端及儲(chǔ)存介質(zhì)在說明書摘要公布了:本發(fā)明公開了目標(biāo)檢測技術(shù)領(lǐng)域的一種多模態(tài)目標(biāo)檢測方法、裝置、終端及儲(chǔ)存介質(zhì),旨在解決現(xiàn)有技術(shù)通常存在依賴標(biāo)注數(shù)據(jù)、視覺骨干多樣性不足的問題,且訓(xùn)練成本較高的問題。其包括以下步驟:獲取目標(biāo)圖像;將目標(biāo)圖像輸入至預(yù)訓(xùn)練好的多模態(tài)目標(biāo)檢測模型,輸出定位及分類預(yù)測結(jié)果,完成檢測;本發(fā)明首次在目標(biāo)檢測任務(wù)中引入U(xiǎn)Net網(wǎng)絡(luò)作為視覺骨干網(wǎng)絡(luò),突破了傳統(tǒng)有監(jiān)督和無監(jiān)督方法的局限性,為目標(biāo)檢測任務(wù)提供了全新的特征表示方式;本發(fā)明利用多模態(tài)目標(biāo)檢測模型的自監(jiān)督學(xué)習(xí)能力,減少了對大量標(biāo)注數(shù)據(jù)的依賴,降低了訓(xùn)練成本,同時(shí)提升了模型在數(shù)據(jù)稀缺場景下的適用性。
本發(fā)明授權(quán)一種多模態(tài)目標(biāo)檢測方法、裝置、終端及儲(chǔ)存介質(zhì)在權(quán)利要求書中公布了:1.一種多模態(tài)目標(biāo)檢測方法,其特征在于,包括以下步驟: 獲取目標(biāo)圖像; 將目標(biāo)圖像輸入至預(yù)訓(xùn)練好的多模態(tài)目標(biāo)檢測模型,輸出定位及分類預(yù)測結(jié)果,完成檢測;所述多模態(tài)目標(biāo)檢測模型包括CLIP編碼器、VAE編碼器、UNet網(wǎng)絡(luò)和檢測頭; 其中,所述多模態(tài)目標(biāo)檢測模型對目標(biāo)圖像的檢測過程具體包括: 將目標(biāo)圖像輸入到CLIP編碼器中,生成文本提示嵌入; 將目標(biāo)圖像輸入到VAE編碼器中,生成潛在特征圖; 將潛在特征圖和文本提示嵌入輸入至UNet網(wǎng)絡(luò),獲取多尺度擴(kuò)散特征圖; 計(jì)算文本提示嵌入與潛在特征圖在UNet網(wǎng)絡(luò)中的交叉注意力計(jì)算結(jié)果圖; 根據(jù)交叉注意力計(jì)算結(jié)果圖與多尺度擴(kuò)散特征圖進(jìn)行通道維度拼接形成增強(qiáng)后的特征圖; 將增強(qiáng)后的特征圖輸入到檢測頭中,輸出定位和分類預(yù)測結(jié)果; 所述將目標(biāo)圖像輸入到CLIP編碼器中,生成文本提示嵌入,具體包括: 將目標(biāo)圖像輸入到CLIP編碼器中,獲取對應(yīng)的圖像特征; 將對應(yīng)的圖像特征通過兩層線性層,得到映射后的文本提示嵌入; 所述根據(jù)交叉注意力計(jì)算結(jié)果圖與多尺度擴(kuò)散特征圖進(jìn)行通道維度拼接形成增強(qiáng)后的特征圖,具體包括: 將交叉注意力計(jì)算結(jié)果圖的二、三層與多尺度擴(kuò)散特征圖的三、四層沿通道維度拼接,形成增強(qiáng)后的特征圖; 所述將增強(qiáng)后的特征圖輸入到檢測頭中,輸出定位和分類預(yù)測結(jié)果,具體包括: 將增強(qiáng)后的特征圖輸入到檢測頭的FPN模塊中,進(jìn)行多尺度特征融合,獲取融合后的特征圖; 將融合后的特征圖輸入到檢測頭的分類模塊和定位模塊中,輸出定位和分類預(yù)測結(jié)果。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人徐工消防安全裝備有限公司;燕山大學(xué),其通訊地址為:221100 江蘇省徐州市高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)珠江東路17號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 德克斯康公司R·E·斯庫恩馬克獲國家專利權(quán)
- 松下電器研究開發(fā)(蘇州)有限公司牛向偉獲國家專利權(quán)
- 兄弟工業(yè)株式會(huì)社柴田武志獲國家專利權(quán)
- 三星電子株式會(huì)社崔性洙獲國家專利權(quán)
- OPPO廣東移動(dòng)通信有限公司陳文洪獲國家專利權(quán)
- 谷歌有限責(zé)任公司雷吉納爾德·克利福德·揚(yáng)獲國家專利權(quán)
- 杭州諾茂醫(yī)療科技有限公司王永勝獲國家專利權(quán)
- 高通股份有限公司吳潔獲國家專利權(quán)
- ZF主動(dòng)安全有限公司A·呂德爾獲國家專利權(quán)
- 三星顯示有限公司李康熙獲國家專利權(quán)


熱門推薦
- 華為技術(shù)有限公司李勝鈺獲國家專利權(quán)
- 微軟技術(shù)許可有限責(zé)任公司M·A·馬林獲國家專利權(quán)
- 廣東美的制冷設(shè)備有限公司陳源獲國家專利權(quán)
- 埃澤瑞斯公司E·巴爾瑪約爾獲國家專利權(quán)
- 華榮科技股份有限公司李江獲國家專利權(quán)
- 杭州諾茂醫(yī)療科技有限公司王永勝獲國家專利權(quán)
- 威斯康星州醫(yī)藥大學(xué)股份有限公司X·A·李獲國家專利權(quán)
- 德雷塞爾大學(xué)蒂莫西·M·布勒克獲國家專利權(quán)
- 萊克電氣綠能科技(蘇州)有限公司倪祖根獲國家專利權(quán)
- 佛山市順德區(qū)美的電熱電器制造有限公司馬志海獲國家專利權(quán)