蘇州大學(xué)劉戀獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉蘇州大學(xué)申請(qǐng)的專利一種基于多模型局部描述整合的行人描述生成方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN119251855B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-29發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202411776734.9,技術(shù)領(lǐng)域涉及:G06V30/41;該發(fā)明授權(quán)一種基于多模型局部描述整合的行人描述生成方法是由劉戀;邵前程;陸宇昕;吳彧;曹敏設(shè)計(jì)研發(fā)完成,并于2024-12-05向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種基于多模型局部描述整合的行人描述生成方法在說明書摘要公布了:本發(fā)明公開了一種基于多模型局部描述整合的行人描述生成方法,涉及圖像數(shù)據(jù)處理技術(shù)領(lǐng)域。包括獲取待標(biāo)注的行人圖像,將圖像與預(yù)設(shè)指令輸入至多個(gè)圖生文模型,生成行人各屬性的局部文本描述;利用圖文匹配模型提取圖像和文本特征,通過余弦相似度計(jì)算圖像與文本的匹配度,從多個(gè)描述中篩選出與圖像最匹配的屬性描述;采用大語言模型將篩選出的局部描述合并,生成行人整體的流暢文本描述;通過行人圖像和文本數(shù)據(jù)集對(duì)圖文匹配模型進(jìn)行訓(xùn)練,并利用對(duì)比損失和匹配損失函數(shù)進(jìn)行優(yōu)化,直至總體損失函數(shù)收斂。本發(fā)明通過跨模態(tài)大模型對(duì)行人的屬性短語的生成,使得對(duì)于行人屬性短語的描述更加豐富多樣,避免生成的描述趨同。
本發(fā)明授權(quán)一種基于多模型局部描述整合的行人描述生成方法在權(quán)利要求書中公布了:1.一種基于多模型局部描述整合的行人描述生成方法,其特征在于:包括, 獲取待標(biāo)注的行人圖像,將圖像與預(yù)設(shè)指令輸入至多個(gè)圖生文模型,生成行人各屬性的局部文本描述; 利用圖文匹配模型提取圖像特征和各局部文本描述的文本特征,通過余弦相似度計(jì)算所述圖像特征與所述文本特征的匹配度,從多個(gè)局部文本描述中篩選出與圖像最匹配的局部文本描述; 采用大語言模型將篩選出的局部文本描述合并,生成行人整體的流暢文本描述; 其中,行人整體的流暢文本描述包括: 其中,LLM為大語言模型,T為最終合并的文本描述,A1,A2,...,AK表示行人圖像中具有的屬性,MLLMi為第i個(gè)跨模態(tài)大模型,為針對(duì)第j個(gè)屬性設(shè)計(jì)的指令提示,I為圖像,K為行人圖像中具有的屬性的數(shù)量;為經(jīng)過篩選后的針對(duì)屬性A1的局部文本描述;為經(jīng)過篩選后的針對(duì)屬性A2的局部文本描述;為經(jīng)過篩選后的針對(duì)屬性AK的局部文本描述;為經(jīng)過篩選后的針對(duì)屬性Aj的局部文本描述;Aj表示行人圖像中具有的第j個(gè)屬性;π1表示經(jīng)過相似度計(jì)算后,相似度降序排序順序排名為π1,表示相似度最高;表示針對(duì)屬性Aj經(jīng)過相似度計(jì)算后,降序排序后所得的相似度最高的局部文本描述;表示針對(duì)屬性Aj在第i個(gè)跨模態(tài)模型中生成的屬性文本。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人蘇州大學(xué),其通訊地址為:215000 江蘇省蘇州市吳江區(qū)久泳西路1號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 森森網(wǎng)絡(luò)集團(tuán)有限公司尼哈特·沃獲國家專利權(quán)
- 約翰遜父子公司B·L·阿克曼獲國家專利權(quán)
- 東京毅力科創(chuàng)株式會(huì)社橫田聰裕獲國家專利權(quán)
- 北京京東尚科信息技術(shù)有限公司李俊濤獲國家專利權(quán)
- 先進(jìn)掃描儀公司亞倫·伯恩斯坦獲國家專利權(quán)
- 華為技術(shù)有限公司楊磊獲國家專利權(quán)
- 通用電氣公司I·馬爾基爾獲國家專利權(quán)
- 北京沃東天駿信息技術(shù)有限公司常昊獲國家專利權(quán)
- 卡爾蔡司光學(xué)國際有限公司C·格拉塞納普獲國家專利權(quán)
- 華為技術(shù)有限公司韓靜獲國家專利權(quán)