南京大學(xué)楊登峰獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉南京大學(xué)申請的專利一種基于人工智能大模型的快速標(biāo)注方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN119848549B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-16發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510047610.5,技術(shù)領(lǐng)域涉及:G06F18/214;該發(fā)明授權(quán)一種基于人工智能大模型的快速標(biāo)注方法是由楊登峰;楊采靈;王靜怡設(shè)計研發(fā)完成,并于2025-01-13向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于人工智能大模型的快速標(biāo)注方法在說明書摘要公布了:本發(fā)明涉及人工智能技術(shù)領(lǐng)域,公開一種基于人工智能大模型的快速標(biāo)注方法,包括:步驟1、通過目標(biāo)領(lǐng)域的文檔集合提取特定領(lǐng)域的實體集合和關(guān)系集合,其中,使用實體識別技術(shù)識別文檔中領(lǐng)域相關(guān)的名詞、術(shù)語和關(guān)鍵詞,形成實體集合,且利用關(guān)系抽取技術(shù)分析實體間的邏輯和語義關(guān)聯(lián)性,生成關(guān)系集合,將實體集合與關(guān)系集合結(jié)合構(gòu)建知識三元組,知識三元組包含實體與實體間的關(guān)聯(lián)關(guān)系。通過引入領(lǐng)域知識圖譜,將目標(biāo)領(lǐng)域文檔中提取的實體和關(guān)系信息結(jié)構(gòu)化為知識三元組,且與待標(biāo)注數(shù)據(jù)匹配優(yōu)化標(biāo)注的語義信息,實現(xiàn)標(biāo)注結(jié)果的領(lǐng)域適配性和語義一致性,得到標(biāo)注數(shù)據(jù)在專業(yè)領(lǐng)域中更高的準(zhǔn)確性和一致性效果。
本發(fā)明授權(quán)一種基于人工智能大模型的快速標(biāo)注方法在權(quán)利要求書中公布了:1.一種基于人工智能大模型的快速標(biāo)注方法,其特征在于,包括: 步驟1、通過目標(biāo)領(lǐng)域的文檔集合提取特定領(lǐng)域的實體集合和關(guān)系集合,其中,使用實體識別技術(shù)識別文檔中領(lǐng)域相關(guān)的名詞、術(shù)語和關(guān)鍵詞,形成實體集合,且利用關(guān)系抽取技術(shù)分析實體間的邏輯和語義關(guān)聯(lián)性,生成關(guān)系集合,將實體集合與關(guān)系集合結(jié)合構(gòu)建知識三元組,知識三元組包含實體與實體間的關(guān)聯(lián)關(guān)系,將構(gòu)建的知識三元組存儲在圖數(shù)據(jù)庫中,形成領(lǐng)域知識圖譜; 步驟2、在知識圖譜的基礎(chǔ)上,對待標(biāo)注數(shù)據(jù)進行知識增強標(biāo)注,將待標(biāo)注數(shù)據(jù)與領(lǐng)域知識圖譜進行匹配,根據(jù)待標(biāo)注數(shù)據(jù)中出現(xiàn)的實體,與知識圖譜中對應(yīng)的實體進行關(guān)聯(lián)匹配,通過查詢知識圖譜中實體的上下文關(guān)聯(lián)關(guān)系來優(yōu)化標(biāo)注的語義信息,匹配過程中,依據(jù)知識三元組中的實體和關(guān)系構(gòu)建的邏輯,為步驟3提供領(lǐng)域信息背景; 步驟3、基于知識增強標(biāo)注的結(jié)果,設(shè)計動態(tài)提示模板進行優(yōu)化,結(jié)合標(biāo)注任務(wù)的歷史數(shù)據(jù),通過分析歷史標(biāo)注結(jié)果,動態(tài)調(diào)整提示模板的內(nèi)容和結(jié)構(gòu),在動態(tài)提示模板中,結(jié)合知識增強標(biāo)注提供的領(lǐng)域信息,生成特定標(biāo)注任務(wù)的提示內(nèi)容,以供人工智能大模型在標(biāo)注任務(wù)中使用; 步驟4、利用動態(tài)提示模板和大模型對待標(biāo)注數(shù)據(jù)進行初步標(biāo)注,且通過主動學(xué)習(xí)的方式對未標(biāo)注數(shù)據(jù)中的樣本進行篩選,在篩選過程中,結(jié)合標(biāo)注結(jié)果中的分類概率分布計算樣本的不確定性評分,根據(jù)不確定性評分的高低對樣本進行排序,依據(jù)設(shè)置的不確定性閾值挑選部分樣本進行人工復(fù)核,對人工復(fù)核后的樣本,將修正后的數(shù)據(jù)回傳到模型訓(xùn)練集中,更新模型參數(shù); 步驟5、針對多模態(tài)標(biāo)注任務(wù),利用優(yōu)化的大模型對多模態(tài)數(shù)據(jù)進行標(biāo)注,且在文本和圖像的多模態(tài)數(shù)據(jù)中,提取文本特征向量和視覺特征向量,通過特征向量的對齊匹配實現(xiàn)多模態(tài)數(shù)據(jù)的協(xié)同標(biāo)注,同時,針對標(biāo)簽的層級化結(jié)構(gòu),構(gòu)建包含不同粒度的標(biāo)簽體系,根據(jù)標(biāo)注任務(wù)的需求對標(biāo)簽進行優(yōu)化,通過計算標(biāo)簽層級間的關(guān)聯(lián)關(guān)系調(diào)整標(biāo)注概率,生成標(biāo)注結(jié)果且輸出至自動化標(biāo)注工作流中,完成整體的快速標(biāo)注任務(wù)流程。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人南京大學(xué),其通訊地址為:210000 江蘇省南京市棲霞區(qū)仙林大道163號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。