廣東數(shù)業(yè)智能科技有限公司葛俊彥獲國(guó)家專(zhuān)利權(quán)
買(mǎi)專(zhuān)利賣(mài)專(zhuān)利找龍圖騰,真高效! 查專(zhuān)利查商標(biāo)用IPTOP,全免費(fèi)!專(zhuān)利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉廣東數(shù)業(yè)智能科技有限公司申請(qǐng)的專(zhuān)利一種基于生成式模型的領(lǐng)域語(yǔ)料數(shù)據(jù)審核及自動(dòng)修正方法獲國(guó)家發(fā)明授權(quán)專(zhuān)利權(quán),本發(fā)明授權(quán)專(zhuān)利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120012764B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-16發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專(zhuān)利申請(qǐng)?zhí)?專(zhuān)利號(hào)為:202510137831.1,技術(shù)領(lǐng)域涉及:G06F40/226;該發(fā)明授權(quán)一種基于生成式模型的領(lǐng)域語(yǔ)料數(shù)據(jù)審核及自動(dòng)修正方法是由葛俊彥;趙茁良;龍鳳明;張汝民;劉昌松;歐紅君設(shè)計(jì)研發(fā)完成,并于2025-02-07向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專(zhuān)利申請(qǐng)。
本一種基于生成式模型的領(lǐng)域語(yǔ)料數(shù)據(jù)審核及自動(dòng)修正方法在說(shuō)明書(shū)摘要公布了:本發(fā)明屬于人工智能技術(shù)領(lǐng)域,提供了一種基于生成式模型的領(lǐng)域語(yǔ)料數(shù)據(jù)審核及自動(dòng)修正方法,旨在解決領(lǐng)域語(yǔ)料數(shù)據(jù)審核依賴(lài)專(zhuān)家、效率低下及主觀影響問(wèn)題。技術(shù)方案包括:對(duì)原始語(yǔ)料預(yù)處理,通過(guò)LLM進(jìn)行標(biāo)準(zhǔn)化、分類(lèi)、修正和重組;利用多個(gè)LLM生成觀點(diǎn),進(jìn)行聚類(lèi)分析,計(jì)算語(yǔ)義熵以評(píng)估事實(shí)正確性,并評(píng)分分類(lèi);對(duì)中分語(yǔ)料進(jìn)行人工審核,不合格語(yǔ)料自動(dòng)修正;循環(huán)審核直至合格,并收集反饋更新LLM。該方法減少人工依賴(lài),增強(qiáng)模型自我審查和更新能力,實(shí)現(xiàn)自動(dòng)化修正,提升多領(lǐng)域語(yǔ)料審核的準(zhǔn)確性和效率。本發(fā)明方法可應(yīng)用于教育、醫(yī)療、金融、法律等不同領(lǐng)域,以提高領(lǐng)域語(yǔ)料數(shù)據(jù)審核的準(zhǔn)確性和效率。
本發(fā)明授權(quán)一種基于生成式模型的領(lǐng)域語(yǔ)料數(shù)據(jù)審核及自動(dòng)修正方法在權(quán)利要求書(shū)中公布了:1.一種基于生成式模型的領(lǐng)域語(yǔ)料數(shù)據(jù)審核及自動(dòng)修正方法,其特征在于,包括以下步驟: 步驟1、對(duì)原始語(yǔ)料進(jìn)行預(yù)處理,得到標(biāo)準(zhǔn)化語(yǔ)料,語(yǔ)料類(lèi)型包括單輪對(duì)話、多輪對(duì)話和陳述; 步驟2、對(duì)標(biāo)準(zhǔn)化語(yǔ)料使用大語(yǔ)言模型LLM審核,得到評(píng)分結(jié)果; 步驟2.1、M個(gè)LLM根據(jù)提示工程生成對(duì)當(dāng)前語(yǔ)料的觀點(diǎn),每個(gè)LLM生成K個(gè)觀點(diǎn),總共得到K×M個(gè)觀點(diǎn); 步驟2.2、對(duì)步驟2.1得到的觀點(diǎn)進(jìn)行聚類(lèi)分析,計(jì)算每個(gè)語(yǔ)義等價(jià)類(lèi)的生成概率; 步驟2.3、根據(jù)步驟2.2得到的生成概率,計(jì)算語(yǔ)義熵,判斷語(yǔ)料的事實(shí)正確性; 步驟2.4、根據(jù)預(yù)設(shè)的合格標(biāo)準(zhǔn)k1和不合格標(biāo)準(zhǔn)k2,將語(yǔ)料分為高分、中分和低分三類(lèi),輸出評(píng)分結(jié)果; 步驟2.4.1、設(shè)定初始的合格標(biāo)準(zhǔn)k1和不合格標(biāo)準(zhǔn)k2,這些標(biāo)準(zhǔn)根據(jù)領(lǐng)域知識(shí)和經(jīng)驗(yàn)進(jìn)行調(diào)整; 步驟2.4.2、比較每個(gè)語(yǔ)料的語(yǔ)義熵值與合格標(biāo)準(zhǔn)k1和不合格標(biāo)準(zhǔn)k2; 步驟2.4.3、將語(yǔ)義熵值低于k1的語(yǔ)料分類(lèi)為高分語(yǔ)料; 步驟2.4.4、將語(yǔ)義熵值高于k2的語(yǔ)料分類(lèi)為低分語(yǔ)料,低分語(yǔ)料為不合格語(yǔ)料; 步驟2.4.5、將語(yǔ)義熵值介于k1與k2之間的語(yǔ)料分類(lèi)為中分語(yǔ)料; 步驟2.4.6、整理分類(lèi)結(jié)果,為每個(gè)語(yǔ)料生成包含原始語(yǔ)料段落、語(yǔ)義熵值和評(píng)分類(lèi)別的JSON對(duì)象; 步驟2.4.7、輸出所有語(yǔ)料的評(píng)分結(jié)果; 步驟3、對(duì)LLM審核結(jié)果為中分的語(yǔ)料進(jìn)行人工審核,得到最終評(píng)分反饋; 步驟4、對(duì)不合格語(yǔ)料進(jìn)行自動(dòng)修正,得到修正后語(yǔ)料; 步驟4.1、根據(jù)預(yù)設(shè)比例將不合格語(yǔ)料分配至人工改寫(xiě)和LLM改寫(xiě)模塊處理; 不合格語(yǔ)料根據(jù)p和1-p的比例分別進(jìn)入人工改寫(xiě)模塊和LLM改寫(xiě)模塊,p服從下列公式:其中m為累計(jì)進(jìn)行審核的語(yǔ)料條數(shù),參數(shù)用于根據(jù)語(yǔ)料數(shù)總量調(diào)整p的改變速率,根據(jù)sigmoid函數(shù)的特性,隨著m逐漸增加,p將服從一個(gè)平滑的減少趨勢(shì),并在m大于某一閾值的情況下基本不變,即隨著語(yǔ)料累計(jì),人工改寫(xiě)模塊中人工的工作量將會(huì)逐步減少,流程最后人工改寫(xiě)模塊和LLM改寫(xiě)模塊共同輸出修改后語(yǔ)料; 步驟4.2、對(duì)進(jìn)入人工改寫(xiě)模塊的語(yǔ)料進(jìn)行多人同時(shí)改寫(xiě),形成修改語(yǔ)料對(duì),錄入修改語(yǔ)料對(duì)倉(cāng)庫(kù); 步驟4.3、當(dāng)修改語(yǔ)料對(duì)倉(cāng)庫(kù)達(dá)到預(yù)設(shè)數(shù)量時(shí),輸入到LLM更新模塊,對(duì)LLM進(jìn)行微調(diào)訓(xùn)練; 步驟4.4、對(duì)進(jìn)入LLM改寫(xiě)模塊的語(yǔ)料進(jìn)行自動(dòng)改寫(xiě),輸出修正后語(yǔ)料; 步驟5、對(duì)修正后語(yǔ)料進(jìn)行再次審核,直至通過(guò)審核得到合格語(yǔ)料; 步驟6、收集評(píng)分反饋,對(duì)LLM審核模型進(jìn)行更新; 步驟6.1、收集預(yù)設(shè)數(shù)量的評(píng)分反饋,統(tǒng)計(jì)語(yǔ)義熵與最終評(píng)分的關(guān)系; 步驟6.2、根據(jù)統(tǒng)計(jì)結(jié)果,重新計(jì)算合格標(biāo)準(zhǔn)k1和不合格標(biāo)準(zhǔn)k2; 步驟6.3、在更換目標(biāo)語(yǔ)料審核任務(wù)或數(shù)次更新不理想時(shí),修改指定上下文; 步驟6.4、使用更新后的k1、k2和指定上下文,對(duì)LLM審核大模型進(jìn)行更新,提高后續(xù)審核的準(zhǔn)確性。
如需購(gòu)買(mǎi)、轉(zhuǎn)讓、實(shí)施、許可或投資類(lèi)似專(zhuān)利技術(shù),可聯(lián)系本專(zhuān)利的申請(qǐng)人或?qū)@麢?quán)人廣東數(shù)業(yè)智能科技有限公司,其通訊地址為:510700 廣東省廣州市黃埔區(qū)科學(xué)大道64-70號(hào)(雙數(shù))1001、1002房;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開(kāi)、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 上海麥加涂料有限公司羅永鍵獲國(guó)家專(zhuān)利權(quán)
- 佛山市九龍機(jī)器有限公司邱仲驥獲國(guó)家專(zhuān)利權(quán)
- 賽靈思公司S·A·古普塔獲國(guó)家專(zhuān)利權(quán)
- 三星電子株式會(huì)社田秉澈獲國(guó)家專(zhuān)利權(quán)
- 三星電子株式會(huì)社王磊獲國(guó)家專(zhuān)利權(quán)
- 硅谷實(shí)驗(yàn)室公司阿卜杜勒克里姆·L·科班獲國(guó)家專(zhuān)利權(quán)
- 北京三快在線科技有限公司夏夢(mèng)煜獲國(guó)家專(zhuān)利權(quán)
- 奧林巴斯株式會(huì)社畠山智之獲國(guó)家專(zhuān)利權(quán)
- 弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)托馬斯·里克特獲國(guó)家專(zhuān)利權(quán)
- 香港中文大學(xué)陳君賜獲國(guó)家專(zhuān)利權(quán)


熱門(mén)推薦
- 華為技術(shù)有限公司劉曄獲國(guó)家專(zhuān)利權(quán)
- 日鐵化學(xué)材料株式會(huì)社今野高志獲國(guó)家專(zhuān)利權(quán)
- 珠海格力電器股份有限公司盛先賀獲國(guó)家專(zhuān)利權(quán)
- 株式會(huì)社NTT都科摩芝池尚哉獲國(guó)家專(zhuān)利權(quán)
- TCL-羅格朗國(guó)際電工(惠州)有限公司王冬冬獲國(guó)家專(zhuān)利權(quán)
- 羅蓋特公司C·拉羅切獲國(guó)家專(zhuān)利權(quán)
- 富士施樂(lè)株式會(huì)社趙健獲國(guó)家專(zhuān)利權(quán)
- 三星顯示有限公司金載能獲國(guó)家專(zhuān)利權(quán)
- SABIC環(huán)球技術(shù)有限責(zé)任公司S·穆維獲國(guó)家專(zhuān)利權(quán)
- 索尼集團(tuán)公司筑波健史獲國(guó)家專(zhuān)利權(quán)