數(shù)據(jù)堂(北京)科技股份有限公司齊紅威獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉數(shù)據(jù)堂(北京)科技股份有限公司申請(qǐng)的專利大模型訓(xùn)練數(shù)據(jù)增強(qiáng)方法獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120235194B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-26發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510717135.8,技術(shù)領(lǐng)域涉及:G06N3/0475;該發(fā)明授權(quán)大模型訓(xùn)練數(shù)據(jù)增強(qiáng)方法是由齊紅威;何鴻凌;豐強(qiáng)澤;王大亮;高禹;鄭繼龍?jiān)O(shè)計(jì)研發(fā)完成,并于2025-05-30向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本大模型訓(xùn)練數(shù)據(jù)增強(qiáng)方法在說(shuō)明書摘要公布了:本申請(qǐng)公開了一種大模型訓(xùn)練數(shù)據(jù)增強(qiáng)方法,其首先以原始訓(xùn)練樣本為基礎(chǔ),通過(guò)隨機(jī)挑選樣本并利用大模型生成新的訓(xùn)練樣本,在此基礎(chǔ)上,引入結(jié)構(gòu)化編碼機(jī)制,將原始與生成樣本轉(zhuǎn)化為結(jié)構(gòu)化編碼向量,并對(duì)生成樣本與原始樣本之間的語(yǔ)義關(guān)系進(jìn)行建模和量化,以獲得反映兩者語(yǔ)義差異程度的查詢響應(yīng)表征;進(jìn)而,通過(guò)特征解碼得到語(yǔ)義漂移度估值,并基于該估值與預(yù)設(shè)閾值之間的比較,實(shí)現(xiàn)對(duì)生成數(shù)據(jù)是否合格的自動(dòng)判別。通過(guò)這樣的方式,實(shí)現(xiàn)了對(duì)新舊訓(xùn)練數(shù)據(jù)之間的語(yǔ)義一致性的精準(zhǔn)評(píng)估,有效避免了因語(yǔ)義漂移導(dǎo)致的新數(shù)據(jù)偏離任務(wù)目標(biāo)的問(wèn)題,從而篩選出真正有助于提升模型泛化能力和魯棒性的高質(zhì)量增強(qiáng)樣本。
本發(fā)明授權(quán)大模型訓(xùn)練數(shù)據(jù)增強(qiáng)方法在權(quán)利要求書中公布了:1.一種大模型訓(xùn)練數(shù)據(jù)增強(qiáng)方法,其特征在于,包括: 獲取原始訓(xùn)練樣本數(shù)據(jù)的集合; 從原始訓(xùn)練樣本數(shù)據(jù)的集合隨機(jī)挑選一個(gè)原始訓(xùn)練樣本數(shù)據(jù)作為增強(qiáng)樣本素材數(shù)據(jù); 將增強(qiáng)樣本素材數(shù)據(jù)輸入基于大模型的數(shù)據(jù)增強(qiáng)引擎以得到生成訓(xùn)練樣本數(shù)據(jù); 對(duì)原始訓(xùn)練樣本數(shù)據(jù)的集合和生成訓(xùn)練樣本數(shù)據(jù)進(jìn)行訓(xùn)練樣本語(yǔ)義漂移查詢響應(yīng)分析以得到生成訓(xùn)練樣本語(yǔ)義漂移查詢響應(yīng)編碼向量作為生成訓(xùn)練樣本語(yǔ)義偏移度量表征,所述原始訓(xùn)練樣本數(shù)據(jù)和所述生成訓(xùn)練樣本數(shù)據(jù)為文本或圖像; 基于生成訓(xùn)練樣本語(yǔ)義偏移度量表征,確定是否將生成訓(xùn)練樣本數(shù)據(jù)視為合格訓(xùn)練樣本數(shù)據(jù); 對(duì)原始訓(xùn)練樣本數(shù)據(jù)的集合和生成訓(xùn)練樣本數(shù)據(jù)進(jìn)行訓(xùn)練樣本語(yǔ)義漂移查詢響應(yīng)分析以得到生成訓(xùn)練樣本語(yǔ)義漂移查詢響應(yīng)編碼向量作為生成訓(xùn)練樣本語(yǔ)義偏移度量表征,包括: 對(duì)原始訓(xùn)練樣本數(shù)據(jù)的集合和生成訓(xùn)練樣本數(shù)據(jù)進(jìn)行結(jié)構(gòu)化編碼以得到原始訓(xùn)練樣本結(jié)構(gòu)化編碼向量的集合和生成訓(xùn)練樣本結(jié)構(gòu)化編碼向量; 以生成訓(xùn)練樣本結(jié)構(gòu)化編碼向量作為查詢向量,將查詢向量和原始訓(xùn)練樣本結(jié)構(gòu)化編碼向量的集合輸入語(yǔ)義漂移顯性建模網(wǎng)絡(luò)以得到生成訓(xùn)練樣本語(yǔ)義漂移查詢響應(yīng)編碼向量。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人數(shù)據(jù)堂(北京)科技股份有限公司,其通訊地址為:100080 北京市海淀區(qū)寶盛南路1號(hào)院11號(hào)樓1層101-01;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 谷歌有限責(zé)任公司雷吉納爾德·克利福德·揚(yáng)獲國(guó)家專利權(quán)
- 佛山市順德區(qū)美的電熱電器制造有限公司馬志海獲國(guó)家專利權(quán)
- 塞爾雷斯蒂斯有限公司J·博伊爾獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司李勝鈺獲國(guó)家專利權(quán)
- 賽諾菲獲國(guó)家專利權(quán)
- 文塔納醫(yī)療系統(tǒng)公司M.巴恩斯獲國(guó)家專利權(quán)
- 洋馬動(dòng)力科技有限公司平松敏史獲國(guó)家專利權(quán)
- 杭州諾茂醫(yī)療科技有限公司王永勝獲國(guó)家專利權(quán)
- OPPO廣東移動(dòng)通信有限公司陳文洪獲國(guó)家專利權(quán)
- 英特爾公司T·T·施呂斯列爾獲國(guó)家專利權(quán)


熱門推薦
- 威斯康星州醫(yī)藥大學(xué)股份有限公司X·A·李獲國(guó)家專利權(quán)
- 英特爾公司N.K.托馬斯獲國(guó)家專利權(quán)
- 佛山市順德區(qū)美的電熱電器制造有限公司梅長(zhǎng)云獲國(guó)家專利權(quán)
- 旭化成株式會(huì)社內(nèi)藤一也獲國(guó)家專利權(quán)
- 伊瑪提克斯生物技術(shù)有限公司安德烈·馬爾獲國(guó)家專利權(quán)
- 韓國(guó)電子通信研究院金龍浩獲國(guó)家專利權(quán)
- 福特全球技術(shù)公司馬克·席爾瓦·康德拉德獲國(guó)家專利權(quán)
- 深圳麥格米特電氣股份有限公司周滿枝獲國(guó)家專利權(quán)
- 松下電器研究開發(fā)(蘇州)有限公司牛向偉獲國(guó)家專利權(quán)
- 領(lǐng)星生物科技(上海)有限公司許強(qiáng)獲國(guó)家專利權(quán)