網(wǎng)麒科技(北京)有限責(zé)任公司張興旺獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉網(wǎng)麒科技(北京)有限責(zé)任公司申請(qǐng)的專利基于大數(shù)據(jù)處理的數(shù)字大腦模型訓(xùn)練數(shù)據(jù)清洗方法獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120316417B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-26發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510813165.9,技術(shù)領(lǐng)域涉及:G06F18/10;該發(fā)明授權(quán)基于大數(shù)據(jù)處理的數(shù)字大腦模型訓(xùn)練數(shù)據(jù)清洗方法是由張興旺;趙敏;曲慧娟;胡帥設(shè)計(jì)研發(fā)完成,并于2025-06-18向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本基于大數(shù)據(jù)處理的數(shù)字大腦模型訓(xùn)練數(shù)據(jù)清洗方法在說(shuō)明書(shū)摘要公布了:本申請(qǐng)涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,具體涉及基于大數(shù)據(jù)處理的數(shù)字大腦模型訓(xùn)練數(shù)據(jù)清洗方法,該方法包括:構(gòu)建違禁詞詞表;通過(guò)分詞工具對(duì)文本數(shù)據(jù)進(jìn)行分詞,獲取每條語(yǔ)句的詞語(yǔ)集合;基于違禁詞詞表隨機(jī)生成源文本,分別構(gòu)建詞語(yǔ)級(jí)別、語(yǔ)句級(jí)別的匹配矩陣;針對(duì)不同級(jí)別的匹配矩陣,利用不同類型的注意力機(jī)制提取不同交互級(jí)別的文本特征,得到文本匹配模型;基于匹配結(jié)果對(duì)文本數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗。本申請(qǐng)旨在有效解決傳統(tǒng)詞向量匹配在處理供應(yīng)鏈中各個(gè)環(huán)節(jié)和不同主題的文本數(shù)據(jù)清洗時(shí)面臨的挑戰(zhàn),提升數(shù)字大腦模型訓(xùn)練數(shù)據(jù)的清洗效果。
本發(fā)明授權(quán)基于大數(shù)據(jù)處理的數(shù)字大腦模型訓(xùn)練數(shù)據(jù)清洗方法在權(quán)利要求書(shū)中公布了:1.基于大數(shù)據(jù)處理的數(shù)字大腦模型訓(xùn)練數(shù)據(jù)清洗方法,其特征在于,該方法包括以下步驟: 從采購(gòu)供應(yīng)鏈的整個(gè)流程中獲取若干條文本數(shù)據(jù),獲取每個(gè)文本數(shù)據(jù)中每條語(yǔ)句的詞語(yǔ)集合; 根據(jù)違禁詞表中的違禁詞、以及所有語(yǔ)句分詞得到的詞語(yǔ)對(duì)應(yīng)詞向量之間的相似程度,構(gòu)建詞語(yǔ)級(jí)別的匹配矩陣; 基于文本生成手段生成至少包含一個(gè)違禁詞的句子,將每個(gè)生成的句子作為一個(gè)源文本;對(duì)所有違禁詞的詞向量進(jìn)行聚類,得到若干類違禁詞;基于每一類違禁詞對(duì)應(yīng)的每個(gè)源文本,利用對(duì)比學(xué)習(xí)模型得到相應(yīng)的特征向量; 對(duì)每條語(yǔ)句進(jìn)行編碼投影得到深度特征,分析其與每個(gè)源文本對(duì)應(yīng)特征向量之間的相似程度,得到每條語(yǔ)句與每個(gè)源文本之間的共性語(yǔ)義相似參數(shù);提取每個(gè)源文本中的每個(gè)違禁詞與其相鄰詞語(yǔ)的共現(xiàn)概率以及位置情況,確認(rèn)每個(gè)違禁詞的每個(gè)相鄰詞語(yǔ)的詞權(quán)重,結(jié)合每個(gè)源文本與每條語(yǔ)句的詞語(yǔ)集合中所有詞向量的分布相似度,確定每個(gè)源文本與每條語(yǔ)句的匹配基準(zhǔn)值; 獲取每條語(yǔ)句與每個(gè)源文本中的違禁詞所屬類別中的所有源文本之間的共性語(yǔ)義相似參數(shù)的整體分布,結(jié)合所述匹配基準(zhǔn)值,得到每條語(yǔ)句與每個(gè)源文本之間的修正相似度,確認(rèn)句子級(jí)別的匹配矩陣; 針對(duì)不同級(jí)別的匹配矩陣,利用不同類型的注意力機(jī)制提取不同交互級(jí)別的文本特征,得到文本匹配模型; 基于文本匹配模型的匹配結(jié)果對(duì)文本數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人網(wǎng)麒科技(北京)有限責(zé)任公司,其通訊地址為:100000 北京市海淀區(qū)中關(guān)村南大街48號(hào)7幢三層302號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開(kāi)、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 華為技術(shù)有限公司喬貝·普萊姆·納拉揚(yáng)獲國(guó)家專利權(quán)
- 羅伯特·博世有限公司顧曉峰獲國(guó)家專利權(quán)
- 海信冰箱有限公司張樹(shù)棟獲國(guó)家專利權(quán)
- 株式會(huì)社NTT都科摩高橋優(yōu)元獲國(guó)家專利權(quán)
- 廣州科語(yǔ)機(jī)器人有限公司蔡理莊獲國(guó)家專利權(quán)
- 上海志聽(tīng)醫(yī)療科技有限公司李華偉獲國(guó)家專利權(quán)
- 麻旭東獲國(guó)家專利權(quán)
- 超威半導(dǎo)體公司加布里埃爾·H·羅獲國(guó)家專利權(quán)
- 中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)院蘇龍翔獲國(guó)家專利權(quán)
- 三星電子株式會(huì)社姜明衫獲國(guó)家專利權(quán)


熱門推薦
- 浙江龍芯電驅(qū)動(dòng)科技有限公司王麗獲國(guó)家專利權(quán)
- 應(yīng)用材料公司高建德獲國(guó)家專利權(quán)
- 喬治費(fèi)歇爾金屬成型科技阿爾藤馬克特有限責(zé)任兩合公司H.馬爾科獲國(guó)家專利權(quán)
- 揚(yáng)子江藥業(yè)集團(tuán)江蘇海慈生物藥業(yè)有限公司王亞獲國(guó)家專利權(quán)
- 廣東旗米兄弟智能科技有限公司蒲虹均獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司紀(jì)劉榴獲國(guó)家專利權(quán)
- 第一資本服務(wù)有限責(zé)任公司威廉·杜安獲國(guó)家專利權(quán)
- 卡爾蔡司醫(yī)療技術(shù)股份公司馬修·J·埃弗里特獲國(guó)家專利權(quán)
- 安東帕有限責(zé)任公司邁克爾·克倫獲國(guó)家專利權(quán)
- 寧波望通鎖業(yè)有限公司韓文杰獲國(guó)家專利權(quán)