新華三大數(shù)據(jù)技術有限公司劉萬青獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉新華三大數(shù)據(jù)技術有限公司申請的專利詞性標注模型的訓練方法、詞性標注方法及電子設備獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN114117051B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-22發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202111441837.6,技術領域涉及:G06F16/35;該發(fā)明授權(quán)詞性標注模型的訓練方法、詞性標注方法及電子設備是由劉萬青設計研發(fā)完成,并于2021-11-30向國家知識產(chǎn)權(quán)局提交的專利申請。
本詞性標注模型的訓練方法、詞性標注方法及電子設備在說明書摘要公布了:本發(fā)明涉及文本分析技術領域,具體涉及詞性標注模型的訓練方法、詞性標注方法及電子設備,所述訓練方法包括獲取文本樣本數(shù)據(jù),以及所述文本樣本數(shù)據(jù)中每個字對應的初始詞性標簽;獲取所述文本樣本數(shù)據(jù)中每個字屬于其他詞性類別的概率,并基于所述概率對所述初始詞性標簽進行平滑處理,確定目標詞性標簽;將所述文本樣本數(shù)據(jù)輸入詞性標注模型中,確定所述文本樣本數(shù)據(jù)中每個字對應的預測詞性;根據(jù)所述預測詞性以及所述目標詞性標簽,更新所述詞性標注模型的參數(shù),以確定目標詞性標注模型。在平滑處理的過程中結(jié)合對應的概率,可以避免詞性標注模型的輸出過擬合到初始詞性標簽上,并且不會損害其分類能力,從而可以保證目標詞性標注模型的準確性。
本發(fā)明授權(quán)詞性標注模型的訓練方法、詞性標注方法及電子設備在權(quán)利要求書中公布了:1.一種詞性標注模型的訓練方法,其特征在于,包括; 獲取文本樣本數(shù)據(jù),以及所述文本樣本數(shù)據(jù)中每個字對應的初始詞性標簽; 獲取所述文本樣本數(shù)據(jù)中每個字屬于其他詞性類別的概率,并基于所述概率對所述初始詞性標簽進行平滑處理,確定目標詞性標簽; 將所述文本樣本數(shù)據(jù)輸入詞性標注模型中,確定所述文本樣本數(shù)據(jù)中每個字對應的預測詞性; 根據(jù)所述預測詞性以及所述目標詞性標簽,更新所述詞性標注模型的參數(shù),以確定目標詞性標注模型。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術,可聯(lián)系本專利的申請人或?qū)@麢?quán)人新華三大數(shù)據(jù)技術有限公司,其通訊地址為:450000 河南省鄭州市高新技術產(chǎn)業(yè)開發(fā)區(qū)杜英街166號總部大觀B18號樓;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。