天津大學許熙巍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉天津大學申請的專利詩詞實體提取模型的訓練方法、詩詞實體提取方法和設備獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120277219B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510766367.2,技術領域涉及:G06F16/353;該發明授權詩詞實體提取模型的訓練方法、詩詞實體提取方法和設備是由許熙巍;高思琪;張子健;鄭毅設計研發完成,并于2025-06-10向國家知識產權局提交的專利申請。
本詩詞實體提取模型的訓練方法、詩詞實體提取方法和設備在說明書摘要公布了:本申請提供了一種詩詞實體提取模型的訓練方法、詩詞實體提取方法和設備,該方法包括將初始詩詞訓練集中的第一詩詞文本信息輸入至預訓練模型,輸出第一詩詞文本信息中每個命名實體所對應的第一實體類型標簽;計算第一詩詞文本信息與預設知識庫中每個待篩選詩詞文本信息之間的余弦相似數據和詩詞平仄差異數據;針對每個待篩選詩詞文本信息,根據余弦相似數據和詩詞平仄差異數據,生成綜合相似度;在綜合相似度滿足第一預設條件的情況下,將待篩選詩詞文本信息確定為與第一詩詞文本信息對應的第二詩詞文本信息;將中間詩詞訓練集輸入至預設語言模型,得到目標詩詞訓練集;利用目標詩詞訓練集對預訓練模型進行訓練,得到經訓練的詩詞實體提取模型。
本發明授權詩詞實體提取模型的訓練方法、詩詞實體提取方法和設備在權利要求書中公布了:1.一種詩詞實體提取模型的訓練方法,其特征在于,包括: 將初始詩詞訓練集中的第一詩詞文本信息輸入至預訓練模型,輸出所述第一詩詞文本信息中每個命名實體所對應的多個第一實體類型標簽; 計算所述第一詩詞文本信息與預設知識庫中每個待篩選詩詞文本信息之間的余弦相似數據和詩詞平仄差異數據,其中,所述預設知識庫還包括與每個所述待篩選詩詞文本信息對應的第二實體類型標簽; 針對每個所述待篩選詩詞文本信息,根據所述余弦相似數據和詩詞平仄差異數據,生成綜合相似度; 在所述綜合相似度滿足第一預設條件的情況下,將所述待篩選詩詞文本信息確定為與所述第一詩詞文本信息對應的第二詩詞文本信息; 將中間詩詞訓練集輸入至預設語言模型,得到目標詩詞訓練集,其中,所述中間詩詞訓練集包括多個所述第一詩詞文本信息和與每個所述第一詩詞文本信息對應的多個所述第一實體類型標簽、多個所述第二詩詞文本信息和多個所述第二實體類型標簽; 利用所述目標詩詞訓練集對所述預訓練模型進行訓練,得到經訓練的詩詞實體提取模型; 其中,將中間詩詞訓練集輸入至預設語言模型,得到目標詩詞訓練集,包括: 針對所述中間詩詞訓練集中的每個所述第一詩詞文本信息,根據所述第一詩詞文本信息、多個所述第一實體類型標簽和與所述第一詩詞文本信息對應的多個第二詩詞文本信息和多個所述第二實體類型標簽,生成第一目標提示詞; 將所述第一目標提示詞輸入至所述預設語言模型,輸出與所述第一詩詞文本信息對應的第三詩詞文本信息; 根據預測詩詞訓練集和所述中間詩詞訓練集,生成所述目標詩詞訓練集,其中,所述預測詩詞訓練集包括多個所述第三詩詞文本信息。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人天津大學,其通訊地址為:300072 天津市南開區衛津路92號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。