杭銀消費金融股份有限公司吳玉明獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭銀消費金融股份有限公司申請的專利一種基于預訓練模型的領域詞語擴展方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117251530B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311260793.6,技術領域涉及:G06F16/334;該發明授權一種基于預訓練模型的領域詞語擴展方法及系統是由吳玉明;張妍;王震;段美寧設計研發完成,并于2023-09-27向國家知識產權局提交的專利申請。
本一種基于預訓練模型的領域詞語擴展方法及系統在說明書摘要公布了:本發明公開了一種基于預訓練模型的領域詞語擴展方法及系統,其基于海量外部通用語料預訓練的詞模型,設計疊加內部流水文本詞模型精調算法,并輔以自然語言處理工具流程,實現對少量行業專屬文本的詞語理解以及人工經驗詞庫構建提效,有效地提升了對非經營性收入流水的識別能力,通過這樣的方式,能夠自動地從流水數據中挖掘出與非經營性收入相關的關鍵詞,實現經營流水關鍵詞擴展,提升非經營性流水識別,并且具有較高的準確度和泛化能力,進而有效刻畫用戶的經營能力。
本發明授權一種基于預訓練模型的領域詞語擴展方法及系統在權利要求書中公布了:1.一種基于預訓練模型的領域詞語擴展方法,其特征在于,包括: 獲取用戶交易流水文本數據; 對所述用戶交易流水文本數據進行預處理以得到預處理后用戶交易流水文本數據; 對所述預處理后用戶交易流水文本數據進行按照詞頻排序排列和詞性過濾以得到第一待評估種子池; 從基于外部海量語料預訓練的語言模型得到第一詞集合和與所述第一詞集合對應的第一通用詞向量集合; 將所述第一通用詞向量集合和所述第一詞集合與所述第一待評估種子池進行相似度關聯分析以得到第二待評估種子池,包括:在所述第一通用詞向量集合和所述第一詞集合中,采用余弦相似度方法輸出與所述第一待評估種子池中各個詞之間的相似度超過預定閾值的詞以得到所述第二待評估種子池; 引入內部流水文本數據并通過Fine-tuning方法構建行業詞模型以得到行業專屬詞集合和行業專屬詞向量的集合; 將所述行業專屬詞集合和所述行業專屬詞向量的集合與所述第一待評估種子池進行相似度關聯分析以得到第三待評估種子池,包括:在所述行業專屬詞集合和所述行業專屬詞向量的集合中,采用余弦相似度方法輸出與所述第一待評估種子池中各個詞之間的相似度超過預定閾值的詞以得到所述第三待評估種子池; 對所述第一待評估種子池、所述第二待評估種子池和所述第三待評估種子池進行歸并以得到最終種子池,包括:將所述第一待評估種子池、所述第二待評估種子池和所述第三待評估種子池通過文本語義編碼器以得到第一文本特征向量、第二文本特征向量和第三文本特征向量;融合所述第一文本特征向量、所述第二文本特征向量和所述第三文本特征向量以得到級聯特征向量;將所述級聯特征向量通過文本語義解碼器以得到所述最終種子池。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭銀消費金融股份有限公司,其通訊地址為:310000 浙江省杭州市拱墅區潮鳴街道慶春路38號8層(801、802、803、804室)、9層、11層(1101、1102室)(自主申報);或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。