福建新大陸軟件工程有限公司焦洪林獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉福建新大陸軟件工程有限公司申請的專利一種基于多數據源的營銷知識文本匹配方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114443811B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111574083.1,技術領域涉及:G06F16/334;該發明授權一種基于多數據源的營銷知識文本匹配方法是由焦洪林;陸向東;朱堅;趙慶勇設計研發完成,并于2021-12-21向國家知識產權局提交的專利申請。
本一種基于多數據源的營銷知識文本匹配方法在說明書摘要公布了:本發明提供了文本匹配技術領域的一種基于多數據源的營銷知識文本匹配方法,包括如下步驟:步驟S10、獲取大量包括三元組數據以及文本數據的營銷知識文本;步驟S20、對各所述營銷知識文本進行預處理,進而構建文本數據集;步驟S30、創建一文本匹配模型,利用所述文本數據集對文本匹配模型進行訓練以及調優;步驟S40、評估所述文本匹配模型的性能;步驟S50、利用所述文本匹配模型對待匹配文本數據進行相似匹配。本發明的優點在于:極大的提升了文本匹配的準確度以及泛化能力。
本發明授權一種基于多數據源的營銷知識文本匹配方法在權利要求書中公布了:1.一種基于多數據源的營銷知識文本匹配方法,其特征在于:包括如下步驟: 步驟S10、從圖數據庫中獲取大量的營銷知識的三元組數據,提取所述三元組數據中的實體詞和關系詞并進行拼接;從關系型數據庫中獲取大量的營銷知識的文本數據;合并各所述三元組數據以及文本數據得到營銷知識文本; 步驟S20、對各所述營銷知識文本進行預處理,進而構建文本數據集; 步驟S30、創建一文本匹配模型,利用所述文本數據集對文本匹配模型進行訓練以及調優;所述文本匹配模型包括一向量化模塊、一全局相關性聚合模塊以及一輸出模塊;所述全局相關性聚合模塊的輸入端與向量化模塊連接,輸出端與輸出模塊連接; 所述向量化模塊用于對三元組數據以及文本數據進行向量化; 所述對三元組數據進行向量化具體為: 利用BERT預訓練模型對三元組數據的每一元數據進行向量化處理,得到每一元數據的第一WordEmbedding; 創建一參數矩陣,利用所述參數矩陣將各第一WordEmbedding映射到指定的文本長度,得到第二WordEmbedding; 利用softmax函數重新量化所述第二WordEmbedding的權重,得到第三WordEmbedding; 將所述第一WordEmbedding與第三WordEmbedding進行對比融合后,經過池化操作得到三元組向量,完成三元組數據的向量化; 所述對文本數據進行向量化具體為: 基于字粒度,利用BERT預訓練模型將所述文本數據轉換為BERTEmbedding; 基于詞粒度,利用Word2Vec模型將所述文本數據轉換為第四WordEmbedding; 結合平均池化以及最大池化對所述BERTEmbedding以及第四WordEmbedding進行融合,得到文本數據向量,完成文本數據的向量化; 所述全局相關性聚合模塊采用Bi-LSTM網絡,學習匹配所述向量化模塊輸出的向量序列與真實匹配度之間的映射關系; 所述Bi-LSTM網絡選擇交叉熵作為損失函數,并通過反向傳播算法進行訓練; 所述輸出模塊用于通過sigmoid函數輸出二分類結果; 步驟S40、評估所述文本匹配模型的性能; 步驟S50、利用所述文本匹配模型對待匹配文本數據進行相似匹配。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人福建新大陸軟件工程有限公司,其通訊地址為:350000 福建省福州市馬尾區儒江西路1號(自貿試驗區內);或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。