人民網股份有限公司;西安交通大學劉毅獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉人民網股份有限公司;西安交通大學申請的專利基于偏差自糾偏校準的文本廣義意圖發現方法及相關裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119577577B 。
龍圖騰網通過國家知識產權局官網在2025-09-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411636364.9,技術領域涉及:G06F18/2415;該發明授權基于偏差自糾偏校準的文本廣義意圖發現方法及相關裝置是由劉毅;安文斌;楊煜;田鋒設計研發完成,并于2024-11-15向國家知識產權局提交的專利申請。
本基于偏差自糾偏校準的文本廣義意圖發現方法及相關裝置在說明書摘要公布了:本發明公開了一種基于偏差自糾偏校準的文本廣義意圖發現方法及系統,包括:獲取預測文本樣本并輸入至預設廣義意圖發現模型中得到模型原始輸出;采用Softmax函數對模型原始輸出進行分類,將Softmax最大值所屬類別作為文本樣本的樣本預測類別。其中,廣義意圖發現模型內部設置有偏分支和可訓練分支,首先通過預訓練得到一個存在偏差的有偏分支,并固定模型參數。然后,將訓練文本樣本分別輸入到預訓練好的有偏分支和可訓練分支,輸出兩個原始輸出,利用有偏分支輸出的原始輸出,對可訓練分支的原始輸出進行調整,利用模型對已知類別的偏差來緩解類別偏差和類別混淆,對類別偏差和類別混淆都起到了緩解作用,有效提高了模型對新類別的識別準確率。
本發明授權基于偏差自糾偏校準的文本廣義意圖發現方法及相關裝置在權利要求書中公布了:1.一種基于偏差自糾偏校準的文本廣義意圖發現方法,其特征在于,包括: 獲取預測文本樣本并輸入至預設廣義意圖發現模型中得到模型原始輸出; 采用Softmax函數對模型原始輸出進行分類,將Softmax最大值所屬類別作為文本樣本的樣本預測類別; 其中,廣義意圖發現模型通過下述方式得到: 構建有偏分支和可訓練分支;其中,有偏分支包括依次連接的預訓練BERT模型和預訓練全連接層,可訓練分支包括依次連接的BERT模型和全連接層; 固定有偏分支的參數,并采用預訓練BERT模型的參數初始化BERT模型的參數,采用類別原型初始化全連接層的參數; 對于每一個訓練文本樣本,通過有偏分支得到有偏輸出Lbias,通過可訓練分支得到訓練輸出Lθ,并結合有偏輸出權重因子α得到緩解類別偏差的輸出LCBM;根據類別原型構建遷移矩陣并進行歸一化得到歸一化遷移矩陣,以及根據歸一化遷移矩陣、有偏輸出Lbias和訓練輸出Lθ得到緩解類別混淆的輸出LCCM;合并LCBM和LCCM得到偏差自校準輸出Lc=[LCBM,LCCM]; 根據Lc通過SK算法得出無標簽訓練文本樣本的偽標簽并通過交叉熵損失函數分別計算有標簽訓練文本樣本的真實標簽Yl與預測標簽之間的損失,以及無標簽訓練文本樣本的偽標簽與預測標簽之間的損失,并將二者進行加權組合得到交叉熵損失lsup;以及使用實例級對比學習計算有標簽訓練文本樣本和無標簽訓練文本樣本的對比損失lcont;對lsup和lcont進行加權組合得到最終損失l; 根據l通過反向傳播不斷更新可訓練分支的參數至l收斂,將最終的可訓練分支作為預設廣義意圖發現模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人人民網股份有限公司;西安交通大學,其通訊地址為:100082 北京市西城區新街口外大街28號B座234號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。