浙江大學張寅獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浙江大學申請的專利一種基于自然語言提示機制的持續小樣本意圖識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115688872B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211237121.9,技術領域涉及:G06N3/0455;該發明授權一種基于自然語言提示機制的持續小樣本意圖識別方法是由張寅;李國躉;翟雨晨設計研發完成,并于2022-10-10向國家知識產權局提交的專利申請。
本一種基于自然語言提示機制的持續小樣本意圖識別方法在說明書摘要公布了:本發明公開了一種基于自然語言提示機制的持續小樣本意圖識別方法。本發明包括如下步驟:1教師模型準備:在新任務上從零初始化教師模型,并進行基于對比學習方式的微調;2執行知識蒸餾:凍結教師模型,利用新任務數據,對舊任務上訓練得到的模型執行知識蒸餾,遷移教師表征;3執行內存重放:利用從舊任務中保存的少量數據在當前學生模型上執行對比學習方式的重放。和現有技術相比,本發明針對持續學習場景下的小樣本意圖識別問題,首次提出了一種參數高效的自然語言提示機制,結合內存重放和知識蒸餾策略,能夠極大地緩解持續學習過程中的知識遺忘問題和知識負遷移問題。
本發明授權一種基于自然語言提示機制的持續小樣本意圖識別方法在權利要求書中公布了:1.一種基于自然語言提示機制的持續小樣本意圖識別方法,其特征在于,步驟如下: S1:在意圖識別場景的新任務上,初始化一個與學生模型結構相同的教師模型;所述學生模型和教師模型均采用SimCSE-RoBERTa作為原始編碼器,并在原始編碼器內部的每個多頭注意力層中引入可學習的前綴提示參數并與原有的鍵值表征進行連接從而形成前綴提示引導的多頭注意力層,同時在原始編碼器內部的每層前饋層后插入可學習的適配器結構;在新任務對應的意圖識別任務數據集基礎上基于對比學習方式對所述教師模型進行訓練,且訓練過程中需凍結原始編碼器參數,僅微調相對于原始編碼器新引入的網絡結構; S2:凍結S1中訓練好的教師模型,并基于新任務對應的意圖識別任務數據集,利用該教師模型對已在舊任務上訓練得到的學生模型執行知識蒸餾,得到教師模型和學生模型對于相同樣本輸出的不同表征之間的均方誤差損失; S3:在對學生模型進行新任務訓練時,利用從舊任務中緩存的數據在當前學生模型上執行對比學習方式的內存重放,計算得到基于對比學習的內存重放損失;所述舊任務中緩存的數據為所述學生模型在該舊任務上訓練結束后保存下來的每個類別中距離對應類別表征在余弦距離上最近和最遠的兩個樣本; S4:同時通過S2的知識蒸餾和S3的內存重放任務對所述學生模型進行新任務的迭代訓練,訓練的總損失為所述均方誤差損失和所述內存重放損失的加權和; S5:在新任務訓練結束后,將該新任務中每個類別的所有訓練樣本送入編碼器并輸出樣本表征,將每個類別中所有樣本表征的平均值作為這個類別的表征;將每個類別中距離該類別表征在余弦距離上最近和最遠的兩個樣本緩存起來,用于進行下一次新任務訓練時的內存重放; S6:在測試或實際應用時,將用戶的查詢文本輸入到當前最新的學生模型中通過編碼得到查詢表征,將查詢表征分別與所有類別表征計算余弦相似度,并將與查詢表征最相似的類別作為預測的意圖類別。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江大學,其通訊地址為:310058 浙江省杭州市西湖區余杭塘路866號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。