杭州費爾斯通科技有限公司韓瑞峰獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州費爾斯通科技有限公司申請的專利一種基于元學習的少樣本實體識別方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN112906393B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202110246394.9,技術領域涉及:G06F40/295;該發明授權一種基于元學習的少樣本實體識別方法是由韓瑞峰;楊紅飛設計研發完成,并于2021-03-05向國家知識產權局提交的專利申請。
本一種基于元學習的少樣本實體識別方法在說明書摘要公布了:本發明公開了一種基于元學習的少樣本實體識別方法,首先制作元訓練數據和元測試數據,并構建用于實體識別的序列標注模型。然后將元訓練數據輸入模型,回傳損失值得到新的模型參數并保存,將元測試數據和新的模型參數輸入模型,回傳損失值得到的調節后的模型參數去更新序列標注模型參數,完成一輪訓練。直到達到預設循環次數,訓練得到元模型。最后用訓練得到的元模型在目標領域上進行訓練,訓練完成后即得到最終的模型,用最終的模型去預測識別目標領域中的無標簽樣本數據。本發明用于少量標注樣本下的實體識別,通過具有一定量標注樣本的源領域語料上的訓練,使得在少量標注樣本的目標領域語料上訓練時能夠達到更高的準確率。
本發明授權一種基于元學習的少樣本實體識別方法在權利要求書中公布了:1.一種基于元學習的少樣本實體識別方法,其特征在于,該方法具體步驟如下: (1)元訓練數據的準備 將源領域標注語料和目標領域標注語料制作為若干批的元訓練數據集,每一批包含源領域中的K個樣本作為元訓練數據,目標領域中的K個樣本作為元測試數據,根據小樣本場景的目標設定K值;每一批元訓練數據中包含N個類別,即在制作每一批元訓練數據時,從源領域標注語料和目標領域標注語料中隨機選取N個類別;構建用于實體識別的序列標注模型,模型的輸入為元訓練數據,模型的輸出為N個類別,N為目標領域中實際的類別個數; (2)模型的元訓練 按照步驟(1)的方式制作的若干批元訓練數據集中隨機選擇一批,將源領域的元訓練數據輸入序列標注模型產生訓練過程損失值,回傳訓練過程損失值得到訓練過程調節后的模型參數并保存新的模型參數,但不更新序列標注模型參數;然后用目標領域中的元測試數據和訓練過程調節后新的模型參數,輸入序列標注模型產生測試過程損失值,回傳測試過程損失值得到測試過程調節后的模型參數,用測試過程調節后的模型參數去更新序列標注模型的參數,完成一輪訓練;按照步驟(2)過程循環元訓練,直到達到預設循環次數,訓練得到元模型; (3)模型的訓練 用步驟(2)訓練得到的元模型在目標領域上進行訓練,每輪訓練在第(1)步制作的若干批目標領域的元測試數據中隨機取一批輸入元模型進行訓練,直到達到預設訓練的輪數,訓練完成后即得到最終的模型,用最終的模型去預測識別目標領域中的無標簽樣本數據。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州費爾斯通科技有限公司,其通訊地址為:310051 浙江省杭州市濱江區西興街道阡陌路482號B樓第七層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。