蘇州元腦智能科技有限公司張澤茹獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉蘇州元腦智能科技有限公司申請的專利訓練方法、數據預測方法及裝置、電子設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120278282B 。
龍圖騰網通過國家知識產權局官網在2025-09-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510748990.5,技術領域涉及:G06N5/04;該發明授權訓練方法、數據預測方法及裝置、電子設備及存儲介質是由張澤茹設計研發完成,并于2025-06-06向國家知識產權局提交的專利申請。
本訓練方法、數據預測方法及裝置、電子設備及存儲介質在說明書摘要公布了:本申請公開了一種訓練方法、數據預測方法及裝置、電子設備及存儲介質,涉及數據推理技術領域。數據推理模型的訓練方法包括將原始訓練數據劃分形成原始數據片段,在原始數據片段之間插入冗余噪聲數據形成增強數據序列,以通過增加冗余信息延長數據樣本的長度,并能夠增加相鄰的強關聯關系的原始數據片段之間的距離,利用形成的增強數據序列對數據推理模型進行訓練。如是,本申請能夠解決數據推理效果不理想的技術問題,達到增強數據推理模型對長距離依賴的處理性能,以提高數據推理模型的魯棒性的技術效果。
本發明授權訓練方法、數據預測方法及裝置、電子設備及存儲介質在權利要求書中公布了:1.一種數據推理模型的訓練方法,其特征在于,所述訓練方法包括: 獲取原始訓練數據,劃分其形成原始數據片段;所述原始訓練數據包括文本; 獲取冗余噪聲數據,將其插入所述原始數據片段之間形成所述原始訓練數據的增強數據序列; 將所述增強數據序列輸入數據推理模型,獲取所述數據推理模型的推理輸出;利用所述推理輸出對所述數據推理模型進行損失更新; 所述利用所述推理輸出對所述數據推理模型進行損失更新包括: 評估所述推理輸出與目標輸出之間的第一預測損失; 利用所述原始數據片段之間的相似性與全局數據片段之間的相似性二者,融合訓練溫度系數形成第二預測損失; 利用預設加權因子對所述第二預測損失進行加權,將加權結果與所述第一預測損失進行疊加,得到訓練損失函數; 利用所述訓練損失函數對所述數據推理模型進行更新; 所述訓練損失函數的表達公式為: L=Lntp+αLcontrastive 其中,L表示訓練損失函數;Lntp表示推理輸出與目標輸出之間的第一預測損失,用來訓練并擴展數據推理模型基礎模型的上下文長度;α表示調節對比學習損失占比的超參數;Lcontrastive表示對比學習損失函數;T表示增強數據序列或原始訓練數據內數據片段數量;q表示錨定塊,可以認為是第一個CLS向量;k+表示原始數據片段即后續原始訓練數據的向量;ki表示增強數據序列內第i個數據片段原始數據片段或冗余噪聲數據;τ表示對比學習的溫度系數,用于控制冗余噪聲數據的區分度; 所述將所述增強數據序列輸入數據推理模型之前還包括: 將所述原始訓練數據劃分形成原始數據塊;其中,所述原始數據塊包括至少一個所述原始數據片段; 對所述原始數據片段進行局部位置編碼處理,以感知所述原始數據片段在其所屬原始數據塊的相對位置,得到局部編碼; 對所述原始數據片段進行全局位置編碼處理,以感知所述原始數據片段所屬原始數據塊在原始訓練文檔或增強數據序列的順序編號,得到全局編碼; 擬合所述局部編碼以及所述全局編碼,得到所述原始數據片段的層次位置編碼; 層次位置編碼的計算公式為: PEi=PElocalimodL+PEglobal[iL] 其中,第i個token的層次位置編碼,token表示數據片段;mod表示求余函數;L表示數據塊的token長度;PElocalimodL表示局部編碼;PEglobal[iL]表示全局編碼。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人蘇州元腦智能科技有限公司,其通訊地址為:215000 江蘇省蘇州市吳中經濟開發區綜保區經一路1號8幢;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。