騰訊科技(深圳)有限公司王慧敏獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉騰訊科技(深圳)有限公司申請的專利可持續(xù)學習模型的訓練方法、裝置、設(shè)備及存儲介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN115115057B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-19發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202210348872.1,技術(shù)領(lǐng)域涉及:G06N20/00;該發(fā)明授權(quán)可持續(xù)學習模型的訓練方法、裝置、設(shè)備及存儲介質(zhì)是由王慧敏;張云燕;楊奕凡設(shè)計研發(fā)完成,并于2022-04-01向國家知識產(chǎn)權(quán)局提交的專利申請。
本可持續(xù)學習模型的訓練方法、裝置、設(shè)備及存儲介質(zhì)在說明書摘要公布了:本申請公開了一種可持續(xù)學習模型的訓練方法、裝置、設(shè)備及存儲介質(zhì),屬于人工智能技術(shù)領(lǐng)域。所述方法包括:基于可持續(xù)學習模型獲取未學習的新任務數(shù)據(jù);根據(jù)新任務數(shù)據(jù)獲取可持續(xù)學習模型的第一損失;基于可持續(xù)學習模型和已學習的舊任務數(shù)據(jù),獲取可持續(xù)學習模型的第二損失;基于可持續(xù)學習模型、舊任務數(shù)據(jù)和新任務數(shù)據(jù),獲取可持續(xù)學習模型的第三損失;根據(jù)第一損失、第二損失和第三損失,對可持續(xù)學習模型進行訓練。本申請中,通過第一損失、第二損失和第三損失進行模型訓練,提高可持續(xù)學習模型的準確性和泛化性,減少可持續(xù)學習模型的舊知識遺忘,進而提高可持續(xù)學習模型的實用性。
本發(fā)明授權(quán)可持續(xù)學習模型的訓練方法、裝置、設(shè)備及存儲介質(zhì)在權(quán)利要求書中公布了:1.一種可持續(xù)學習模型的訓練方法,其特征在于,所述方法包括: 基于所述可持續(xù)學習模型獲取未學習的新任務數(shù)據(jù),所述新任務數(shù)據(jù)包括多個狀態(tài)轉(zhuǎn)移信息,所述狀態(tài)轉(zhuǎn)移信息包括狀態(tài)信息、所述狀態(tài)信息對應的動作信息、所述動作信息的獎勵信息和所述動作信息對應的下一個狀態(tài)信息;其中,所述狀態(tài)信息是基于自動對話系統(tǒng)中的查詢文本確定的,所述狀態(tài)信息對應的動作信息是由所述可持續(xù)學習模型的策略網(wǎng)絡根據(jù)所述狀態(tài)信息,輸出的所述查詢文本對應的應答文本; 根據(jù)所述新任務數(shù)據(jù)獲取所述可持續(xù)學習模型的第一損失,所述第一損失用于衡量所述可持續(xù)學習模型針對所述新任務數(shù)據(jù)的預測結(jié)果與標準結(jié)果之間的差異; 基于所述可持續(xù)學習模型和已學習的舊任務數(shù)據(jù),獲取所述可持續(xù)學習模型的第二損失,所述第二損失用于衡量所述可持續(xù)學習模型針對所述舊任務數(shù)據(jù)的遺忘程度; 將所述新任務數(shù)據(jù)輸入至所述可持續(xù)學習模型的策略網(wǎng)絡中,得到第一經(jīng)驗風險和第一梯度范數(shù)懲罰;其中,所述第一經(jīng)驗風險用于指示所述策略網(wǎng)絡針對所述新任務數(shù)據(jù)的輸出結(jié)果的準確性,所述第一梯度范數(shù)懲罰用于指示所述策略網(wǎng)絡針對所述新任務數(shù)據(jù)的泛化性; 將所述舊任務數(shù)據(jù)輸入至所述策略網(wǎng)絡中,得到第二經(jīng)驗風險和第二梯度范數(shù)懲罰;其中,所述第二經(jīng)驗風險用于指示所述策略網(wǎng)絡針對所述舊任務數(shù)據(jù)的輸出結(jié)果的準確性,所述第二梯度范數(shù)懲罰用于指示所述策略網(wǎng)絡針對所述舊任務數(shù)據(jù)的泛化性; 根據(jù)所述第一經(jīng)驗風險、所述第一梯度范數(shù)懲罰、所述第二經(jīng)驗風險和所述第二梯度范數(shù)懲罰,確定第三損失,所述第三損失用于衡量所述可持續(xù)學習模型由所述舊任務數(shù)據(jù)到所述新任務數(shù)據(jù)的遷移能力; 根據(jù)所述第一損失、所述第二損失和所述第三損失,對所述可持續(xù)學習模型進行訓練。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人騰訊科技(深圳)有限公司,其通訊地址為:518057 廣東省深圳市南山區(qū)高新區(qū)科技中一路騰訊大廈35層;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。
- 興鋒閥門有限公司盧禮生獲國家專利權(quán)
- 寧波華儀寧創(chuàng)智能科技有限公司聞路紅獲國家專利權(quán)
- 達薩瑪治療公司R·O·休斯獲國家專利權(quán)
- 九號科技有限公司鄭德龍獲國家專利權(quán)
- 法雷奧凱佩科液力變矩器(南京)有限公司胡勛獲國家專利權(quán)
- 廣州恒眾車聯(lián)網(wǎng)智能電子技術(shù)有限公司杜志峰獲國家專利權(quán)
- 中石化石油工程技術(shù)服務有限公司董懷榮獲國家專利權(quán)
- 歐特克公司H·沙伊尼獲國家專利權(quán)
- 余姚市亞東塑業(yè)有限公司胡繼宗獲國家專利權(quán)
- 耐克創(chuàng)新有限合伙公司H.博伊盧獲國家專利權(quán)


熱門推薦
- 博勢股份有限公司S·萊納獲國家專利權(quán)
- 萊克電氣綠能科技(蘇州)有限公司倪祖根獲國家專利權(quán)
- 松下電器(美國)知識產(chǎn)權(quán)公司海上勇二獲國家專利權(quán)
- 華北水利水電大學劉明瀟獲國家專利權(quán)
- 西門子股份公司R·弗蘭克獲國家專利權(quán)
- 京東方科技集團股份有限公司劉瀚文獲國家專利權(quán)
- 自然資源實物地質(zhì)資料中心蘇桂芬獲國家專利權(quán)
- 蘋果公司J·C·迪方佐獲國家專利權(quán)
- 達爾嘉(廣州)標識設(shè)備有限公司陳國明獲國家專利權(quán)
- 中石化石油工程技術(shù)服務有限公司任紅偉獲國家專利權(quán)