北京卅三智慧教育科技有限公司何光華獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京卅三智慧教育科技有限公司申請的專利模型優化器、多跳問答模型訓練、多跳問答方法和裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119940554B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510110558.3,技術領域涉及:G06N5/04;該發明授權模型優化器、多跳問答模型訓練、多跳問答方法和裝置是由何光華;肖何;李思思設計研發完成,并于2025-01-23向國家知識產權局提交的專利申請。
本模型優化器、多跳問答模型訓練、多跳問答方法和裝置在說明書摘要公布了:本公開提供了一種模型優化器、多跳問答模型訓練方法和裝置、多跳問答方法和裝置、電子設備以及計算機可讀存儲介質,涉及數據處理技術領域,尤其涉及深度學習、自然語言處理等技術領域。具體實現方案為:模型優化器包括:模型推理框架,用于獲取模型的模型參數,并計算損失函數關于所述模型參數的梯度;哈密頓方程模塊,用于基于所述梯度和哈密頓方程,得到動量;辛積分器,用于基于動量,通過辛積分算法得到更新模型參數,并維持模型的推理路徑的幾何結構;函數優化模塊,用于最小化所述推理路徑的曲率和扭曲度。
本發明授權模型優化器、多跳問答模型訓練、多跳問答方法和裝置在權利要求書中公布了:1.一種多跳問答模型訓練方法,所述方法包括: 獲取訓練數據集,所述訓練數據集包括至少一個訓練數據,所述訓練數據包括:問題、答案以及至少一個相關事實信息,所述相關事實信息是指在多跳問答任務中用于推理和回答問題的至少兩個相關事實文本,所述問題和所述答案均為文本; 獲取多跳問答網絡; 將所述訓練數據集中的訓練數據輸入所述多跳問答網絡,得到所述多跳問答網絡輸出的結果; 基于模型優化器和每次所述多跳問答網絡輸出的結果,訓練所述多跳問答網絡,得到訓練完成的多跳問答網絡,所述模型優化器用于調整所述多跳問答網絡的模型參數; 所述模型優化器包括:模型推理框架,用于獲取模型的模型參數,并計算損失函數關于所述模型參數的梯度;哈密頓方程模塊,用于基于所述梯度和哈密頓方程,得到動量,所述動量用于表征連續模型參數之間推理的變化;辛積分器,用于基于所述動量,通過辛積分算法得到更新模型參數,并維持所述模型參數得到所述更新模型參數時推理路徑的幾何結構;函數優化模塊,用于最小化所述推理路徑的曲率和扭曲度; 所述辛積分器采用哈密頓量算法得到更新模型參數,所述哈密頓量算法包括:第一子算法和第二子算法之間的差,其中,所述第一子算法為改變模型參數的認知努力的算法,所述第二子算法為模型參數的相關性的算法,所述動量與所述第一子算法相關。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京卅三智慧教育科技有限公司,其通訊地址為:100080 北京市海淀區新中關購物中心B座北翼701;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。