湖南工商大學彭晗獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉湖南工商大學申請的專利基于三段式GRPO強化學習的裁判文書摘要生成方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120278126B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510758056.1,技術領域涉及:G06F40/166;該發明授權基于三段式GRPO強化學習的裁判文書摘要生成方法是由彭晗;阮日青;張技權;李紫慕;張金傳;劉星寶;吳博;任劍設計研發完成,并于2025-06-09向國家知識產權局提交的專利申請。
本基于三段式GRPO強化學習的裁判文書摘要生成方法在說明書摘要公布了:本發明實施例中提供了一種基于三段式GRPO強化學習的裁判文書摘要生成方法,屬于數據處理技術領域,具體包括:步驟1,建模三段式思維鏈;步驟2,根據三段式思維鏈對原始裁判文書數據集進行數據蒸餾與分層,得到不同類型的數據集,其中,所述類型包括高相關性、中相關性和低相關性;步驟3,使用高相關性數據集對大語言模型進行SFT監督微調訓練;步驟4,利用全部數據集對訓練后的大語言模型進行多階段GRPO強化學習訓練,得到目標模型;步驟5,將目標裁判文書輸入目標模型,生成目標摘要。通過本發明的方案,提高了摘要生成效率、精準度和適應性。
本發明授權基于三段式GRPO強化學習的裁判文書摘要生成方法在權利要求書中公布了:1.一種基于三段式GRPO強化學習的裁判文書摘要生成方法,其特征在于,包括: 步驟1,建模三段式思維鏈; 所述步驟1具體包括: 步驟1.1,定義三段式摘要格式,其中,所述三段式摘要格式包括對案件的實體提取、分析推理和摘要生成; 步驟1.2,設定通過預定義的Prompt模板引導模型按照三段式摘要格式生成輸出內容的過程,形成三段式思維鏈; 步驟2,根據三段式思維鏈對原始裁判文書數據集進行數據蒸餾與分層,得到不同類型的數據集,其中,所述類型包括高相關性、中相關性和低相關性; 步驟3,使用高相關性數據集對大語言模型進行SFT監督微調訓練; 步驟4,利用全部數據集對訓練后的大語言模型進行多階段GRPO強化學習訓練,得到目標模型; 所述步驟4具體包括: 步驟4.1,設定多階段GRPO強化學習訓練的數據引入策略; 步驟4.2,從高相關性數據集中隨機挑選一個三段式推理鏈摘要作為上下文學習模板; 步驟4.3,設定格式獎勵、語言流暢性獎勵、內容準確性獎勵和上下文相似性獎勵,據此形成總獎勵; 步驟4.4,利用上下文學習模板生成原始裁判文書數據集中的每個裁判文書對應的多個候選摘要; 步驟4.5,根據總獎勵計算每個候選摘要的相對獎勵; 步驟4.6,基于相對獎勵和數據引入策略,通過策略梯度優化大語言模型,得到目標模型; 步驟5,將目標裁判文書輸入目標模型,生成目標摘要。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人湖南工商大學,其通訊地址為:410205 湖南省長沙市岳麓區岳麓大道569號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。