創意信息技術股份有限公司陳磊獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉創意信息技術股份有限公司申請的專利基于ANTLR語法解析的大語言模型JSON輸出修復方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120509399B 。
龍圖騰網通過國家知識產權局官網在2025-09-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202511015528.0,技術領域涉及:G06F40/205;該發明授權基于ANTLR語法解析的大語言模型JSON輸出修復方法及系統是由陳磊;覃進千;任勇;張忠祥設計研發完成,并于2025-07-23向國家知識產權局提交的專利申請。
本基于ANTLR語法解析的大語言模型JSON輸出修復方法及系統在說明書摘要公布了:本發明提供了基于ANTLR語法解析的大語言模型JSON輸出修復方法及系統,屬于模型修復技術領域。方法對模型的原始輸出文本進行預處理,得到待修復JSON文本;構建容錯語法規則,并依據容錯語法規則生成JSON語法解析器;將待修復JSON文本輸入解析器,采用漸進式語法匹配策略分階段進行語法解析,并通過解析上下文跟蹤機制定位語法解析異常的錯誤節點位置坐標和錯誤類型;在依據錯誤節點位置坐標和錯誤類型,采用分層修復策略對文本進行上下文感知修復,得到已修復JSON文本;利用多層驗證機制對已修復JSON文本進行多層驗證,并在多層驗證通過后輸出。本發明提高了JSON輸出修復過程中的錯誤分類準確率和錯誤定位精度,進而提升了大語言模型JSON輸出的修復成功率。
本發明授權基于ANTLR語法解析的大語言模型JSON輸出修復方法及系統在權利要求書中公布了:1.一種基于ANTLR語法解析的大語言模型JSON輸出修復方法,其特征在于,包括: 獲取大語言模型的原始輸出文本,并對原始輸出文件進行文本預處理,得到待修復JSON文本; 構建容錯語法規則,并依據容錯語法規則,通過ANTLR工具生成JSON語法解析器,包括:定義包含標準JSON語法規則層和容錯JSON語法規則層的雙層語法規則體系;其中,標準JSON語法規則層包含符合JSONBNF規范的標準語法規則集合,容錯JSON語法規則層包含針對格式異常的擴展容錯語法規則集合;計算標準語法規則的匹配優先級P_STD和容錯語法規則的匹配優先級P_TOL;根據匹配優先級P_STD和匹配優先級P_TOL設置語法解析的優先級匹配策略;其中,所述語法解析的優先級匹配策略具體為:先通過標準JSON語法規則層進行標準語法匹配,若標準語法匹配成功,則直接返回標準語法匹配結果;若標準語法匹配失敗,則啟用容錯JSON語法規則層進行容錯語法匹配,并在標準JSON語法規則層與標準JSON語法規則層的解析成功率之差的絕對值小于標準JSON語法規則層與標準JSON語法規則層的解析精確度平均值的一半時,返回容錯語法匹配結果;將雙層語法規則體系和語法解析的優先級匹配策略輸入ANTLR工具,生成JSON語法解析器; 將待修復JSON文本輸入JSON語法解析器,采用漸進式語法匹配策略分階段進行語法解析,并建立基于有限狀態自動機的解析上下文跟蹤機制,通過解析上下文跟蹤機制定位語法解析異常的錯誤節點位置坐標和錯誤類型;所述采用漸進式語法匹配策略分階段進行語法解析,包括:定義JSON語法解析器的三個語法匹配階段,并設置每個語法匹配階段的匹配成功條件和階段轉換條件;其中,三個語法匹配階段分別為嚴格匹配階段S1、容錯匹配階段S2、兜底匹配階段S3;每個語法匹配階段的匹配成功條件具體為:S1階段,語法規則完全匹配且無任何格式偏差;S2階段,語法規則部分匹配,但存在可容忍的格式異常;S3階段,即使存在嚴重語法錯誤,也保留最大化的結構信息;階段轉換條件具體為:當標準語法解析失敗且錯誤類型屬于可容錯范圍時,由S1階段轉換為S2階段;當容錯語法解析失敗但仍可提取部分結構信息時,由S2階段轉換為S3階段;依據語法匹配階段的匹配成功條件和階段轉換條件分階段,通過JSON語法解析器分階段對待修復JSON文本進行漸進式解析; 依據錯誤節點位置坐標和錯誤類型,采用分層修復策略對待修復JSON文本進行上下文感知修復,得到已修復JSON文本;所述分層修復策略包括語法修復、結構修復和語義修復;所述依據錯誤節點位置坐標和錯誤類型,采用分層修復策略對待修復JSON文本進行上下文感知修復,得到已修復JSON文本,包括: 基于錯誤節點位置坐標在待修復JSON文本中定位到出現語法異常錯誤的文本位置;基于上下文感知修復算法,依據錯誤類型和對應的錯誤嚴重級別確定修復順序,并選取對應的分層策略構建修復方案,按照修復方案對待修復JSON文本的語法異常錯誤進行上下文感知修復,輸出已修復JSON文本;當按照當前修復方案修復語法異常錯誤失敗時,記錄修復失敗原因,并回退至修復前狀態,按照修復順序選擇新的修復方案進行語法異常錯誤修復,直至語法異常錯誤修復成功;計算每種修復方案的置信度評分,選取置信度評分最高的修復方案對應的修復文本作為已修復JSON文本; 利用多層驗證機制對已修復JSON文本進行多層驗證,并在多層驗證通過后,輸出已修復JSON文本。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人創意信息技術股份有限公司,其通訊地址為:610000 四川省成都市青羊區紅星路一段86號1棟222號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。