數據空間研究院朱仁兵獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉數據空間研究院申請的專利一種基于LLM多表自適應選擇的NL2SQL方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117112732B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311096482.0,技術領域涉及:G06F16/242;該發明授權一種基于LLM多表自適應選擇的NL2SQL方法是由朱仁兵;周銳;王佐成設計研發完成,并于2023-08-29向國家知識產權局提交的專利申請。
本一種基于LLM多表自適應選擇的NL2SQL方法在說明書摘要公布了:本發明涉及自然語言處理技術領域,具體是一種基于LLM多表自適應選擇的NL2SQL方法,本發明包括以下操作步驟:提取參與查詢的原始數據庫中的代表字段信息,以代表字段信息的內容構建數據知識庫;從輸入大模型中自然語言語句中抽取實體信息和時間信息;對實體信息與代表字段信息進行模糊匹配查詢,通過匹配查詢結果獲取實體信息在數據知識庫中對應的庫表信息;將從自然語言語句中抽取的實體信息和時間信息連同庫表信息一同輸入大模型中,以得到帶時間消息的SQL語句和不帶時間的SQL語句;通過時間信息和字段信息對生成的SQL語句進行校正;本發明實現了多表自適應選擇,提高了SQL生成的正確率,進而滿足通用業務應用的實踐要求。
本發明授權一種基于LLM多表自適應選擇的NL2SQL方法在權利要求書中公布了:1.一種基于LLM多表自適應選擇的NL2SQL方法,其特征在于,包括以下操作步驟: S1、構建數據知識庫:提取參與查詢的原始數據庫中的代表字段信息,以代表字段信息的內容構建數據知識庫; S2、語義分析處理:從輸入大模型的自然語言語句中抽取實體信息和時間信息,并通過正則化的方式將時間信息轉化為SQL語句; S3、數據庫表選擇:對實體信息與代表字段信息進行模糊匹配查詢,通過匹配查詢結果獲取實體信息在數據知識庫中對應的庫表信息; S4、大模型生成SQL語句:將從自然語言語句中抽取的實體信息和時間信息連同庫表信息一同輸入大模型中,以得到帶時間信息的SQL語句和不帶時間信息的SQL語句; S5、SQL語句校正:通過時間信息和字段信息對生成的SQL語句進行校正; SQL語句校正的具體步驟如下: S51、對比帶時間信息的SQL語句和不帶時間信息的SQL語句,定位出帶時間信息的SQL語句中的時間字段; S52、驗證大模型生成的帶時間信息的SQL語句與規則解析的時間SQL語句的執行結果是否相同;若執行結果相同,則以帶時間信息的SQL語句作為對應自然語言生成的時間校正SQL語句;若執行結果不同,則以不帶時間信息的SQL語句加上規則轉換的時間SQL語句作為對應自然語言生成的時間校正SQL語句; S53、接著對大模型生成的時間校正SQL語句中的字段信息與數據知識庫中對應的字段消息進行對比;若兩個字段信息保持一致,則以時間校正SQL語句作為最終的SQL語句;若兩個字段信息不能保持一致,則以相似度檢索匹配的字段信息替換時間校正SQL語句中的字段消息,并以字段信息替換后的時間校正SQL語句作為最終的SQL語句。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人數據空間研究院,其通訊地址為:231200 安徽省合肥市高新區柏堰科技園創新大道288號工投高新智谷B區;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。