四川大學徐修遠獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉四川大學申請的專利基于大語言模型的臨床信息提取方法、系統、設備及介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120448551B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510940165.5,技術領域涉及:G06F16/353;該發明授權基于大語言模型的臨床信息提取方法、系統、設備及介質是由徐修遠;王成弟;黃格婷;谷宇;張紀龍;王雪設計研發完成,并于2025-07-09向國家知識產權局提交的專利申請。
本基于大語言模型的臨床信息提取方法、系統、設備及介質在說明書摘要公布了:本發明公開了一種基于大語言模型的臨床信息提取方法、系統、設備及介質,屬于人工智能技術領域中的臨床信息提取,其目的在于解決現有技術中對醫學文本的信息提取準確性低的技術問題。其包括:收集醫學臨床樣本信息及標簽數據;利用無標簽數據的醫學臨床樣本信息對信息提取大語言模型進行自監督訓練;利用有標簽數據的醫學臨床樣本信息對信息提取大語言模型進行預訓練;獲取待提取的臨床文本,并輸入信息提取大語言模型進行信息提取,信息提取大語言模型輸出信息提取結果。大模型結合逆向提示機制和信息提取獎勵兩種獎勵機制形成強化學習框架,使得模型能夠生成更符合上下文和指示性的提示,提高了信息提取的準確性和泛華性,臨床信息的提取準確性更高。
本發明授權基于大語言模型的臨床信息提取方法、系統、設備及介質在權利要求書中公布了:1.一種基于大語言模型的臨床信息提取方法,其特征在于,包括以下步驟: 步驟1,收集醫學臨床樣本信息及標簽數據; 收集醫學臨床樣本信息得到數據集,對數據集中的部分醫學臨床樣本信息進行信息提取標注,得到標簽數據;利用數據集中無標簽數據的醫學臨床樣本信息對信息提取大語言模型進行自監督訓練; 步驟2,信息提取大語言模型預訓練; 利用數據集中有標簽數據的醫學臨床樣本信息對信息提取大語言模型進行預訓練,使信息提取大語言模型具有根據臨床文本產生信息提取提示、根據產生的信息提取提示進行信息提取的能力; 步驟3,信息提取; 獲取待提取的臨床文本,并將待提取的臨床文本輸入信息提取大語言模型進行信息提取,信息提取大語言模型輸出信息提取結果; 其中,步驟2中,在預訓練信息提取大語言模型時,包括進行基于逆向提示機制和信息提取獎勵的強化學習預訓練,具體為: 步驟2-1-1,數據集中的醫學臨床樣本信息輸入信息提取大語言模型,生成信息提取提示; 步驟2-1-2,將步驟2-1-1生成的信息提取提示輸入信息提取大語言模型,信息提取大語言模型利用逆向提示機制生成恢復的上下文,并使用語義相似度評估恢復質量; 步驟2-1-3,將步驟2-1-1生成的信息提取提示輸入信息提取大語言模型,信息提取大語言模型根據信息提取獎勵機制生成相應的答案,并使用COR得分作為問題問答的獎勵; 步驟2-1-4,根據語義相似度和COR得分,計算每個信息提取提示的綜合得分,得到綜合得分集合,,其中表示第j個信息提取提示,表示第j個信息提取提示的綜合得分,表示提示的集合; 步驟2-1-5,從綜合得分集合中選出得分最高和最底的提示對,并將提示對與對應的輸入結合,構建偏好數據集; 步驟2-1-6,使用PPO算法并根據語義相似度、COR得分優化信息提取大語言模型中的參數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人四川大學,其通訊地址為:610065 四川省成都市武侯區一環路南一段24號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。