南京信息工程大學任慕成獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京信息工程大學申請的專利一種實現國際疾病分類的自動編碼方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120493868B 。
龍圖騰網通過國家知識產權局官網在2025-09-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510970254.4,技術領域涉及:G06F40/126;該發明授權一種實現國際疾病分類的自動編碼方法是由任慕成;諶赫;嚴宇辰;曾嫻;徐軍設計研發完成,并于2025-07-15向國家知識產權局提交的專利申請。
本一種實現國際疾病分類的自動編碼方法在說明書摘要公布了:本發明公開了一種實現國際疾病分類的自動編碼方法,從醫療數據庫中獲取電子病歷數據,并對數據進行初步清洗;提取電子病歷文本,與醫生診斷的ICD編碼關聯,構建訓練數據集;構建多元知識庫,包括UMLS同義詞庫、非結構化知識庫和利用LLM生成輔助知識庫;構建ICD編碼模型,包括上下文編碼模塊、輔助知識篩選模塊、多重注意力交互模塊以及融合預測模塊;采用二元交叉熵損失函數優化ICD編碼模型,實現國際疾病分類的自動編碼。本發明能有效捕捉文本與代碼之間的多層次語義交互,提高對復雜文本不同層次語義信息的區分能力和編碼精度;能夠更準確地提取關鍵信息,提升復雜病例和模糊診斷場景下的編碼質量。
本發明授權一種實現國際疾病分類的自動編碼方法在權利要求書中公布了:1.一種實現國際疾病分類的自動編碼方法,其特征在于,包括以下步驟: (1)從醫療數據庫中獲取電子病歷數據,并對數據進行初步清洗; (2)提取電子病歷文本,與醫生診斷的ICD編碼關聯,構建訓練數據集; (3)構建多元知識庫,包括UMLS同義詞庫、非結構化知識庫和利用LLM生成輔助知識庫; (4)構建ICD編碼模型,包括上下文編碼模塊、輔助知識篩選模塊、多重注意力交互模塊以及融合預測模塊; (5)采用二元交叉熵損失函數優化ICD編碼模型,輸出每個ICD編碼的概率,實現對電子病歷文本的ICD編碼自動預測; 步驟(4)所述多重注意力交互模塊由標簽注意力機制以及交叉注意力機制組成; 標簽自注意力是建模ICD編碼之間的全局依賴關系,解決長尾分布中低頻標簽語義稀疏的問題;輸入為臨床文本的上下文表示和標簽嵌入L;通過線性變換將映射為查詢向量Q,鍵向量K直接采用本身,值向量V則為的原始語義表示;注意力權重α通過非線性激活函數tanh與softmax計算生成: ; 其中,,為可訓練參數;接下來,通過將α應用于上下文表示,計算出特定于標簽的上下文表示,而文檔級別的特定于標簽的表示是通過對每個塊的輸出進行線性變換并匯總后來生成的: ; 其中,是一個可學習的權重矩陣,C是塊的總數; 交叉注意力機制包括標簽-上下文交叉注意力和知識-上下文交叉注意力,其中,標簽-上下文交叉注意力旨在對齊ICD編碼與臨床文本的細粒度語義,精準定位與診斷代碼相關的關鍵文本片段;知識-上下文交叉注意力通過引入外部多源知識,填補臨床文本與診斷代碼間的語義鴻溝; 所述標簽-上下文交叉注意力輸入為標簽嵌入L和臨床文本表示;查詢向量Q直接采用L,表示標簽的語義需求;鍵K與值V均來自,表示文本的上下文特征;通過縮放點積注意力計算交互表示: ; 其中,是一個可學習的權重矩陣,C是塊的總數;輸出中,每個標簽向量聚合了與其語義最相關的文本片段; 所述知識-上下文交叉注意力通過引入外部多源知識輸入為篩選后的知識表示,M為知識條目數,d代表模型隱藏層維度;為臨床文本表示,查詢Q采用,表示外部知識的語義需求;鍵K為,值V為知識向量的平均池化結果,以聚合全局知識語義,注意力計算如下: ; 其中,CA代表交叉注意力機制,最后輸出將外部知識語義注入文本表示中。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京信息工程大學,其通訊地址為:210044 江蘇省南京市江北新區寧六路219號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。