靈犀量子(北京)醫(yī)療科技有限公司劉鵬獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉靈犀量子(北京)醫(yī)療科技有限公司申請的專利文檔數(shù)據(jù)清洗方法、系統(tǒng)、電子設備、存儲介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN114708134B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-23發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202210255573.3,技術(shù)領域涉及:G06T1/00;該發(fā)明授權(quán)文檔數(shù)據(jù)清洗方法、系統(tǒng)、電子設備、存儲介質(zhì)是由劉鵬;王則遠設計研發(fā)完成,并于2022-03-15向國家知識產(chǎn)權(quán)局提交的專利申請。
本文檔數(shù)據(jù)清洗方法、系統(tǒng)、電子設備、存儲介質(zhì)在說明書摘要公布了:本發(fā)明提供一種文檔數(shù)據(jù)清洗方法、系統(tǒng)、電子設備、存儲介質(zhì),所述方法包括:獲取待清洗的文檔的圖像版本,將文檔的圖像版本拆分為多個示例;將示例轉(zhuǎn)化為圖像向量,并與預置的樣本圖像向量比較,判斷示例是否需要去除;去除需要去除的示例,拼接剩余的示例,獲得清洗后的文檔。本發(fā)明可以對大多數(shù)各種形式的圖像版本的文獻進行清洗,大大數(shù)據(jù)清洗的成本,提高數(shù)據(jù)生產(chǎn)效率。
本發(fā)明授權(quán)文檔數(shù)據(jù)清洗方法、系統(tǒng)、電子設備、存儲介質(zhì)在權(quán)利要求書中公布了:1.一種文檔數(shù)據(jù)清洗方法,其特征在于,應用于醫(yī)學PDF文獻,基于訓練過的神經(jīng)網(wǎng)絡模型實現(xiàn),通過對PDF文獻進行人工處理,將一些非關鍵信息與文獻關鍵文本內(nèi)容信息進行坐標標記分類,分為非關鍵信息與關鍵信息兩類,用做神經(jīng)網(wǎng)絡模型的訓練集數(shù)據(jù),神經(jīng)網(wǎng)絡模型中將每張圖像拆分多個圖像塊,每個圖像塊進一步拆分為多個示例,示例是指的比圖像塊更細粒度的、構(gòu)成圖像塊的單元,所述方法包括: 獲取待清洗的文檔的圖像版本,將文檔的圖像版本拆分為多個示例; 將示例轉(zhuǎn)化為圖像向量,并與預置的樣本圖像向量比較,判斷示例是否需要去除; 去除需要去除的示例,拼接剩余的示例,獲得清洗后的文檔; 示例通過圖像塊按照預定規(guī)則得來,各個示例之間因而存在基于預定規(guī)則的連接或者映射關系,通過神經(jīng)網(wǎng)絡進行編碼,該編碼發(fā)力于全局,去除需要去除的示例后,進行編碼的逆向操作,恢復示例之間的映射關系,完成拼接,獲取清洗后的文檔; 所述將文檔的圖像版本拆分為多個示例,包括: 基于多示例學習,將文檔的圖像版本拆分為多個多示例包; 其中,每個多示例包含有多個沒有分類標簽的示例; 所述將示例轉(zhuǎn)化為圖像向量,包括: 基于Transformer網(wǎng)絡,先將示例拆分形成序列,再對序列進行編碼,形成與示例對應的圖像向量; 神經(jīng)網(wǎng)絡模型中采用Transformer網(wǎng)絡結(jié)合多示例學習分類器的多示例包,將多示例包的每個示例進一步拆分并形成embedding序列,形成類似NLP中的tokens,利用Transformer網(wǎng)絡編碼,編碼發(fā)力于局域,相應的映射形成示例轉(zhuǎn)化的圖像向量。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人靈犀量子(北京)醫(yī)療科技有限公司,其通訊地址為:100161 北京市豐臺區(qū)南四環(huán)西路186號四區(qū)5號樓5層09室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。
- 三星顯示有限公司吳彥錫獲國家專利權(quán)
- 中國煤炭科工集團太原研究院有限公司王麗威獲國家專利權(quán)
- 株式會社村田制作所西村俊雄獲國家專利權(quán)
- 任紹東獲國家專利權(quán)
- 廣州黑馬科技有限公司馬軍獲國家專利權(quán)
- 諾基亞技術(shù)有限公司L·J·拉克索南獲國家專利權(quán)
- 昕諾飛控股有限公司L·范德爾坦佩爾獲國家專利權(quán)
- YKK株式會社藪谷徹獲國家專利權(quán)
- 廣州市婦女兒童醫(yī)療中心(廣州市婦幼保健院、廣州市兒童醫(yī)院、廣州市婦嬰醫(yī)院、廣州市婦幼保健計劃生育服務中心)王哲獲國家專利權(quán)
- 廣東福德電子有限公司黎志盈獲國家專利權(quán)