北京藍太平洋科技股份有限公司請求不公布姓名獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京藍太平洋科技股份有限公司申請的專利一種文本錯別字檢測方法和設備獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115759076B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111627033.5,技術領域涉及:G06F40/289;該發明授權一種文本錯別字檢測方法和設備是由請求不公布姓名設計研發完成,并于2021-12-28向國家知識產權局提交的專利申請。
本一種文本錯別字檢測方法和設備在說明書摘要公布了:本發明公開了一種文本錯別字檢測方法,包括:讀取目標文本,將目標文本輸入至預先訓練完成的分詞模型,并輸出分詞結果,分詞結果包括多個詞項;將每一詞項分別在文本庫中進行組詞查找匹配,以檢測當前詞項是否為錯別詞項;若是,基于最小編輯距離算法模型分別構建錯別詞項與多個目標詞項之間的多個距離矩陣,根據每一距離矩陣計算每一目標詞項與錯別詞項之間的操作成本,并根據操作成本對所述錯別詞項進行糾錯。本發明可以對目標文本中的錯別字,例如拼寫錯誤或語法錯誤進行自動檢測,并在檢測到錯別詞項后自動對該錯別詞項進行糾錯,提高了文本編輯效率。
本發明授權一種文本錯別字檢測方法和設備在權利要求書中公布了:1.一種文本錯別字檢測方法,其特征在于,包括: 讀取目標文本,將所述目標文本輸入至預先訓練完成的分詞模型,并輸出分詞結果,所述分詞結果包括多個詞項; 將每一詞項分別在文本庫中進行組詞查找匹配,以檢測當前詞項是否為錯別詞項,包括: 將每一詞項分別與其前向詞項和后向詞項進行組詞,對應生成第一前向詞組和第一后向詞組; 在文本庫中查找是否存在與所述第一前向詞組和所述第一后向詞組匹配的詞組,若所述文本庫中所述第一前向詞組和所述第一后向詞組同時存在,則當前詞項為非錯別詞項,若所述文本庫中所述第一前向詞組或所述第一后向詞組存在,則當前詞項為疑似錯別詞項,若所述文本庫中所述第一前向詞組或所述第一后向詞組均不存在,則當前詞項為錯別詞項; 若是,基于最小編輯距離算法模型分別構建所述錯別詞項與多個目標詞項之間的多個距離矩陣,根據每一距離矩陣計算每一目標詞項與所述錯別詞項之間的操作成本,并根據操作成本對所述錯別詞項進行糾錯,包括: 基于最小編輯距離算法分別構建錯別詞項與多個目標詞項之間的距離矩陣,所述距離矩陣的計算公式如下: 其中,表示第i行第j列的距離矩陣,表示第i-1行第j列的距離矩陣,表示刪除操作成本,表示第i行第j-1列的距離矩陣,表示插入操作成本,表示第i-1行第j-1列的距離矩陣,表示替換操作成本,表示錯別詞項在第i行的字符數據,表示某一目標詞項在第j列的字符數據; 按照操作成本由低到高的順序,將每一目標詞項分別與所述錯別詞項的前向詞項和后向詞項進行組詞,得到第二前向詞組和第二后向詞組,直到某一第二前向詞組和對應的第二后向詞組在文本庫中同時存在時,得到所述錯別詞項的正確詞項。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京藍太平洋科技股份有限公司,其通訊地址為:100000 北京市海淀區唐家嶺村南2幢樓房一層8135號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。