山東產業技術研究院智能計算研究院陳益強獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉山東產業技術研究院智能計算研究院申請的專利基于偽正則表達式意圖匹配方法及智能問答系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN113610110B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202110764254.0,技術領域涉及:G06F16/3329;該發明授權基于偽正則表達式意圖匹配方法及智能問答系統是由陳益強;符建輝;楊曉東設計研發完成,并于2021-07-06向國家知識產權局提交的專利申請。
本基于偽正則表達式意圖匹配方法及智能問答系統在說明書摘要公布了:本公開提出了基于偽正則表達式意圖匹配方法及系統,包括:針對用戶咨詢訓練集進行訓練生成為偽正則表達式;接收用戶咨詢信息,對用戶的咨詢信息與偽正則表達式進行意圖匹配識別,獲得匹配的偽正則表達式,從而獲得用戶意圖。本申請方案從規則編寫到規則使用基本實現自動化,無需人工構建編寫規則,節省人力,同時人基本上接觸不到規則,便于維護。
本發明授權基于偽正則表達式意圖匹配方法及智能問答系統在權利要求書中公布了:1.基于偽正則表達式意圖匹配方法,其特征是,包括: 針對用戶咨詢訓練集進行訓練生成偽正則表達式;在訓練時,訓練集中的每個用戶咨詢通過分詞與詞集合標準名查找轉換為詞集合標準名和未識別字符序列,然后序列通過未登錄詞交互識別轉換為詞集合標準名集合序列,然后通過偽正則表達式生成偽正則表達式集合并存入數據庫; 分詞與詞集合標準名查找的過程為: 首先建立同義詞詞庫,每一組同義詞詞庫選擇一個最具代表性的詞語作為詞集合標準名; 基于詞庫對用戶咨詢進行分詞,采用逆向最大分詞逆向最大匹配的分詞模型; 獲得分詞之后通過詞語查找詞集合標準名,從而獲取到詞集合標準名組成的有序詞串; 詞集合標準名詞串用于文法生成或者偽正則表達式匹配過程; 分詞的過程中,給未登錄詞建立一個單獨的詞集合,并用未登錄詞的名稱作為詞集合標準名;通過詞語相似性計算模型獲得未登錄詞語與庫中所有詞語的相似性,推薦與其最相似的topk詞語所在的詞集合作為未登錄詞所屬的候選同義詞集合;其中,所述詞語相似性計算模型采用bert獲得詞語的向量表示,通過余弦相似度計算歐式距離來判斷詞語的相似性; 在分詞和未登錄詞識別之后,進行偽正則表達式規則的生成,規則的生成過程如下: 根據分詞結果找到每個詞語對應的的此標準集合名,如果一個詞語對應多個詞語集合標準名,標準名之間用“|”隔開; 詞集合標準名之間用“.*”連接; 查找可選詞集合標準名稱集合庫,將可選的詞集合標準名用“[]”括起來,如果一個用豎線隔開的詞集合標準名串只要有一個詞集合標準名存在于可選詞集合標準名稱集合庫,那么整個詞集合標準名串用“[]”整體括起來; 加上偽正則表達式規則的開始標識符“^”和結束標識符“$”; 偽正則表達式索引構建:建立了詞集合標準名到偽正則表達式的倒排索引結構; 接收用戶咨詢信息,對用戶的咨詢信息與偽正則表達式進行意圖匹配識別,獲得匹配的偽正則表達式,從而獲得用戶意圖。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人山東產業技術研究院智能計算研究院,其通訊地址為:250000 山東省濟南市高新區港興三路未來創業廣場3號樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。