中國電建集團貴州電力設計研究院有限公司;國網經濟技術研究院有限公司;上海交通大學;國網浙江省電力有限公司經濟技術研究院楊立獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中國電建集團貴州電力設計研究院有限公司;國網經濟技術研究院有限公司;上海交通大學;國網浙江省電力有限公司經濟技術研究院申請的專利自然語言查詢智能變電站SCD文件的方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114168615B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111496011.X,技術領域涉及:G06F16/242;該發明授權自然語言查詢智能變電站SCD文件的方法及系統是由楊立;周青媛;楊娟;袁兆祥;韓柳;吳聰穎;宋元斌;吳冰;張文軍;時云洪;銀濤;楊道錦;劉羽峰;閆培麗;肖智宏;馮騰;劉文軒;曹金浩;謝小鵬;晁岱峰;艾青;王輝;劉偉軍;黃江倩設計研發完成,并于2021-12-08向國家知識產權局提交的專利申請。
本自然語言查詢智能變電站SCD文件的方法及系統在說明書摘要公布了:本發明提供了一種自然語言查詢智能變電站二次系統SCD文件的方法及系統,包括:將SCD文件導入圖數據庫;獲取輸入圖數據庫的自然語言查詢語句,經過知識圖譜修正得到建議問句,在所述建議問句中補充省略屬性,將專業術語同義詞替換為標準參考詞;對經過修正的所述自然語言查詢語句進行多關系語義信息提取,得到的多關系語義信息表示為語義三元組,將語義三元組轉化為Cypher代碼段,利用組裝模板將Cypher代碼段拼裝成Cypher查詢語句;利用Cypher查詢語句在所述圖數據庫查詢相應SCD文件中的內容。本發明可以減輕初學者查詢SCD數據的難度,為探索性學習SCL語言和SCD文件的結構提供更加自然、友好的支持。
本發明授權自然語言查詢智能變電站SCD文件的方法及系統在權利要求書中公布了:1.一種自然語言查詢智能變電站SCD文件的方法,其特征在于,包括: 導入步驟:將SCD文件導入圖數據庫; 信息補足步驟:獲取輸入圖數據庫的自然語言查詢語句,經過知識圖譜修正得到建議問句,在所述建議問句中補充省略屬性,將專業術語同義詞替換為標準參考詞; 語義信息提取步驟:對經過修正的所述自然語言查詢語句進行多關系語義信息提取,將得到的多關系語義信息表示為語義三元組; 轉化步驟:根據語義三元組得到通用問句,根據所述通用問句從已有的組裝模板數據庫中查詢相應的組裝模板,將語義三元組轉化為Cypher代碼段,同時,根據語義三元組中主體、謂詞、客體之間的關系得到相應的通用問句,根據通用問句從已有的組裝模板數據庫中查詢相應的組裝模板,利用根據語義三元組查詢得到的組裝模板將Cypher代碼段組裝為圖數據庫的Cypher查詢語句; 查詢步驟:利用所述Cypher查詢語句在所述圖數據庫查詢相應SCD文件中的內容; 所述信息提取步驟包括: 計算經過修正的所述自然語言查詢語句中字符的字符向量; 對每個字符的上下文特征進行評估,得到字符之間的語言或語義關系; 根據上下文特征來識別所有主語,并識別每個主語關聯的賓語及謂語,得到語義三元組; 所述轉化步驟包括: 根據得到所述Cypher查詢語句的一組語義三元組選擇組裝所述Cypher代碼段的所述組裝模板; 經過知識圖譜修正得到建議問句包括:查找屬性K[1]為值V[1]并且或者…屬性K[n]為值V[n]的節點m的相關節點n的屬性L[1]…和屬性L[n]; 所述語義信息提取步驟借助BiLSTM模型,抽取出規范文本的上下文特征ht,對BiLSTM模型輸出的隱狀態進行最大池化,從而得到語句特征g,最后,將規范文本的上下文特征ht與語句特征g進行拼接,形成任務共享特征[ht;g]; 對每個待處理的句子,先抽取出規范文本中的所有候選主體,然后依據每一個候選主體的語義信息,抽取所述候選主體對應的客體和語義關系,將候選主體的抽取問題、客體和語義關系的抽取問題均建模為序列標注任務,指針標注結構通過提供一個起始位置指針和終止位置指針在文本中分割片段; 主體抽取器在接收任務共享特征后,首先使用BiLSTM模型從任務共享特征中抽取任務特定的特征,然后,使用了兩個多頭自注意力模型分別學習主體的起始位置特征和終止位置特征; 選取縮放點積模型作為注意力打分函數,記為BiLSTM層輸出的任務特定特征,那么在自注意力機制中,查詢矩陣Q、鍵矩陣K和值矩陣V的關系為Q=K=V=hse,注意力函數表示為下式: 其中d表示BiLSTM層輸出的隱狀態維度,等于2dh; 假設多頭自注意力機制包含m個頭,那么第i個注意力頭由下式表示: 其中,是待訓練的投影參數,dk=2dhm,多頭自注意力機制的最終結果由各個注意力頭拼接而成: 其中為待訓練參數; 之后,多頭自注意力機制的輸出被輸入到一個帶有Softmax激活函數的全連接層,在每一個字符上生成標簽概率分布,在主體的起始位置標注過程中,字符ct的標簽計算如下式所示: 其中為訓練參數,|T|記為輸出標簽類型的數量|T|的取值為命名實體類別加1; 將第一個多頭自注意力機制的輸出hse-sta與任務特定特征hse拼接后初始化第二個多頭自注意力機制的Q、K、V參數; 記第二個多頭自注意力機制的輸出為那么在主體的終止位置標注過程中,字符ct的標簽計算如下式所示: 其中為訓練參數; 經過上述過程,主體抽取器就將候選主體的識別分解為了兩個序列標注任務,第一個序列標注任務負責識別候選主體的起始位置,若某個字符被識別為候選主體的起始字符,那么該字符對應的位置就會被標注上該主體的命名實體類型標簽,第二個序列標注任務負責識別候選主體的終止位置,其標注過程與起始位置標注過程相同; 最終,使用交叉熵衡量主體抽取器預測的概率分布與真實分布之間的損失,主體抽取器的訓練損失函數寫為: 其中,和分別為第i個字符的真實起始位置和終止位置標簽,n為設計規范文本的長度; 在獲取所有候選主體后,客體與語義關系抽取器負責針對每一個候選主體,抽取其對應的所有客體以及與主客體間的語義關系; 在客體與語義關系抽取器中,首先需要對給定的主體進行語義編碼,將給定主體所對應的任務共享特征的片段,輸入到一個LSTM模型中,LSTM模型輸出的最后一個隱狀態作為給定主體的語義編碼,將給定主體的語義編碼與任務共享特征的每一個特征向量進行拼接,得到一個新的特征矩陣,這個新的特征矩陣被認為是既攜帶了上下文特征,同時還攜帶了給定主體特征的語義編碼結果; 客體與語義關系抽取器的后續計算流程包括:第一步,將攜帶有特定主體語義信息的特征矩陣輸入到一個BiLSTM模型中,從而抽取任務特定的特征;第二步,借助兩個多頭自注意力機制以及全連接層構造兩個序列標注任務,第一個序列標注任務負責標注所有候選客體的起始位置,第二個序列標注任務負責標注所有候選客體的終止位置;與主體抽取器不同的是,一個字符若被標注為候選客體的起始位置或終止位置,其標簽不是命名實體的類型,而是給定主體與該候選客體的語義關系類型; 對于一個給定主體,客體的起始位置和終止位置標注過程中,字符ct的標簽計算分別如下所示: 其中,分別為第一個多頭自注意力機制和第二個多頭自注意力機制在時間戳t的輸出;bope-sta、以及均為訓練參數;|T'|為輸出標簽類型的數量,|T'|取值為語義關系的數量加1;最終,使用交叉熵衡量客體與語義關系抽取器預測的概率分布與真實分布之間的損失,客體與語義關系抽取器的訓練損失函數為: 其中,分別為第i個字符的真實起始位置和終止位置標簽,n為規范文本的長度; 在模型訓練階段,通過共享語義編碼器提供的任務共享特征,主體抽取器和客體與語義關系抽取器聯合訓練,在每個訓練實例中,從規范文本的標準數據集中隨機選取一個主體作為客體與語義關系抽取器的輸入,通過衡量模型預測結果與標準結果之間的差異,計算主體抽取器和客體與語義關系抽取器的損失函數值,最后將兩部分損失相加構成聯合模型最終的損失函數: 使用Adam算法對模型最終的損失函數進行優化,從而使主體抽取、客體與語義關系抽取過程中產生的誤差相互影響,每個子任務產生的誤差受到其它任務的約束,進而強化命名實體與語義關系之間的潛在相互。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國電建集團貴州電力設計研究院有限公司;國網經濟技術研究院有限公司;上海交通大學;國網浙江省電力有限公司經濟技術研究院,其通訊地址為:550081 貴州省貴陽市市轄區高新區黔靈山路357號德福中心A6棟;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。