淮陰工學院馮萬利獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉淮陰工學院申請的專利面向施工圖審查規范知識抽取與知識圖譜構建方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115905553B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211263033.6,技術領域涉及:G06F16/36;該發明授權面向施工圖審查規范知識抽取與知識圖譜構建方法及系統是由馮萬利;劉小貝;弭云國;王云鵬設計研發完成,并于2022-10-14向國家知識產權局提交的專利申請。
本面向施工圖審查規范知識抽取與知識圖譜構建方法及系統在說明書摘要公布了:本發明公開了一種面向施工圖審查規范知識抽取與知識圖譜構建方法及系統,對施工圖審查規范的內容進行規范預處理和數據標注,獲取標注的數據集Data,基于GlobalPointer的實體關系聯合抽取的模型,得到施工圖審查規范實體關系聯合抽取訓練模型Model;將驗證集輸入Model;經稀疏多標簽交叉熵解碼并進行實體屬性關系識別抽取,預測施工圖審查規范中的三元組;并將其轉換到Neo4j圖數據庫中,完成施工規范知識的存儲工作,構建施工圖審查規范知識圖譜;提取審查模型數據并與知識圖譜匹配,對待審查的BIM施工圖文件數據提取解析,完成匹配內容轉化為三維可視的智能化審圖結果。本發明可有效實現了非結構化文本實體關系聯合抽取、被審施工圖的智能化審圖,提升施工圖智能化審圖水平。
本發明授權面向施工圖審查規范知識抽取與知識圖譜構建方法及系統在權利要求書中公布了:1.一種面向施工圖審查規范知識抽取與知識圖譜構建方法,其特征在于,包括如下步驟: S1、對施工圖審查規范的內容進行規范預處理和使用Colabeler標注工具,形成帶標簽的文本數據,獲取標注的數據集Data;并把Data劃分為訓練集train_data和驗證集dev_data; S2、使用訓練集train_data訓練使用預訓練模型BERT的基于GlobalPointer的實體關系聯合抽取的模型,得到施工圖審查規范實體關系聯合抽取訓練模型Model; S3、將驗證集中的單句輸入Model模型,經過打分函數得到每個單句實體關系屬性;利用稀疏多標簽交叉熵解碼進行實體屬性關系識別抽取,預測出關系三元組;得到施工圖審查規范實體屬性關系聯合抽取模型Model; S4、采用知識存儲映射算法將其三元組轉換到Neo4j圖數據庫中,完成施工規范知識的存儲工作,構建施工圖審查規范知識圖譜; S5、提取審查模型數據并與知識圖譜匹配,對待審查的BIM施工圖文件數據提取解析,完成匹配內容轉化為三維可視的智能化審圖結果; 所述步驟S2具體包括: S2.1、建立基于GlobalPointer的實體關系聯合抽取的模型,所述基于GlobalPointer的實體關系聯合抽取的模型的輸入為單句,輸出為三元組; 所述基于GlobalPointer的實體關系聯合抽取的模型首先對輸入的每條有效數據中的文本內容text進行分詞編碼,得到token_ids,segment_ids;token_ids列表: token_ids=[X'1,X'2,X'3,...,X'n-1,X'n] 將三元組列表spo_list中的每個三元組中的實體文本subject及實體文本object進行分詞編碼,得到去除第一列和最后一列的token_ids; 將subject和object的token_ids與text的token_ids進行搜索尋找頭實體第一個位置sh,頭實體的最后一個位置st,尾實體第一個位置oh,尾實體的最后一個位置ot; 根據sh,st、oh,ot、sh,oh、st,ot分別形成subject標簽、object標簽、關系頭標簽、關系尾標簽; 將token_ids與segment_ids,作為BERT模型傳入數據,得到向量序列h1,h2,...hn=BERTx1,x2,...xn; BERT的輸出為[batch_size,maxlength,hidden_size],并作為GlobalPointer的輸入; GlobalPointer第一步經過全連接層把BERT的輸出向量轉換為[batch_size,maxlength,head_size*2*heads],其中heads代表實體類型的數量;head_size代表指針對于每個heads所需的線性變換的輸出維度; 通過兩個前饋層,依賴于跨度的開始和結束索引,來計算跨度表示:qi,ɑ=Wq,ɑhi+bq,ɑ;ki,ɑ=Wk,ɑhi+bk,ɑ,得到序列向量序列[q1,ɑ,q2,ɑ,....,qn,ɑ]和[k1,ɑ,k2,ɑ,...,kn,ɑ];其中對于類型ɑ的跨度S[i:j],開始和結束位置表示是qi,ɑ和ki,ɑ,i和j分別為頭索引和尾索引; 將相對位置信息顯式注入模型,ROPE位置編碼應用到實體表示中,滿足對于類型ɑ的跨度S[i:j]打分函數Sɑi,j為: 將BERT的輸出進入GlobalPointer,使heads=2,Ssh,st、Soh,ot分別是subject、object的首尾打分,通過Ssh,st0和Soh,ot0來識別出所有的subject和object,完成NER任務; 將BERT的輸出進入GlobalPointer,使heads等于關系類別數,根據sh,oh得出實體的頭部關系; 將BERT的輸出進入GlobalPointer,使heads等于關系類別數,根據st,ot得出實體的尾部關系; S2.2、將訓練集劃分為多個批次,采用每個批次訓練基于GlobalPointer的實體關系聯合抽取的模型參數,得到訓練模型Model;通過降低損失函數來優化,損失函數為: 其中N為訓練樣本負類別的集合。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人淮陰工學院,其通訊地址為:223003 江蘇省淮安市經濟技術開發區枚乘東路1號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。