西安電子科技大學(xué)宋勝利獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉西安電子科技大學(xué)申請的專利一種大規(guī)模圖數(shù)據(jù)高效查詢方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN116383247B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-09發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202310363981.5,技術(shù)領(lǐng)域涉及:G06F16/2453;該發(fā)明授權(quán)一種大規(guī)模圖數(shù)據(jù)高效查詢方法是由宋勝利;陶怡;楊琦;胡光能設(shè)計研發(fā)完成,并于2023-04-06向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種大規(guī)模圖數(shù)據(jù)高效查詢方法在說明書摘要公布了:本發(fā)明公開了一種大規(guī)模圖數(shù)據(jù)高效查詢方法,包括:對圖數(shù)據(jù)進行劃分,得到圖數(shù)據(jù)的初始分區(qū);其中,所述初始分區(qū)包括每個頂點向量的二進制簽名以及對應(yīng)的哈希桶;對圖數(shù)據(jù)的初始分區(qū)進行調(diào)整,得到新的分區(qū);將RDF格式的圖數(shù)據(jù)轉(zhuǎn)換為屬性圖格式并存儲;基于SPARQL查詢語句,得到連接計劃;根據(jù)連接計劃和SPARQL查詢映射算法,在分布式數(shù)據(jù)庫中得到查詢結(jié)果。本發(fā)明節(jié)約了圖數(shù)據(jù)的查詢時間。
本發(fā)明授權(quán)一種大規(guī)模圖數(shù)據(jù)高效查詢方法在權(quán)利要求書中公布了:1.一種大規(guī)模圖數(shù)據(jù)高效查詢方法,應(yīng)用于對分布式數(shù)據(jù)庫中圖數(shù)據(jù)的查詢,其特征在于,包括: 步驟1:對圖數(shù)據(jù)進行劃分,得到圖數(shù)據(jù)的初始分區(qū);其中,所述初始分區(qū)包括每個頂點向量的二進制簽名以及對應(yīng)的哈希桶; 步驟2:對圖數(shù)據(jù)的初始分區(qū)進行調(diào)整,得到新的分區(qū); 步驟3:將RDF格式的圖數(shù)據(jù)轉(zhuǎn)換為屬性圖格式并存儲; 步驟4:基于SPARQL查詢語句,得到連接計劃; 步驟5:根據(jù)連接計劃和SPARQL查詢映射算法,在分布式數(shù)據(jù)庫中得到查詢結(jié)果; 所述步驟1具體包括: 選取Word2Vec作為向量化工具,將每個頂點的各個屬性表示為詞向量,利用加權(quán)平均模型計算出頂點向量; 將所有頂點向量作為局部敏感哈希算法的輸入,得到每個頂點向量的二進制簽名以及對應(yīng)的哈希桶; 所述步驟2包括: 假設(shè)現(xiàn)有圖數(shù)據(jù)的初始分區(qū)包括k個分區(qū)結(jié)果P={p1,p2,...,pk},每個分區(qū)的最大負(fù)載MaxSize;現(xiàn)有圖數(shù)據(jù)為G=V,E,V={v1,...,vn}為頂點集合,E={e1,...,em}為邊集合,|V|=n,|E|=m; 分別計算vi在pi中的Scoreadjacent得分; 將pi中的所有vi按照Scoreadjacent大小排序; 當(dāng)從Scoreadjacent得分最小的vi開始,分別計算vi在其他分區(qū)的Scoremovevi,p得分,將所有得分排序并取出vi得分最大的分區(qū)pj; 當(dāng)取出vi得分次大的分區(qū)pj;否則,將vi分配給pj并且更新pi以及緩存表; 最終輸出調(diào)整后的分區(qū); 所述步驟3包括: 將RDF格式轉(zhuǎn)換為屬性圖格式,然后以頂點為存儲粒度,作為HBase的每一行,存儲與該頂點相關(guān)的屬性與關(guān)系; 所述步驟3具體包括: 分別針對每條三元組數(shù)據(jù)s,p,o,根據(jù)Resource確定頂點的類型,將URI作為頂點的一個屬性; 若o是文字,則將p作為頂點的屬性名,o作為頂點屬性值; 若o是資源,則將p映射為邊,對p進行唯一編號,p的值作為屬性值;將s和o的URI也作為p的屬性,代表p連接的兩個頂點; 所述步驟4包括: 步驟41:解析SPARQL查詢語句,得到每個主語變量的三元組模式集合Plan={T1,T2,…Tp};所述SPARQL查詢語句包含n個三元組模式T={t1,t2,…tn}; 步驟42:從包含三元組模式最多的集合開始遍歷,依次刪除前面已經(jīng)遍歷過的三元組模式,得到連接計劃,所述連接計劃包含m個集合Plan={T1,T2,…Tm},每個集合代表一個三元組模式子集; 所述步驟42具體包括: 在Plan={T1,T2,…Tp}中依次遍歷Ti: 若Ti中包含主語已知的三元組模式tj,則將tj排在第一個位置并將Ti標(biāo)記為Type-S; 若Ti中包含謂詞和賓語已知的三元組模式tj,則將tj排在第一個位置并將Ti標(biāo)記為Type-PO; 若Ti中不包含主語以及謂詞和賓語已知的三元組模式tj,將Tj中的子句首先按照變量個數(shù)從小到大排序;如果出現(xiàn)tj和tk的變量個數(shù)相同,則已知謂詞的排在前面;如果tj和tk都已知謂詞,則在二級索引表中掃描,將結(jié)果集小的排在前面; 遍歷結(jié)束后,得到連接計劃; 所述步驟5包括: 初始化當(dāng)前的RDD為第一次循環(huán)的結(jié)果;RDD為key-value鍵值對,key表示要連接的變量,value表示迭代過程中的非連接變量; 在連接計劃包含的m個集合Plan={T1,T2,…Tm}中開始遍歷: 若Ti有標(biāo)識Type-SorType-PO,則通過SPARQL查詢映射算法執(zhí)行Ti中的第一個語句得到結(jié)果Rows;根據(jù)Rows將Ti中剩余的子句變量進行綁定;將所有結(jié)果合并,形成newRDD并保存在內(nèi)存中;否則,在Ti中對tj進行遍歷:通過SPARQL查詢映射算法得到結(jié)果集;根據(jù)查詢條件調(diào)整key-value,將結(jié)果轉(zhuǎn)換為newRDD;將newRDD與上一步的RDD連接形成新的newRDD并保存在內(nèi)存中; 所有的遍歷結(jié)束后,取出結(jié)果集中的需要的值,即得到查詢結(jié)果。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人西安電子科技大學(xué),其通訊地址為:710071 陜西省西安市雁塔區(qū)太白南路2號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 陶氏環(huán)球技術(shù)有限責(zé)任公司A·M·卡梅利奧獲國家專利權(quán)
- 北京小鳥科技股份有限公司劉雨獲國家專利權(quán)
- 交通運輸部公路科學(xué)研究所韓曉坤獲國家專利權(quán)
- 昆山丘鈦微電子科技有限公司景志佳獲國家專利權(quán)
- 浙江清華柔性電子技術(shù)研究院馮雪獲國家專利權(quán)
- 全球能源互聯(lián)網(wǎng)研究院有限公司王博獲國家專利權(quán)
- 北京萬集智能網(wǎng)聯(lián)技術(shù)有限公司周浩獲國家專利權(quán)
- 天津市松正電動汽車技術(shù)股份有限公司柏榮鍵獲國家專利權(quán)
- 中國船舶重工集團公司第七一一研究所楊鵬獲國家專利權(quán)
- 深圳市大富科技股份有限公司溫世議獲國家專利權(quán)