中鐵電氣化局集團(tuán)有限公司林云志獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉中鐵電氣化局集團(tuán)有限公司申請的專利一種數(shù)據(jù)搜索增強(qiáng)重排方法、系統(tǒng)及設(shè)備獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120067311B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-02發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510552027.X,技術(shù)領(lǐng)域涉及:G06F16/338;該發(fā)明授權(quán)一種數(shù)據(jù)搜索增強(qiáng)重排方法、系統(tǒng)及設(shè)備是由林云志;楊柳;裴寧;張浩宇;羅金;司丙楠設(shè)計研發(fā)完成,并于2025-04-29向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種數(shù)據(jù)搜索增強(qiáng)重排方法、系統(tǒng)及設(shè)備在說明書摘要公布了:本發(fā)明屬于數(shù)據(jù)搜索增強(qiáng)領(lǐng)域,具體涉及了一種數(shù)據(jù)搜索增強(qiáng)重排方法、系統(tǒng)及設(shè)備,旨在解決現(xiàn)有RAG技術(shù)因局部匹配、單一表征和噪聲干擾導(dǎo)致準(zhǔn)確率低的問題。本發(fā)明包括:構(gòu)建關(guān)鍵詞庫;將專業(yè)知識及文檔分割為多個文本塊,生成第一高維特征向量;對每個文本塊語義分割,提取各語義單元的第二高維特征向量;提取查詢信息的關(guān)鍵詞、各改寫查詢的高維特征向量;篩選與查詢信息的關(guān)鍵詞匹配的多個文本塊;將查詢信息的關(guān)鍵詞對應(yīng)的高維特征向量與第一高維特征向量進(jìn)行匹配,并基于轉(zhuǎn)移概率距離進(jìn)行二次篩選;計算改寫查詢對應(yīng)的高維特征向量與二次篩選后的第二高維特征向量的球散度距離,并進(jìn)行重排。本發(fā)明結(jié)合多種語義特征,提升了搜索準(zhǔn)確率。
本發(fā)明授權(quán)一種數(shù)據(jù)搜索增強(qiáng)重排方法、系統(tǒng)及設(shè)備在權(quán)利要求書中公布了:1.一種數(shù)據(jù)搜索增強(qiáng)重排方法,其特征在于,該方法包括: 收集已有領(lǐng)域的專業(yè)知識及文檔并提取關(guān)鍵詞,構(gòu)建領(lǐng)域?qū)?yīng)的關(guān)鍵詞庫; 將所述專業(yè)知識及文檔按固定長度分割為多個文本塊,對每個文本塊,基于關(guān)鍵詞庫分別提取關(guān)鍵詞,并通過文本表征模型生成第一高維特征向量; 對每個文本塊進(jìn)行語義分割,生成多個語義單元,并通過文本表征模型提取各語義單元的高維特征向量,得到第二高維特征向量; 基于所述關(guān)鍵詞庫提取輸入的查詢信息的關(guān)鍵詞,提取所述查詢信息的關(guān)鍵詞對應(yīng)的高維特征向量;獲取所述查詢信息多種語義等效的改寫查詢,提取各改寫查詢對應(yīng)的高維特征向量; 篩選與查詢信息的關(guān)鍵詞匹配的多個文本塊,作為候選文本塊; 將所述查詢信息的關(guān)鍵詞對應(yīng)的高維特征向量與所述第一高維特征向量進(jìn)行匹配,并基于轉(zhuǎn)移概率距離對候選文本塊進(jìn)行二次篩選; 計算改寫查詢對應(yīng)的高維特征向量與二次篩選后的第二高維特征向量的球散度距離,基于所述球散度距離對二次篩選后的文本塊進(jìn)行重排; 所述球散度距離,其方法為: 將每個改寫查詢的高維特征向量集合記為,二次篩選后的第二高維特征向量集合記為;其中,為特征向量的數(shù)量,m為的索引; 計算和中,任意兩個特征向量之間的歐氏距離;其中,,; 基于所述歐氏距離計算每組特征向量的球散度距離; 基于所述歐氏距離計算每組特征向量的球散度距離,其方法為: ; 其中,表示改寫查詢的高維特征向量間的組內(nèi)距離,為二次篩選后的第二高維特征向量間的組內(nèi)距離,為循環(huán)索引變量,用于遍歷集合中的元素,取值范圍為,為中的第個特征向量。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人中鐵電氣化局集團(tuán)有限公司,其通訊地址為:100036 北京市豐臺區(qū)豐臺路口139號202室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 三星電子株式會社金省佑獲國家專利權(quán)
- 中興通訊股份有限公司石靖獲國家專利權(quán)
- 中興通訊股份有限公司崔曉光獲國家專利權(quán)
- 湖南金爐科技股份有限公司歐陽建獲國家專利權(quán)
- 傳感技術(shù)股份有限公司J·查特吉獲國家專利權(quán)
- 北京沃東天駿信息技術(shù)有限公司王剛獲國家專利權(quán)
- 查爾斯河實(shí)驗(yàn)室股份有限公司王啟釗獲國家專利權(quán)
- 應(yīng)用材料公司T·A·恩古耶獲國家專利權(quán)
- 深圳邁瑞生物醫(yī)療電子股份有限公司周志奇獲國家專利權(quán)
- 意法半導(dǎo)體股份有限公司L·塞吉齊獲國家專利權(quán)


熱門推薦
- 蘇州天順新能源科技有限公司張圣明獲國家專利權(quán)
- 波音公司張博宇獲國家專利權(quán)
- 浙江大學(xué)城市學(xué)院劉麗獲國家專利權(quán)
- 朗姆研究公司張賀獲國家專利權(quán)
- 創(chuàng)新技術(shù)實(shí)驗(yàn)室株式會社樸東鉉獲國家專利權(quán)
- 日產(chǎn)自動車株式會社廣瀬悟獲國家專利權(quán)
- 富士施樂株式會社浜津誠獲國家專利權(quán)
- 阿里巴巴集團(tuán)控股有限公司趙曉輝獲國家專利權(quán)
- 阿特拉斯·科普柯空氣動力股份有限公司T·克雷佩因獲國家專利權(quán)
- 浙江大學(xué)城市學(xué)院劉麗獲國家專利權(quán)