齊魯工業(yè)大學(xué)(山東省科學(xué)院);山東省計算中心(國家超級計算濟(jì)南中心)趙志剛獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉齊魯工業(yè)大學(xué)(山東省科學(xué)院);山東省計算中心(國家超級計算濟(jì)南中心)申請的專利基于多階段檢索反饋的RAG查詢重寫方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120492613B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-12發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510964540.X,技術(shù)領(lǐng)域涉及:G06F16/334;該發(fā)明授權(quán)基于多階段檢索反饋的RAG查詢重寫方法是由趙志剛;張廣東;李傳濤;王春曉;李錦濤;王雨欣;劉言;周智偉設(shè)計研發(fā)完成,并于2025-07-14向國家知識產(chǎn)權(quán)局提交的專利申請。
本基于多階段檢索反饋的RAG查詢重寫方法在說明書摘要公布了:本發(fā)明涉及檢索增強生成技術(shù)領(lǐng)域,尤其是提供了一種基于多階段檢索反饋的RAG查詢重寫方法。該方法包括通過引入查詢重寫器,構(gòu)建改進(jìn)型的RAG框架;基于檢索任務(wù)的靜態(tài)反饋和動態(tài)反饋兩階段訓(xùn)練查詢重寫器;并設(shè)計信息對齊策略,將重寫后的查詢校準(zhǔn)到檢索需求的信息范圍和語義,該方法對查詢進(jìn)行了優(yōu)化,提高了檢索需求的匹配度,提升了檢索的覆蓋率和準(zhǔn)確率。
本發(fā)明授權(quán)基于多階段檢索反饋的RAG查詢重寫方法在權(quán)利要求書中公布了:1.一種基于多階段檢索反饋的RAG查詢重寫方法,其特征在于,所述方法包括: 步驟1、通過引入查詢重寫器,構(gòu)建改進(jìn)型的RAG框架; 步驟2、根據(jù)步驟1,基于檢索任務(wù)的靜態(tài)反饋和動態(tài)反饋兩階段訓(xùn)練查詢重寫器;并設(shè)計信息對齊策略,將重寫后的查詢校準(zhǔn)到檢索需求的信息范圍和語義; 所述步驟1包括: 構(gòu)建由查詢重寫器、檢索器和生成器組成的RAG框架,引入T5-large模型作為查詢重寫器;首先,查詢重寫器對原始查詢進(jìn)行重寫操作,獲得重寫后的查詢;其次,檢索器根據(jù)重寫后的查詢進(jìn)行檢索,獲得檢索文檔;最后,生成器結(jié)合重寫后的查詢和檢索文檔進(jìn)行答案預(yù)測; 所述步驟2包括: 靜態(tài)反饋階段基于監(jiān)督學(xué)習(xí),利用標(biāo)簽查詢和標(biāo)注文檔指導(dǎo)查詢重寫過程;查詢重寫器通過靜態(tài)反饋,進(jìn)行查詢重寫與信息對齊;動態(tài)反饋階段基于強化學(xué)習(xí),將檢索器召回的檢索文檔的準(zhǔn)確度和覆蓋率作為獎勵信號,動態(tài)反饋給查詢重寫器;通過查詢重寫與檢索任務(wù)的交互,以使查詢重寫器生成符合檢索需求的查詢; 將原始查詢q重新表述為在數(shù)量和語義上接近標(biāo)注文檔集合的重寫查詢,其表達(dá)式為: ; 其中,,表示標(biāo)注文檔;表示查詢重寫器生成的重寫查詢,表示重寫查詢集合,即由查詢重寫器生成,,表示查詢重寫器; 信息對齊策略包括數(shù)量對齊和語義對齊兩個子策略,其中,數(shù)量對齊:根據(jù)標(biāo)注文檔的個數(shù)確定查詢重寫器生成重寫查詢的數(shù)量,即,和分別表示重寫查詢與標(biāo)注文檔的數(shù)量;語義對齊:在監(jiān)督學(xué)習(xí)訓(xùn)練過程中,將標(biāo)注文檔的語義表示作為監(jiān)督信號,最大化與的語義相似度,生成的查詢信息包含標(biāo)注文檔的信息; 基于監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)兩個階段,對查詢重寫器進(jìn)行訓(xùn)練,其過程如下: Ⅰ、監(jiān)督學(xué)習(xí),首先利用大語言模型LLM,根據(jù)標(biāo)注文檔生成標(biāo)簽查詢;然后通過結(jié)合標(biāo)簽查詢監(jiān)督信號和標(biāo)注文檔監(jiān)督信號,聯(lián)合優(yōu)化查詢重寫任務(wù); 數(shù)據(jù)集構(gòu)建,通過Prompt指令引導(dǎo)通義千問模型Qwen-max,針對原始查詢q結(jié)合標(biāo)注文檔集合生成K個在語義上分別與標(biāo)注文檔匹配的重寫查詢,構(gòu)成重寫查詢集合;然后選擇在和R-Precision指標(biāo)上均優(yōu)于原始查詢檢索指標(biāo)的集合作為標(biāo)簽查詢,;構(gòu)建二元組作為監(jiān)督學(xué)習(xí)的訓(xùn)練數(shù)據(jù); 標(biāo)簽查詢監(jiān)督信號,選擇T5-large模型作為初始化查詢重寫器;查詢重寫器基于輸入原始查詢q學(xué)習(xí)生成與標(biāo)簽查詢接近的輸出;使用交叉熵?fù)p失函數(shù)計算查詢生成損失,其表達(dá)式為: ; 其中,表示標(biāo)簽查詢在序列位置上的詞,T表述標(biāo)簽查詢的序列長度; 標(biāo)注文檔監(jiān)督信號,首先部署一個預(yù)訓(xùn)練稠密段落檢索器DPR的上下文編碼器,以生成每個標(biāo)注文檔的隱藏狀態(tài),然后對隱藏狀態(tài)進(jìn)行平均池化,得到標(biāo)注文檔語義表示;當(dāng)查詢重寫器的編碼器生成原始查詢q的隱藏狀態(tài),同樣對隱藏狀態(tài)進(jìn)行平均池化,以獲得查詢表示;之后通過最小化查詢表示和標(biāo)注文檔語義表示之間的均方誤差MSE,對齊查詢與文檔的語義,信息對齊損失的表達(dá)式為: ; 聯(lián)合優(yōu)化目標(biāo),總體訓(xùn)練目標(biāo)損失由查詢生成損失和信息對齊損失組成,其表達(dá)式為: ; 其中,表示權(quán)重因子,用于平衡查詢生成和信息對齊策略的影響; Ⅱ、強化學(xué)習(xí),采用基于策略梯度的強化學(xué)習(xí)框架,將重寫過程建模為馬爾可夫決策過程MDP,此過程由狀態(tài)空間、動作空間、獎勵函數(shù)及優(yōu)化策略共同定義,通過檢索效果反饋驅(qū)動查詢重寫器迭代改進(jìn)。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人齊魯工業(yè)大學(xué)(山東省科學(xué)院);山東省計算中心(國家超級計算濟(jì)南中心),其通訊地址為:250353 山東省濟(jì)南市長清區(qū)西部新城大學(xué)科技園;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 鄭澈煥獲國家專利權(quán)
- 現(xiàn)代自動車株式會社李民在獲國家專利權(quán)
- 國際商業(yè)機器公司B.赫克馬特肖爾塔巴里獲國家專利權(quán)
- 中國船舶重工集團(tuán)公司第十二研究所南飛艷獲國家專利權(quán)
- 信越半導(dǎo)體株式會社石崎順也獲國家專利權(quán)
- 無錫四五零科技有限公司潘勇獲國家專利權(quán)
- 高通股份有限公司R.霍米斯獲國家專利權(quán)
- 現(xiàn)代自動車株式會社慎鏞振獲國家專利權(quán)
- 阿里巴巴集團(tuán)控股有限公司郭立帆獲國家專利權(quán)
- 云米互聯(lián)科技(廣東)有限公司陳小平獲國家專利權(quán)


熱門推薦
- 應(yīng)用材料公司孫顒獲國家專利權(quán)
- 華為技術(shù)有限公司陳虎獲國家專利權(quán)
- 三星電子株式會社金允貞獲國家專利權(quán)
- 格立莫農(nóng)業(yè)技術(shù)(天津)有限公司劉彬獲國家專利權(quán)
- 蘇州凌威新能源科技有限公司韓園園獲國家專利權(quán)
- 阿里巴巴(中國)有限公司穆罕默德·G·薩維爾獲國家專利權(quán)
- 塞勒銳科有限公司R·梅爾海姆獲國家專利權(quán)
- 阿里巴巴(中國)有限公司穆罕默德·G·薩維爾獲國家專利權(quán)
- 華為技術(shù)有限公司胡丹獲國家專利權(quán)
- 京東城市(北京)數(shù)字科技有限公司朱翔宇獲國家專利權(quán)