<thead id="3jag6"><rt id="3jag6"><noscript id="3jag6"></noscript></rt></thead>
  • <s id="3jag6"><track id="3jag6"><menuitem id="3jag6"></menuitem></track></s>
        <sub id="3jag6"><p id="3jag6"></p></sub>

          <style id="3jag6"></style>
          国产精品久久久久久久网,人人妻人人澡人人爽国产,亚洲中文字幕无码爆乳APP,免费大片黄国产在线观看,无码抽搐高潮喷水流白浆,国产久免费热视频在线观看,国产亚洲精品成人aa片新蒲金,久久久97丨国产人妻熟女
          Document
          拖動(dòng)滑塊完成拼圖
          個(gè)人中心

          預(yù)訂訂單
          服務(wù)訂單
          發(fā)布專利 發(fā)布成果 人才入駐 發(fā)布商標(biāo) 發(fā)布需求

          在線咨詢

          聯(lián)系我們

          龍圖騰公眾號(hào)
          首頁(yè) 專利交易 IP管家助手 科技果 科技人才 科技服務(wù) 國(guó)際服務(wù) 商標(biāo)交易 會(huì)員權(quán)益 需求市場(chǎng) 關(guān)于龍圖騰
           /  免費(fèi)注冊(cè)
          到頂部 到底部
          清空 搜索
          • 我要求購(gòu)
          • 我要出售
          當(dāng)前位置 : 首頁(yè) > 專利喜報(bào) > 北京深勢(shì)科技有限公司蔡恒興獲國(guó)家專利權(quán)

          北京深勢(shì)科技有限公司蔡恒興獲國(guó)家專利權(quán)

          買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!

          龍圖騰網(wǎng)獲悉北京深勢(shì)科技有限公司申請(qǐng)的專利一種引入稠密向量檢索器的大語(yǔ)言模型的處理方法和裝置獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN119398193B

          龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-26發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202411486178.1,技術(shù)領(lǐng)域涉及:G06N20/00;該發(fā)明授權(quán)一種引入稠密向量檢索器的大語(yǔ)言模型的處理方法和裝置是由蔡恒興;李思杭;張林峰;孫偉杰設(shè)計(jì)研發(fā)完成,并于2024-10-23向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。

          一種引入稠密向量檢索器的大語(yǔ)言模型的處理方法和裝置在說(shuō)明書摘要公布了:本發(fā)明實(shí)施例涉及一種引入稠密向量檢索器的大語(yǔ)言模型的處理方法和裝置,所述方法包括:將一類大語(yǔ)言模型作為第一大語(yǔ)言模型;基于第一大語(yǔ)言模型在對(duì)應(yīng)的定向NLP任務(wù)微調(diào)中使用的定向文本語(yǔ)料集初始化稠密向量數(shù)據(jù)庫(kù);在第一大語(yǔ)言模型中增加稠密向量檢索器和特征融合模塊構(gòu)成第二大語(yǔ)言模型并對(duì)其進(jìn)行訓(xùn)練;訓(xùn)練結(jié)束后由第二大語(yǔ)言模型以稠密向量數(shù)據(jù)庫(kù)為參考來(lái)處理定向NLP任務(wù);并定期更新稠密向量數(shù)據(jù)庫(kù),并定期基于最新的稠密向量數(shù)據(jù)庫(kù)對(duì)第二大語(yǔ)言模型進(jìn)行一次評(píng)估,并在當(dāng)次評(píng)估不合格時(shí)對(duì)第二大語(yǔ)言模型進(jìn)行一次微調(diào)。通過(guò)本發(fā)明既可以保證模型的時(shí)效性、又可以降低模型的維護(hù)成本、提高模型的經(jīng)濟(jì)價(jià)值。

          本發(fā)明授權(quán)一種引入稠密向量檢索器的大語(yǔ)言模型的處理方法和裝置在權(quán)利要求書中公布了:1.一種引入稠密向量檢索器的大語(yǔ)言模型的處理方法,其特征在于,所述方法包括: 將一類基于Transformer模型架構(gòu)實(shí)現(xiàn)并已完成預(yù)訓(xùn)練和一類定向NLP任務(wù)微調(diào)的大語(yǔ)言模型作為對(duì)應(yīng)的第一大語(yǔ)言模型;所述定向NLP任務(wù)至少包括機(jī)器翻譯任務(wù)和智能問(wèn)答任務(wù); 將所述第一大語(yǔ)言模型在對(duì)應(yīng)的定向NLP任務(wù)微調(diào)中使用的定向文本語(yǔ)料集作為對(duì)應(yīng)的第一數(shù)據(jù)集;并基于所述第一數(shù)據(jù)集初始化對(duì)應(yīng)的稠密向量數(shù)據(jù)庫(kù); 在所述第一大語(yǔ)言模型中增加稠密向量檢索器和特征融合模塊構(gòu)成對(duì)應(yīng)的第二大語(yǔ)言模型;并基于所述第一數(shù)據(jù)集對(duì)所述第二大語(yǔ)言模型進(jìn)行模型訓(xùn)練; 模型訓(xùn)練結(jié)束后,由所述第二大語(yǔ)言模型以所述稠密向量數(shù)據(jù)庫(kù)為參考來(lái)處理所述定向NLP任務(wù);并定期對(duì)所述稠密向量數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)更新處理;并定期基于最新的所述稠密向量數(shù)據(jù)庫(kù)對(duì)所述第二大語(yǔ)言模型進(jìn)行一次任務(wù)處理性能評(píng)估得到對(duì)應(yīng)的當(dāng)次評(píng)估結(jié)果,并在所述當(dāng)次評(píng)估結(jié)果為不合格時(shí)基于所述稠密向量數(shù)據(jù)庫(kù)進(jìn)行模型訓(xùn)練數(shù)據(jù)集構(gòu)建得到對(duì)應(yīng)的第二數(shù)據(jù)集,并基于所述第二數(shù)據(jù)集對(duì)所述第二大語(yǔ)言模型進(jìn)行一次微調(diào),并在本次微調(diào)結(jié)束后繼續(xù)由所述第二大語(yǔ)言模型以所述稠密向量數(shù)據(jù)庫(kù)為參考來(lái)處理所述定向NLP任務(wù);所述當(dāng)次評(píng)估結(jié)果包括合格和不合格; 其中,所述定期對(duì)所述稠密向量數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)更新處理,具體包括: 步驟81,按預(yù)設(shè)的第一時(shí)間頻率定期通過(guò)多個(gè)大數(shù)據(jù)采集渠道對(duì)所述定向NLP任務(wù)的文本語(yǔ)料進(jìn)行大數(shù)據(jù)采集得到對(duì)應(yīng)的第一采集數(shù)據(jù)集;并基于人工或其他機(jī)器模型篩選方式對(duì)所述第一采集數(shù)據(jù)集的各個(gè)第一采集記錄進(jìn)行文本降噪、去重、合規(guī)性檢驗(yàn)和正確性檢驗(yàn)處理;并由所述第二大語(yǔ)言模型的預(yù)處理模塊、嵌入編碼模塊和特征提取模塊組成一個(gè)對(duì)應(yīng)的第二編碼器; 其中,所述多個(gè)大數(shù)據(jù)采集渠道至少包括公開的文本語(yǔ)料庫(kù)、公開的網(wǎng)絡(luò)文本資源、各領(lǐng)域公開的技術(shù)標(biāo)準(zhǔn)教材文獻(xiàn)雜志期刊論文資源;所述第一采集數(shù)據(jù)集包括多個(gè)所述第一采集記錄;所述第一采集記錄包括第一采集目標(biāo)文本和第一采集標(biāo)簽文本;所述定向NLP任務(wù)為機(jī)器翻譯任務(wù)時(shí),所述第一采集目標(biāo)文本和所述第一采集標(biāo)簽文本分別為對(duì)應(yīng)的翻譯目標(biāo)文本和釋義標(biāo)簽文本;所述定向NLP任務(wù)為智能問(wèn)答任務(wù)時(shí),所述第一采集目標(biāo)文本和所述第一采集標(biāo)簽文本分別為對(duì)應(yīng)的問(wèn)題目標(biāo)文本和答案標(biāo)簽文本; 步驟82,將所述第一采集數(shù)據(jù)集的第一個(gè)所述第一采集記錄作為對(duì)應(yīng)的當(dāng)前采集記錄; 步驟83,將所述當(dāng)前采集記錄的所述第一采集目標(biāo)文本和所述第一采集標(biāo)簽文本作為對(duì)應(yīng)的當(dāng)前采集目標(biāo)文本和當(dāng)前采集標(biāo)簽文本;并將所述當(dāng)前采集目標(biāo)文本和所述當(dāng)前采集標(biāo)簽文本分別輸入所述第二編碼器進(jìn)行對(duì)應(yīng)的文本預(yù)處理、嵌入編碼處理和特征提取處理得到對(duì)應(yīng)的當(dāng)前目標(biāo)文本特征向量和當(dāng)前標(biāo)簽文本特征向量;并按稠密向量格式對(duì)所述當(dāng)前目標(biāo)文本特征向量和所述當(dāng)前標(biāo)簽文本特征向量進(jìn)行稠密向量轉(zhuǎn)換得到對(duì)應(yīng)的當(dāng)前目標(biāo)文本稠密向量和當(dāng)前標(biāo)簽文本稠密向量; 步驟84,對(duì)所述稠密向量數(shù)據(jù)庫(kù)的第一向量數(shù)據(jù)庫(kù)中第一稠密向量字段與所述當(dāng)前目標(biāo)文本稠密向量的向量特征近似度最大的第一向量數(shù)據(jù)記錄進(jìn)行查詢并將查詢得到的所述第一向量數(shù)據(jù)記錄作為對(duì)應(yīng)的第一查詢記錄;并將所述第一查詢記錄的所述第一稠密向量字段與所述當(dāng)前目標(biāo)文本稠密向量的向量特征近似度作為對(duì)應(yīng)的第一目標(biāo)近似度;并將第一文本數(shù)據(jù)庫(kù)中第二向量標(biāo)識(shí)字段與所述第一查詢記錄的第一向量標(biāo)識(shí)字段匹配的第一文本數(shù)據(jù)記錄作為對(duì)應(yīng)的第二查詢記錄;并將所述第一向量數(shù)據(jù)庫(kù)中所述第一稠密向量字段與所述第二查詢記錄的第三向量標(biāo)識(shí)字段匹配的所述第一向量數(shù)據(jù)記錄記為對(duì)應(yīng)的第三查詢記錄;并對(duì)所述第三查詢記錄的所述第一稠密向量字段和所述當(dāng)前標(biāo)簽文本稠密向量的向量特征近似度進(jìn)行計(jì)算得到對(duì)應(yīng)的第一標(biāo)簽近似度; 步驟85,對(duì)所述第一目標(biāo)近似度和所述第一標(biāo)簽近似度進(jìn)行識(shí)別;若所述第一目標(biāo)近似度超過(guò)預(yù)設(shè)的第二近似度閾值且所述第一標(biāo)簽近似度未超過(guò)所述第二近似度閾值,則轉(zhuǎn)至步驟86;若所述第一目標(biāo)近似度未超過(guò)所述第二近似度閾值,則轉(zhuǎn)至步驟87;若所述第一目標(biāo)近似度和所述第一標(biāo)簽近似度都超過(guò)所述第二近似度閾值,則轉(zhuǎn)至步驟88; 其中,第二近似度閾值第一近似度閾值; 步驟86,將所述第二查詢記錄的第二文本字段更新為對(duì)應(yīng)的所述當(dāng)前采集標(biāo)簽文本;并將所述第二查詢記錄的第一更新字段更新為對(duì)應(yīng)的當(dāng)前時(shí)間;并將所述第三查詢記錄的所述第一稠密向量字段更新為對(duì)應(yīng)的所述當(dāng)前標(biāo)簽文本稠密向量;并轉(zhuǎn)至步驟88; 步驟87,在所述第一向量數(shù)據(jù)庫(kù)中新增兩個(gè)所述第一向量數(shù)據(jù)記錄作為對(duì)應(yīng)的第一新增記錄和第二新增記錄;并在所述第一文本數(shù)據(jù)庫(kù)新增一個(gè)所述第一文本數(shù)據(jù)記錄作為對(duì)應(yīng)的第三新增記錄;并為第一、第二、第三新增記錄各自分配一個(gè)唯一的記錄標(biāo)識(shí)作為對(duì)應(yīng)的第一新增標(biāo)識(shí)、第二新增標(biāo)識(shí)和第三新增標(biāo)識(shí);并將當(dāng)前時(shí)間作為對(duì)應(yīng)的第一新增時(shí)間;并將所述第一新增記錄的所述第一向量標(biāo)識(shí)字段和所述第一稠密向量字段設(shè)為對(duì)應(yīng)的所述第一新增標(biāo)識(shí)和所述當(dāng)前目標(biāo)文本稠密向量;并將所述第二新增記錄的所述第一向量標(biāo)識(shí)字段和所述第一稠密向量字段設(shè)為對(duì)應(yīng)的所述第二新增標(biāo)識(shí)和所述當(dāng)前標(biāo)簽文本稠密向量;并將所述第三新增記錄的第一文本標(biāo)識(shí)字段、第一文本字段、所述第二文本字段、所述第二向量標(biāo)識(shí)字段、所述第三向量標(biāo)識(shí)字段和所述第一更新字段設(shè)為對(duì)應(yīng)的所述第三新增標(biāo)識(shí)、所述當(dāng)前采集目標(biāo)文本、所述當(dāng)前采集標(biāo)簽文本、所述第一新增標(biāo)識(shí)、所述第二新增標(biāo)識(shí)和所述第一新增時(shí)間; 步驟88,對(duì)所述當(dāng)前采集記錄是否為所述第一采集數(shù)據(jù)集的最后一個(gè)所述第一采集記錄進(jìn)行識(shí)別;若否,則將所述第一采集數(shù)據(jù)集的下一個(gè)所述第一采集記錄提取出來(lái)作為新的所述當(dāng)前采集記錄并返回步驟83;若是,則確認(rèn)本次數(shù)據(jù)更新處理結(jié)束。

          如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人北京深勢(shì)科技有限公司,其通訊地址為:100089 北京市海淀區(qū)海淀大街3號(hào)1幢11層1101;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。

          以上內(nèi)容由AI智能生成
          免責(zé)聲明
          1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
          2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
          主站蜘蛛池模板: 女性爽爽影院免费观看| 日韩亚洲中字无码一区二区三区| 成人国产片女人爽到高潮| 狠狠色噜噜狠狠狠7777米奇| 精品国产乱码久久久久app下载| 五月天天天综合精品无码| 国产一卡2卡3卡四卡精品网站| 人妻精品动漫H无码中字| 国产乱啊有帅gv小太正| 亚洲综合久久成人av| 婷婷久久香蕉五月综合加勒比| 亚洲国产桃花岛一区二区| 国产精品人成在线播放蜜臀| 太粗太深了太紧太爽了动态图| 国产午夜精品在人线播放| 中文字幕v亚洲日本| 日韩精品一二三黄色一级| 亚洲国产欧美在线成人| 亚洲蜜桃v妇女| 亚洲美女高清aⅴ视频免费| 免费毛片a线观看| 亚洲av成人精品免费看| 另类国产精品一区二区| 99偷拍视频精品一区二区 | 伊人久久精品欧洲综合网| 97超碰人人人人人人少妇| 小泽玛莉亚一区二区视频在线| 又粗又猛又黄又爽无遮挡| 国产精品自产拍在线观看花钱看| 看国产黄大片在线观看| 精品香蕉一区二区三区| 久久国产精品一国产精品金尊| 国产一区二区三区尤物视频| 午夜精品无人区乱码1区2区| 视频国产激情| 久久精品国产99久久久香蕉| 国产亚洲一区二区三区成人| 亚洲中文无码精品卡通| 蜜乳av久久久久久久久久久| 亚洲精品日韩一区二区电影| 亚洲国产第一站精品蜜芽|