<thead id="3jag6"><rt id="3jag6"><noscript id="3jag6"></noscript></rt></thead>
  • <s id="3jag6"><track id="3jag6"><menuitem id="3jag6"></menuitem></track></s>
        <sub id="3jag6"><p id="3jag6"></p></sub>

          <style id="3jag6"></style>
          国产精品久久久久久久网,人人妻人人澡人人爽国产,亚洲中文字幕无码爆乳APP,免费大片黄国产在线观看,无码抽搐高潮喷水流白浆,国产久免费热视频在线观看,国产亚洲精品成人aa片新蒲金,久久久97丨国产人妻熟女
          Document
          拖動滑塊完成拼圖
          個人中心

          預訂訂單
          服務訂單
          發布專利 發布成果 人才入駐 發布商標 發布需求

          在線咨詢

          聯系我們

          龍圖騰公眾號
          首頁 專利交易 IP管家助手 科技果 科技人才 科技服務 國際服務 商標交易 會員權益 需求市場 關于龍圖騰
           /  免費注冊
          到頂部 到底部
          清空 搜索
          當前位置 : 首頁 > 專利喜報 > 拉扎斯網絡科技(上海)有限公司王江獲國家專利權

          拉扎斯網絡科技(上海)有限公司王江獲國家專利權

          買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!

          龍圖騰網獲悉拉扎斯網絡科技(上海)有限公司申請的專利模型訓練方法、裝置、電子設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120409744B

          龍圖騰網通過國家知識產權局官網在2025-09-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510916094.5,技術領域涉及:G06N20/00;該發明授權模型訓練方法、裝置、電子設備及存儲介質是由王江;董正心;柏兵;姜谷雨;苑愛泉設計研發完成,并于2025-07-03向國家知識產權局提交的專利申請。

          模型訓練方法、裝置、電子設備及存儲介質在說明書摘要公布了:本申請公開了一種模型訓練方法、裝置、電子設備及計算機存儲介質。其中,該模型訓練方法包括:基于預設訓練樣本集中的第一訓練樣本集對初始基線模型進行監督微調,得到監督微調模型以及偏好數據樣本;基于偏好數據樣本對初始獎勵模型進行優化訓練,得到目標獎勵模型,以及基于偏好數據樣本對監督微調模型進行優化訓練,得到偏好優化模型;基于偏好優化模型和第一訓練樣本集生成第一獎勵信號,以及基于偏好優化模型、目標獎勵模型和預設訓練樣本集中的第二訓練樣本集生成第二獎勵信號;基于第一獎勵信號、第二獎勵信號以及第二訓練樣本集對偏好優化模型進行優化訓練,得到目標對象生成式預訓練模型。采用該方法能夠提升模型的泛化能力。

          本發明授權模型訓練方法、裝置、電子設備及存儲介質在權利要求書中公布了:1.一種模型訓練方法,其特征在于,所述方法包括: 獲取初始基線模型、初始獎勵模型和預設訓練樣本集,其中,所述預設訓練樣本集中包括多個對象響應訓練任務對應的多個訓練樣本組,所述對象為電商類對象,所述對象響應訓練任務為以所述對象的相關信息為輸入目標,生成針對所述對象的響應信息的訓練任務,所述多個對象響應訓練任務至少包括以下一種或多種類型的任務:類別預測類型、標題生成類型、信息抽取類型、產品匹配類型、搜索相關性類型以及查詢標注類型,所述類別預測類型的對象響應訓練任務用于根據商品的基本屬性信息預測所述商品所屬的標準化產品單元類別標簽,所述信息抽取類型的對象響應訓練任務用于從商品標題或商品屬性中提取結構化屬性信息,所述搜索相關性類型的對象響應訓練任務用于評估商品對應的上下文信息中用戶查詢和商品標題之間的相關性,所述查詢標注類型的對象響應訓練任務用于為用戶搜索查詢分配詞性標記; 基于所述預設訓練樣本集中的第一訓練樣本集對所述初始基線模型進行監督微調,得到監督微調模型以及偏好數據樣本; 基于所述偏好數據樣本對所述初始獎勵模型進行優化訓練,得到目標獎勵模型,以及基于所述偏好數據樣本對所述監督微調模型進行優化訓練,得到偏好優化模型; 基于所述偏好優化模型和所述第一訓練樣本集生成第一獎勵信號,以及基于所述偏好優化模型、所述目標獎勵模型和所述預設訓練樣本集中的第二訓練樣本集生成第二獎勵信號,所述第一獎勵信號為基于所述偏好優化模型在所述第一訓練樣本集上生成第一預測響應,并將所述第一預測響應與參考輸出進行對比,使用差異度量指標計算得出的分數型獎勵信號;所述第二獎勵信號為基于所述偏好優化模型在所述第二訓練樣本集上生成第二預測響應,并將輸入樣本與所述第二預測響應一并輸入目標獎勵模型進行打分,得到表示生成質量的數值獎勵; 基于所述第一獎勵信號、所述第二獎勵信號以及所述第二訓練樣本集對所述偏好優化模型進行優化訓練,得到目標對象生成式預訓練模型; 所述基于所述第一獎勵信號、所述第二獎勵信號以及所述第二訓練樣本集對所述偏好優化模型進行優化訓練,得到目標對象生成式預訓練模型,包括: 基于所述第一獎勵信號對所述偏好優化模型進行強化學習,得到強化對象生成式預訓練模型; 基于所述第二獎勵信號和所述第二訓練樣本集對所述強化對象生成式預訓練模型進行無監督訓練,得到目標對象生成式預訓練模型。

          如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人拉扎斯網絡科技(上海)有限公司,其通訊地址為:200333 上海市普陀區真北路788號507室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。

          以上內容由AI智能生成
          免責聲明
          1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
          2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。
          主站蜘蛛池模板: 真实国产老熟女无套中出| 国产内射合集颜射| 日韩久久无码精品不卡一区二区电影| 色婷婷亚洲精品综合影院| 放荡的少妇2欧美版| 一本色道久久综合狠狠躁篇| 日本高清视频色欧WWW| 在线高清免费不卡全码| 欧美成人一卡二卡三卡四卡| 无码专区 人妻系列 在线| 亚洲国产成人一区二区精品区| 又粗又黄又硬又爽的免费视频| 丰满老熟女毛片| 18禁勿入午夜网站入口| 久久久99精品成人片中文字幕| 影音先锋无码aⅴ男人资源站| 色天天天综合色天天| 亚洲av成人在线一区| 97精品一区二区视频在线观看| aa片在线观看视频在线播放| 国产成人精品综合在线观看| 国产精品99久久99久久久| 最近中文字幕在线中文视频| 欧美乱人伦中文字幕在线| 国产男女猛烈无遮挡a片软件| 久久久人人人婷婷色东京热| 亚洲 高清 成人 动漫| 国产乱子伦一区二区三区四区五区| 97人妻免费线观看2018| 国产午夜a理论毛片| 国产精品99久久久久久董美香| 99久久精品费精品国产一区二区 | 又大又粗又爽又黄的少妇毛片| 香港三日本三级少妇三级66| 亚洲欧美成人aⅴ在线| 中文字幕一本性无码| 成熟女人牲交片免费| 亚洲最新无码中文字幕久久| 国产精品无打码在线播放| 国产成人欧美综合在线影院 | 99热这里只有精品最新地址获取 |