<thead id="3jag6"><rt id="3jag6"><noscript id="3jag6"></noscript></rt></thead>
  • <s id="3jag6"><track id="3jag6"><menuitem id="3jag6"></menuitem></track></s>
        <sub id="3jag6"><p id="3jag6"></p></sub>

          <style id="3jag6"></style>
          国产精品久久久久久久网,人人妻人人澡人人爽国产,亚洲中文字幕无码爆乳APP,免费大片黄国产在线观看,无码抽搐高潮喷水流白浆,国产久免费热视频在线观看,国产亚洲精品成人aa片新蒲金,久久久97丨国产人妻熟女
          Document
          拖動(dòng)滑塊完成拼圖
          個(gè)人中心

          預(yù)訂訂單
          服務(wù)訂單
          發(fā)布專利 發(fā)布成果 人才入駐 發(fā)布商標(biāo) 發(fā)布需求

          在線咨詢

          聯(lián)系我們

          龍圖騰公眾號(hào)
          首頁(yè) 專利交易 IP管家助手 科技果 科技人才 科技服務(wù) 國(guó)際服務(wù) 商標(biāo)交易 會(huì)員權(quán)益 需求市場(chǎng) 關(guān)于龍圖騰
           /  免費(fèi)注冊(cè)
          到頂部 到底部
          清空 搜索
          • 我要求購(gòu)
          • 我要出售
          當(dāng)前位置 : 首頁(yè) > 專利喜報(bào) > 之江實(shí)驗(yàn)室陳紅陽(yáng)獲國(guó)家專利權(quán)

          之江實(shí)驗(yàn)室陳紅陽(yáng)獲國(guó)家專利權(quán)

          買(mǎi)專利賣(mài)專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!

          龍圖騰網(wǎng)獲悉之江實(shí)驗(yàn)室申請(qǐng)的專利策略模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120278215B

          龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-02發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510782184.X,技術(shù)領(lǐng)域涉及:G06N3/08;該發(fā)明授權(quán)策略模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)是由陳紅陽(yáng);王巖松設(shè)計(jì)研發(fā)完成,并于2025-06-12向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。

          策略模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)在說(shuō)明書(shū)摘要公布了:本申請(qǐng)?zhí)峁┮环N策略模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。其中,該方法包括:獲取第一環(huán)境狀態(tài),并將所述第一環(huán)境狀態(tài)輸入至待訓(xùn)練的策略模型,得到與所述第一環(huán)境狀態(tài)對(duì)應(yīng)的第一動(dòng)作;利用預(yù)先訓(xùn)練的大語(yǔ)言模型對(duì)所述第一環(huán)境狀態(tài)和所述第一動(dòng)作進(jìn)行處理,得到與所述第一動(dòng)作對(duì)應(yīng)的安全指示信號(hào);所述安全指示信號(hào)用于指示在所述第一環(huán)境狀態(tài)下執(zhí)行所述第一動(dòng)作是否安全;以及基于所述第一動(dòng)作與環(huán)境進(jìn)行交互,得到第二環(huán)境狀態(tài)以及獎(jiǎng)勵(lì);基于所述第一環(huán)境狀態(tài)、第一動(dòng)作、安全指示信號(hào)、第二環(huán)境狀態(tài)、以及獎(jiǎng)勵(lì)構(gòu)成交互數(shù)據(jù),并基于所述交互數(shù)據(jù)訓(xùn)練所述待訓(xùn)練的策略模型,得到目標(biāo)策略模型。

          本發(fā)明授權(quán)策略模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)在權(quán)利要求書(shū)中公布了:1.一種策略模型的訓(xùn)練方法,其特征在于,所述方法包括: 獲取第一環(huán)境狀態(tài),并將所述第一環(huán)境狀態(tài)輸入至待訓(xùn)練的策略模型,得到與所述第一環(huán)境狀態(tài)對(duì)應(yīng)的第一動(dòng)作;所述第一環(huán)境狀態(tài)包括:自動(dòng)駕駛載具行駛的當(dāng)前道路狀態(tài);所述第一動(dòng)作包括下一步的駕駛動(dòng)作; 利用預(yù)先訓(xùn)練的大語(yǔ)言模型對(duì)所述第一環(huán)境狀態(tài)和所述第一動(dòng)作進(jìn)行處理,得到與所述第一動(dòng)作對(duì)應(yīng)的安全指示信號(hào);所述安全指示信號(hào)用于指示在所述第一環(huán)境狀態(tài)下執(zhí)行所述第一動(dòng)作是否安全;以及 基于所述第一動(dòng)作與環(huán)境進(jìn)行交互,得到第二環(huán)境狀態(tài)以及獎(jiǎng)勵(lì); 基于所述第一環(huán)境狀態(tài)、第一動(dòng)作、安全指示信號(hào)、第二環(huán)境狀態(tài)、以及獎(jiǎng)勵(lì)構(gòu)成交互數(shù)據(jù),并基于所述交互數(shù)據(jù)訓(xùn)練所述待訓(xùn)練的策略模型,得到目標(biāo)策略模型; 所述基于所述交互數(shù)據(jù)訓(xùn)練所述待訓(xùn)練的策略模型,包括: 將當(dāng)前訓(xùn)練周期生成的交互數(shù)據(jù)作為目標(biāo)交互數(shù)據(jù),基于所述目標(biāo)交互數(shù)據(jù),對(duì)所述待訓(xùn)練的策略模型進(jìn)行當(dāng)前訓(xùn)練周期的訓(xùn)練;和或, 將當(dāng)前訓(xùn)練周期確定的交互數(shù)據(jù)存儲(chǔ)至經(jīng)驗(yàn)回放池; 對(duì)所述經(jīng)驗(yàn)回放池中存儲(chǔ)的交互數(shù)據(jù)進(jìn)行采樣,得到當(dāng)前訓(xùn)練周期對(duì)應(yīng)的目標(biāo)交互數(shù)據(jù);基于所述目標(biāo)交互數(shù)據(jù),對(duì)所述待訓(xùn)練的策略模型進(jìn)行當(dāng)前訓(xùn)練周期的訓(xùn)練; 所述基于所述目標(biāo)交互數(shù)據(jù),對(duì)所述待訓(xùn)練的策略模型進(jìn)行當(dāng)前訓(xùn)練周期的訓(xùn)練,包括: 確定當(dāng)前訓(xùn)練周期的待訓(xùn)練的策略模型、動(dòng)作價(jià)值網(wǎng)絡(luò)、以及目標(biāo)網(wǎng)絡(luò); 基于所述目標(biāo)交互數(shù)據(jù),通過(guò)最小化貝爾曼殘差更新當(dāng)前訓(xùn)練周期的動(dòng)作價(jià)值網(wǎng)絡(luò),通過(guò)最大化目標(biāo)函數(shù)更新當(dāng)前訓(xùn)練周期的策略模型,以及通過(guò)慢更新機(jī)制更新當(dāng)前訓(xùn)練周期的目標(biāo)網(wǎng)絡(luò); 所述方法還包括: 確定當(dāng)前訓(xùn)練周期的安全熵權(quán)重參數(shù);所述安全熵權(quán)重參數(shù)用于調(diào)整所述目標(biāo)交互數(shù)據(jù)中的安全性信息在更新所述動(dòng)作價(jià)值網(wǎng)絡(luò)時(shí)的權(quán)重;所述當(dāng)前訓(xùn)練周期的安全熵權(quán)重參數(shù)為預(yù)設(shè)參數(shù),或者,基于前一訓(xùn)練周期確定的目標(biāo)交互數(shù)據(jù)中的安全性信息確定; 通過(guò)最小化貝爾曼殘差更新當(dāng)前訓(xùn)練周期的動(dòng)作價(jià)值網(wǎng)絡(luò),包括: 基于所述安全熵權(quán)重參數(shù),通過(guò)最小化貝爾曼殘差更新當(dāng)前訓(xùn)練周期的動(dòng)作價(jià)值網(wǎng)絡(luò)。

          如需購(gòu)買(mǎi)、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人之江實(shí)驗(yàn)室,其通訊地址為:311121 浙江省杭州市余杭區(qū)中泰街道科創(chuàng)大道之江實(shí)驗(yàn)室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。

          免責(zé)聲明
          1、本報(bào)告根據(jù)公開(kāi)、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
          2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
          主站蜘蛛池模板: 一区国产传媒国产精品| 亚洲第一精品一二三区| 热久久99热精品首页| 国产成人精品视频网站| 无码专区无码专区视频网址 | 人妻中文字幕不卡精品| 亚洲欧美人成网站在线观看看| 免费人成网站免费看视频| 亚洲欧美综合人成在线| 国产高清自产拍AV在线| 亚洲精品乱码久久久久久v| 亚洲v欧美v国产v在线观看| 亚洲乱码中文字幕综合234| 超碰97人人做人人爱综合| 白嫩少妇bbw撒尿视频| 国产妇女馒头高清泬20p多| 少妇人妻真实偷人精品视频| 刺激性视频黄页| 中文字幕日韩精品无码内射| 成人做爰69片免费看网站| 无码国产精品久久一区免费| 永久黄网站色视频免费| 强行从后面挺进人妻| 少妇大叫太大太爽受不了在线观看 | 亚洲色大成网站www国产| 3d动漫精品啪啪一区二区中| 亚洲国产成人字幕久久| 国产午夜福利在线播放| 亚洲 欧美 综合 在线 精品 | 日韩高清不卡免费一区二区 | 人妻少妇无码精品专区| 久久久久久久久久久综合日本| 伊人久久精品一区二区三区| 在线观看免费人成视频| 开心五月激情五月俺亚洲| 狠狠亚洲色一日本高清色| 国产愉拍精品手机| 国产亚洲综合欧美一区二区| 鲁丝一区二区三区免费| 无码国模大尺度视频在线观看| 天堂中文а√在线|