<thead id="3jag6"><rt id="3jag6"><noscript id="3jag6"></noscript></rt></thead>
  • <s id="3jag6"><track id="3jag6"><menuitem id="3jag6"></menuitem></track></s>
        <sub id="3jag6"><p id="3jag6"></p></sub>

          <style id="3jag6"></style>
          国产精品久久久久久久网,人人妻人人澡人人爽国产,亚洲中文字幕无码爆乳APP,免费大片黄国产在线观看,无码抽搐高潮喷水流白浆,国产久免费热视频在线观看,国产亚洲精品成人aa片新蒲金,久久久97丨国产人妻熟女
          Document
          拖動(dòng)滑塊完成拼圖
          個(gè)人中心

          預(yù)訂訂單
          服務(wù)訂單
          發(fā)布專利 發(fā)布成果 人才入駐 發(fā)布商標(biāo) 發(fā)布需求

          在線咨詢

          聯(lián)系我們

          龍圖騰公眾號(hào)
          首頁(yè) 專利交易 IP管家助手 科技果 科技人才 科技服務(wù) 國(guó)際服務(wù) 商標(biāo)交易 會(huì)員權(quán)益 需求市場(chǎng) 關(guān)于龍圖騰
           /  免費(fèi)注冊(cè)
          到頂部 到底部
          清空 搜索
          • 我要求購(gòu)
          • 我要出售
          當(dāng)前位置 : 首頁(yè) > 專利喜報(bào) > 中國(guó)科學(xué)技術(shù)大學(xué)黃隆焯獲國(guó)家專利權(quán)

          中國(guó)科學(xué)技術(shù)大學(xué)黃隆焯獲國(guó)家專利權(quán)

          買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!

          龍圖騰網(wǎng)獲悉中國(guó)科學(xué)技術(shù)大學(xué)申請(qǐng)的專利一種基于微調(diào)預(yù)訓(xùn)練大模型的音視頻事件定位方法獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN119475244B

          龍圖騰網(wǎng)通過國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-02發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202411691581.8,技術(shù)領(lǐng)域涉及:G06F18/25;該發(fā)明授權(quán)一種基于微調(diào)預(yù)訓(xùn)練大模型的音視頻事件定位方法是由黃隆焯;查正軍;傅雪陽(yáng)設(shè)計(jì)研發(fā)完成,并于2024-11-25向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。

          一種基于微調(diào)預(yù)訓(xùn)練大模型的音視頻事件定位方法在說明書摘要公布了:本發(fā)明公開了一種基于微調(diào)預(yù)訓(xùn)練大模型的音視頻事件定位方法,包括:1獲取視頻數(shù)據(jù),并將視頻畫面幀數(shù)據(jù)和音頻數(shù)據(jù)分離;2通過預(yù)訓(xùn)練大模型的編碼層分別對(duì)幀數(shù)據(jù)和音頻數(shù)據(jù)進(jìn)行特征提取;3通過查詢提示詞聚合單一模態(tài)內(nèi)的特征,提取事件特征;4通過全局提示詞提供下游任務(wù)的上下文信息,將音頻特征和視頻幀特征進(jìn)行融合;5構(gòu)建事件定位模塊,將得到的特征轉(zhuǎn)換為視頻事件分類以及定位結(jié)果。本發(fā)明通過引入可學(xué)習(xí)的提示詞,將預(yù)訓(xùn)練大模型的能力遷移到音視頻事件定位任務(wù)中,從而在極低的可訓(xùn)練參數(shù)量條件下完成音視頻事件定位任務(wù)。

          本發(fā)明授權(quán)一種基于微調(diào)預(yù)訓(xùn)練大模型的音視頻事件定位方法在權(quán)利要求書中公布了:1.一種基于微調(diào)預(yù)訓(xùn)練大模型的音視頻事件定位方法,其特征在于,是按如下步驟進(jìn)行: 步驟1、獲取一條真實(shí)的視頻數(shù)據(jù)V并劃分為T個(gè)互不重合的音視頻片段,記為{V’t,A’t|t=1,2,…,T},其中,V’t表示第t個(gè)視頻片段,A’t表示V’t對(duì)應(yīng)的音頻片段; 采樣第t個(gè)視頻片段V’t中的一幀圖像,記為第t幀圖像Vt; 將A’t轉(zhuǎn)化為第t個(gè)二維音頻頻譜圖At; 獲取V的事件類別標(biāo)簽和定位標(biāo)簽,其中,其中,表示V是否屬于第k個(gè)音視頻事件類別的標(biāo)簽,且;C表示音視頻片段的事件類別數(shù)量;表示V’t和A’t是否屬于事件片段的定位標(biāo)簽; 步驟2、構(gòu)建預(yù)訓(xùn)練大模型,包括:一個(gè)特征編碼層和N個(gè)transformer層; 步驟2.1、所述特征編碼層通過卷積層將Vt分為n個(gè)互不重合的圖像塊,并將每個(gè)圖像塊展平后再拼接,得到Vt的視覺模態(tài)特征表示; 所述特征編碼層通過所述卷積層對(duì)At進(jìn)行處理,得到At的音頻模態(tài)特征表示; 步驟2.2、N個(gè)transformer層對(duì)音視頻模態(tài)特征集{}進(jìn)行處理,得到V的視覺模態(tài)特征表示序列和音頻模態(tài)特征表示序列; 步驟2.2.1、初始化i=1; 步驟2.2.2、隨機(jī)初始化第i個(gè)transformer層中用于視覺模態(tài)的待學(xué)習(xí)的查詢提示詞,從而利用式1得到第i個(gè)transformer層輸出的第t個(gè)中間視覺模態(tài)特征表示及Vt中與音視頻事件相關(guān)的事件線索; 1 式1中,表示第i個(gè)transformer層,表示第i-1個(gè)transformer層輸出的Vt的視覺模態(tài)特征表示,當(dāng)i=1時(shí),令=,表示特征數(shù)量維度上的拼接操作; 步驟2.2.3、隨機(jī)初始化第i個(gè)transformer層中用于音頻模態(tài)的待學(xué)習(xí)的查詢提示詞,從而利用式2得到第i個(gè)transformer層輸出的第t個(gè)中間音頻模態(tài)特征表示及At中與音視頻事件相關(guān)的事件線索; 2 式2中,表示第i-1個(gè)transformer層輸出的At的音頻模態(tài)特征表示,當(dāng)i=1時(shí),令=; 步驟2.2.4、隨機(jī)初始化第i個(gè)transformer層中用于視覺模態(tài)的待學(xué)習(xí)的全局提示詞,從而利用式3得到第i個(gè)transformer層輸出的Vt的視覺模態(tài)特征表示、音頻模態(tài)的中間查詢提示詞、視覺模態(tài)的中間全局提示詞; 3 步驟2.2.5、隨機(jī)初始化第i個(gè)transformer層中用于音頻模態(tài)的待學(xué)習(xí)的全局提示詞,從而利用式4得到第i個(gè)transformer層輸出的At的音頻模態(tài)特征表示、視覺模態(tài)的中間查詢提示詞、音頻模態(tài)的中間全局提示詞; 4 步驟2.2.6、將i+1賦值給i后,返回步驟2.2.2順序執(zhí)行,直到iN為止,從而得到Vt的第N個(gè)視覺模態(tài)特征表示和At的第N個(gè)音頻模態(tài)特征表示,進(jìn)而得到V的視覺模態(tài)特征表示序列和音頻模態(tài)特征表示序列,其中,N表示transformer層的總層數(shù); 步驟3構(gòu)建事件定位模塊,包括,視頻事件類別分類器和事件相關(guān)性預(yù)測(cè)器,并分別對(duì)和在特征維度上拼接后的融合特征進(jìn)行轉(zhuǎn)換,相應(yīng)得到V的事件類別預(yù)測(cè)標(biāo)簽以及事件片段的定位預(yù)測(cè)標(biāo)簽: 步驟4、基于和,和構(gòu)建反向傳播的總損失函數(shù)L: 步驟4.1、利用式8得到視頻事件類別分類器的交叉熵?fù)p失函數(shù)值: 8 式8中,表示中屬于第k個(gè)音視頻事件類別的概率; 步驟4.2、利用式9得到事件相關(guān)性預(yù)測(cè)器的二分類交叉熵?fù)p失函數(shù)值: 9 式9中,表示中的第t個(gè)音視頻片段V’t和A’t是否屬于事件片段的預(yù)測(cè)概率; 步驟4.3、利用式10得到總損失函數(shù)L: 10 式10中,為平衡參數(shù); 步驟5基于真實(shí)的視頻事件標(biāo)簽對(duì)待學(xué)習(xí)的查詢提示詞和全局提示詞以及事件定位模塊進(jìn)行訓(xùn)練,并計(jì)算總損失函數(shù)L,同時(shí)使用自適應(yīng)矩估計(jì)優(yōu)化方法以學(xué)習(xí)率來更新參數(shù),直至L收斂為止,從而得到最優(yōu)的音視頻事件定位模型,用于對(duì)輸入的音視頻進(jìn)行處理,得到視頻中的事件定位結(jié)果。

          如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人中國(guó)科學(xué)技術(shù)大學(xué),其通訊地址為:230026 安徽省合肥市包河區(qū)金寨路96號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。

          以上內(nèi)容由AI智能生成
          免責(zé)聲明
          1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
          2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
          主站蜘蛛池模板: 亚洲最大av资源网在线观看| 麻豆国产成人AV在线播放| 亚洲综合网站色欲色欲| 玩成熟老熟女视频| 欧美精品一区二区蜜臀亚洲| 欧美v亚洲v日韩v最新在线| 日本精品一区二区三区四区| 免费看一区二区三区四区| 极品粉嫩嫩模大尺度无码视频| 精品人伦一区二区三区蜜桃免费| 丁香五月激情综合国产| 老色鬼永久精品网站| 国产 在线 | 日韩| 在线亚洲97se亚洲综合在线| 精品一卡2卡3卡4卡新区在线| 亚洲精品国产综合久久一线 | 国产午夜激无码av毛片不卡| 亚洲伊人久久综合成人| 2020久久超碰国产精品最新| 又紧又黄的免费视频网站| 人妻无码中文专区久久五月婷| 中文无码vr最新无码av专区| 亚洲中文字幕永久在线不卡| 久久疯狂做爰xxxⅹ高潮直播| 亚洲色偷偷男人的天堂| 人妻丰满熟妇无码区免费| 法国啄木乌av片在线播放| 久久久久亚洲精品天堂| 亚洲国产精品日韩在线| 鲁丝片一区二区三区免费| 亚洲色大成网站WWW永久麻豆| 精品视频在线观看免费观看| 国产乱人伦偷精品视频下| 亚洲AV成人无码精品电影在线| 国产欧美在线亚洲一区| 亚欧乱色国产精品免费九库| 三叶草欧洲码在线| 黄瓜视频在线观看网址| 欧美黑吊大战白妞| 日韩乱码人妻无码超清蜜桃| 国产熟妇人妻精品一区二区动漫|