北京達佳互聯信息技術有限公司林和政獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京達佳互聯信息技術有限公司申請的專利視頻特征提取模型的訓練方法、文本生成方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114996515B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210615076.X,技術領域涉及:G06V20/40;該發明授權視頻特征提取模型的訓練方法、文本生成方法及裝置是由林和政;吳翔宇設計研發完成,并于2022-05-31向國家知識產權局提交的專利申請。
本視頻特征提取模型的訓練方法、文本生成方法及裝置在說明書摘要公布了:本公開關于一種視頻特征提取模型的訓練方法、文本生成方法及裝置,屬于計算機技術領域。本公開實施例中,利用樣本視頻的圖像信息、文本信息以及該樣本視頻的文本標簽、圖像標簽,來對視頻特征提取模型進行模型訓練,提供了一種基于雙訓練任務的模型訓練方法,在以文本生成任務為主任務而圖像重建任務為輔任務的情況下,由于該樣本視頻的圖像標簽表示圖像重建特征,因此在模型訓練的過程中,能夠提升視頻特征提取模型針對圖像特征的提取能力,進而獲取到高質量的圖像特征,在獲取到高質量的圖像特征的基礎上,也就能夠訓練出文本生成能力較優的視頻特征提取模型,提升了視頻特征提取模型的訓練效果。
本發明授權視頻特征提取模型的訓練方法、文本生成方法及裝置在權利要求書中公布了:1.一種視頻特征提取模型的訓練方法,其特征在于,所述方法包括: 獲取樣本視頻的圖像信息、文本信息、圖像標簽以及文本標簽,所述圖像標簽表示圖像重建特征,所述文本標簽表示所述樣本視頻的內容描述文本,所述文本信息的數量為多個; 將所述圖像信息與所述文本信息輸入視頻特征提取模型,通過所述視頻特征提取模型的圖像特征提取子模型對所述圖像信息進行特征提取,得到所述樣本視頻的圖像特征,對多個所述文本信息進行拼接,得到拼接后的所述文本信息,從拼接后的所述文本信息中提取前目標數量的字符之后,基于所提取的字符,通過所述視頻特征提取模型的特征融合子模型的嵌入層對所述文本信息進行處理,得到所述樣本視頻的文本特征,通過所述特征融合子模型的特征融合層對所述圖像特征與所述文本特征進行特征融合,得到所述樣本視頻的融合特征; 通過所述視頻特征提取模型的圖像重建子模型對所述融合特征中的圖像特征進行圖像復原,得到原始圖像大小的圖像訓練結果,通過所述視頻特征提取模型的文本生成子模型對所述融合特征進行處理,得到文本訓練結果; 基于所述圖像訓練結果、所述文本訓練結果以及所述樣本視頻的圖像標簽、文本標簽,調整所述圖像特征提取子模型、所述特征融合子模型、所述圖像重建子模型以及所述文本生成子模型的模型參數,以對所述視頻特征提取模型進行訓練。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京達佳互聯信息技術有限公司,其通訊地址為:100085 北京市海淀區上地西路6號1幢1層101D1-7;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。