騰訊科技(深圳)有限公司謝蓯獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉騰訊科技(深圳)有限公司申請的專利一種文生圖模型的訓練方法、裝置、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117173504B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311044371.5,技術領域涉及:G06V10/774;該發明授權一種文生圖模型的訓練方法、裝置、設備及存儲介質是由謝蓯;盧健祥;郭卉設計研發完成,并于2023-08-17向國家知識產權局提交的專利申請。
本一種文生圖模型的訓練方法、裝置、設備及存儲介質在說明書摘要公布了:一種文生圖模型的訓練方法、裝置、設備及存儲介質,涉及人工智能;基于圖文樣本對訓練集,對待訓練文生圖模型執行迭代訓練,獲得目標文本生模型;一次訓練過程中:從圖文樣本對訓練集中選取圖文樣本對,圖文樣本對包括樣本圖像和描述文本,樣本圖像中包括至少兩個物體;獲得至少兩個物體各自對應的掩碼圖像及關聯的物體類名,掩碼圖像用于區別物體在樣本圖像中的位置區域;將樣本圖像以及描述文本,輸入待訓練文生圖模型,獲得樣本圖像的圖像預測噪聲,將至少兩個掩碼圖像以及關聯的物體類名,輸入待訓練文生圖模型,獲得至少兩個掩碼圖像各自關聯的物體預測噪聲;基于圖像預測噪聲和物體預測噪聲構建的損失函數,對待訓練文生圖模型進行調參。
本發明授權一種文生圖模型的訓練方法、裝置、設備及存儲介質在權利要求書中公布了:1.一種文生圖模型的訓練方法,其特征在于,所述方法包括: 基于圖文樣本對訓練集,對待訓練文生圖模型執行循環迭代訓練,獲得目標文生圖模型;其中,在一次循環迭代過程中執行: 從所述圖文樣本對訓練集中選取圖文樣本對;其中,所述圖文樣本對包括:樣本圖像和所述樣本圖像的描述文本,所述樣本圖像中包括至少兩個物體; 獲得所述至少兩個物體各自對應的掩碼圖像及關聯的物體類名;其中,所述掩碼圖像用于區別相應物體在所述樣本圖像中的位置區域; 將所述樣本圖像以及所述描述文本,輸入所述待訓練文生圖模型,獲得所述樣本圖像的圖像預測噪聲;以及將至少兩個掩碼圖像及關聯的物體類名,輸入所述待訓練文生圖模型,獲得至少兩個物體預測噪聲,其中一個物體預測噪聲對應一個掩碼圖像; 基于所述圖像預測噪聲和所述至少兩個物體預測噪聲構建的損失函數,對所述待訓練文生圖模型進行調參。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人騰訊科技(深圳)有限公司,其通訊地址為:518044 廣東省深圳市南山區高新區科技中一路騰訊大廈35層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。