北京百度網訊科技有限公司王學寬獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網獲悉北京百度網訊科技有限公司申請的專利目標模型生成方法、圖像處理方法和裝置獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產權局授予,授權公告號為:CN117475252B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202311279747.0,技術領域涉及:G06V10/774;該發(fā)明授權目標模型生成方法、圖像處理方法和裝置是由王學寬;路金誠;顧聞;張偉;譚嘯設計研發(fā)完成,并于2023-09-28向國家知識產權局提交的專利申請。
本目標模型生成方法、圖像處理方法和裝置在說明書摘要公布了:本公開提供了目標模型生成方法、圖像處理方法和裝置,涉及人工智能、計算機視覺、深度學習、大模型、自動駕駛、智能交通等技術領域。具體方案為:基于掩碼圖對樣本圖像進行掩碼處理,得到掩碼后的樣本圖像;將掩碼后的樣本圖像輸入預設模型,得到掩碼區(qū)域的特征和未掩碼區(qū)域的特征;根據掩碼區(qū)域的特征,得到掩碼特征信息;基于掩碼特征信息和未掩碼區(qū)域的特征,得到掩碼區(qū)域的重建特征;基于掩碼區(qū)域的重建特征對應的重建損失和未掩碼區(qū)域的特征對應的蒸餾損失,對預設模型進行預訓練,得到訓練后的目標模型。
本發(fā)明授權目標模型生成方法、圖像處理方法和裝置在權利要求書中公布了:1.一種目標模型生成方法,包括: 基于掩碼圖對樣本圖像進行掩碼處理,得到掩碼后的樣本圖像,其中,所述掩碼后的樣本圖像包括掩碼區(qū)域圖像和未掩碼區(qū)域圖像; 將所述掩碼后的樣本圖像輸入預設模型,得到所述預設模型輸出的掩碼區(qū)域的特征和未掩碼區(qū)域的特征,其中,所述掩碼區(qū)域的特征對應于所述掩碼區(qū)域圖像,所述未掩碼區(qū)域的特征對應于所述未掩碼區(qū)域圖像; 根據所述掩碼區(qū)域的特征,得到掩碼特征信息;其中,所述掩碼特征信息是根據所述預設模型輸出的掩碼區(qū)域的特征賦值得到的; 基于所述掩碼特征信息、所述未掩碼區(qū)域的特征,得到所述掩碼區(qū)域的重建特征; 基于所述掩碼區(qū)域對應的重建特征對應的重建損失和所述未掩碼區(qū)域的特征對應的蒸餾損失,對所述預設模型進行預訓練,得到訓練后的目標模型; 其中,所述掩碼圖與所述樣本圖像具有相同尺寸,所述掩碼處理包括將所述樣本圖像與所述掩碼圖進行元素乘運算; 其中,所述基于所述掩碼區(qū)域對應的重建特征對應的重建損失和所述未掩碼區(qū)域的特征對應的蒸餾損失,對所述預設模型進行預訓練,得到訓練后的目標模型,包括: 將所述樣本圖像輸入特征提取模型,得到所述特征提取模型輸出的所述樣本圖像的特征; 基于所述掩碼區(qū)域圖像和所述未掩碼區(qū)域圖像對應的位置,確定所述樣本圖像的特征中的掩碼區(qū)域的參考特征和未掩碼區(qū)域的參考特征; 基于所述掩碼區(qū)域的重建特征與所述掩碼區(qū)域的參考特征,得到重建損失; 基于所述未掩碼區(qū)域的特征與所述未掩碼區(qū)域的參考特征,得到蒸餾損失; 基于所述重建損失和所述蒸餾損失對所述預設模型進行預訓練,得到訓練后的目標模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京百度網訊科技有限公司,其通訊地址為:100085 北京市海淀區(qū)上地十街10號百度大廈2層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。