重慶腦與智能科學中心冷佳旭獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉重慶腦與智能科學中心申請的專利基于雙曲不確定性恢復的視頻行人重識別方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120580646B 。
龍圖騰網通過國家知識產權局官網在2025-09-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202511053142.9,技術領域涉及:G06V20/52;該發明授權基于雙曲不確定性恢復的視頻行人重識別方法及系統是由冷佳旭;況長江;李爽;陳雪;高新波設計研發完成,并于2025-07-30向國家知識產權局提交的專利申請。
本基于雙曲不確定性恢復的視頻行人重識別方法及系統在說明書摘要公布了:本發明涉及計算機視覺技術領域,具體涉及基于雙曲不確定性恢復的視頻行人重識別方法及系統。所述方法包括:將行人目標轉為視覺特征patch塊獲視頻特征,輸入文本提示得文本特征,計算其與視覺特征patch塊相似度并排序,取梯度變化最大索引前patch特征均值融合得行人部件特征;對特征局部加噪,由擴散模型預測加噪前特征;去噪時,以加噪后遮擋特征為輸入、未遮擋原始特征為條件指導學習。將網絡結果映射到雙曲空間建模預測,計算采樣結果均值并選取置信度最高的結果,將行人部件特征輸入擴散模型預測得到行人重識別結果。本方案能夠削弱遮擋對視頻行人重識別的影響,提高行人被遮擋的情況下的識別準確率。
本發明授權基于雙曲不確定性恢復的視頻行人重識別方法及系統在權利要求書中公布了:1.一種基于雙曲不確定性恢復的視頻行人重識別方法,其特征在于,包括: 輸入視頻進行特征提取,將圖像中的行人目標轉換為對應的視覺特征patch塊,得到每一幀圖像對應的視頻特征; 選擇行人特征,包括: 將設計的文本提示輸入CLIP的文本編碼器得到文本特征; 計算每個文本特征與每個視覺特征patch塊的相似度并進行排序; 計算其相似度的梯度,找到梯度變化最大的索引,取出該索引前的所有patch特征,取均值融合為部件特征,得到行人部件特征; 雙曲不確定性恢復,包括: 通過擴散模型的訓練方式,對特征進行局部加噪,從可見區域中推理被遮擋區域的內容,通過擴散模型預測加噪前的特征; 在去噪過程中,以加噪后的遮擋特征作為輸入,以完整未遮擋的原始特征作為條件信息指導擴散模型學習去噪,采用顯式的監督信號,通過最小化預測噪聲與實際噪聲之間的均方誤差損失來監督模型的去噪過程; 將網絡得到的結果映射到雙曲空間,并進行建模和預測,包括: 從預測中采集多個結果后計算其與雙曲空間原點距離: 其中,為雙曲空間原點,為預測結果,k是雙曲模型的曲率; 使用球面半徑本身來構造一個有界的歸一化距離,得到歸一化度量; 設置閾值,當超過閾值時,就認為模型是置信的,選擇置信度最高的采樣結果作為最終結果;當沒有超過閾值時,認為模型是不確定的; 計算所有采樣結果在雙空間中的均值,捕捉多個預測之間共享的語義抽象,實現在具體性與泛化性之間的平衡: 其中,是的權重,是雙曲空間的保形因子,是M?bius加法; 計算所有采樣結果在雙曲空間中的均值,選擇置信度最高的采樣結果作為結果; 進行模型訓練和推理,將行人部件特征輸入到擴散模型中進行預測,得到行人重識別結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人重慶腦與智能科學中心,其通訊地址為:401336 重慶市南岸區富源大道50、52號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。