浙江工商大學董建鋒獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浙江工商大學申請的專利一種基于層級多視角的自監督動作識別方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115147676B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210724589.4,技術領域涉及:G06V10/774;該發明授權一種基于層級多視角的自監督動作識別方法及裝置是由董建鋒;孫圣凱;陳書界;王勛;劉寶龍;蔡佳航;楊文武設計研發完成,并于2022-06-23向國家知識產權局提交的專利申請。
本一種基于層級多視角的自監督動作識別方法及裝置在說明書摘要公布了:本發明公開了一種基于層級多視角的自監督動作識別方法及裝置,該方法包括:先是對比學習的預訓練階段,原始數據通過數據增強和重組分別通過key編碼器和query編碼器提取特征構造正負樣本。特征提取時通過視角生成模塊得到不同尺度的子視角,分別通過Transformer編碼、聚合、拼接后得到時間特征、空間特征以及兩者的組合:時空特征。時空特征通過對比損失達到拉近正樣本、推遠負樣本的目標以獲取特征表示能力。通過時間特征和空間特征間的一致性損失拉近不同視角間的特征距離。本發明是骨架動作識別領域一種新穎的層級化視角的建模方法,可以深入挖掘不同視角間的互補信息,能夠實現比現有方法性能更好的骨架動作識別。
本發明授權一種基于層級多視角的自監督動作識別方法及裝置在權利要求書中公布了:1.一種基于層級多視角的自監督動作識別方法,其特征在于,包括以下步驟: S1,對原始的無標簽的骨架序列進行預處理,得到視角歸一化骨架序列; S2,將視角歸一化骨架序列經過兩個隨機的同族數據增強,得到增強骨架序列; S3,將增強骨架序列分別輸入到query編碼器、key編碼器進行編碼,分別得到對應的時空特征,各個時空特征均包含原始的無標簽的骨架序列的時間特征和空間特征;所述query編碼器和key編碼器獲得時空特征中原始的無標簽的骨架序列的時間特征均具體包括以下步驟: S31,對增強骨架序列重組得到不同視角下的骨架數據,得到增強骨架序列的幀視角和節點視角形式,其中,幀視角是增強骨架序列中單幀骨架所有信息為序列元素,而節點視角是增強骨架序列中單個節點所有信息為序列元素; S32,先提取序列元素中存在的時間特征,將幀視角通過全連接層將低維數據映射到高維嵌入空間,分離籠統的特征,得到幀視角嵌入層特征; S33,通過視角生成模塊對幀視角嵌入層特征進行重組而得到第一級的片段視角,其中,視角生成模塊包括一維卷積神經網絡、層歸一化、線性整流激活函數和一維最大池化,并使用視角生成模塊對第一級的片段視角重組得到第二級的片段視角,將幀視角稱為父視角,不同級片段視角稱為子視角,父視角和不同級的子視角組成了層級化的時間視角; S34,先對不同的時間視角的增強骨架序列添加位置編碼,得到不同的位置編碼時間視角;然后分別通過Transformer編碼不同的位置編碼時間視角,得到不同的時間視角特征,其中,Transformer的自注意力計算發生在時間維度上; 再通過一維最大池化聚合不同的時間視角特征,得到不同的視頻級特征信息; 最后將不同的視頻級特征信息拼接成整個層級化時間特征; S4,將步驟S3得到的時空特征均進行對比損失計算,并對步驟S3得到的原始的無標簽的骨架序列的時間特征和空間特征均進行一致性損失計算,并將對比損失和一致性損失計算結果相加,得到總損失函數; S5,使用總損失函數,以端對端的方式進行自監督學習,構建預訓練模型; S6,使用預訓練模型中的query編碼器,并在query編碼器后加入一個由全連接層組成的分類器,得到由編碼器和分類器構成的下游動作識別任務訓練模型; S7,將帶標簽的骨架序列輸入到所述下游動作識別任務訓練模型中,使用下游動作識別任務訓練模型中的編碼器從帶標簽的骨架數據中提取特征,將提取的特征通過分類器進行分類,將分類的結果用交叉熵損失函數進行端到端的訓練,構建動作識別模型; S8,使用動作識別模型進行動作識別。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江工商大學,其通訊地址為:310018 浙江省杭州市下沙高教園區學正街18號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。