浙江農林大學周厚奎獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浙江農林大學申請的專利一種基于GMamba模型的垃圾分類方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120431408B 。
龍圖騰網通過國家知識產權局官網在2025-09-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510889185.4,技術領域涉及:G06V10/764;該發明授權一種基于GMamba模型的垃圾分類方法是由周厚奎;丁奇灃設計研發完成,并于2025-06-30向國家知識產權局提交的專利申請。
本一種基于GMamba模型的垃圾分類方法在說明書摘要公布了:本發明公開了一種基于GMamba模型的垃圾分類方法,所述方法包括:通過攝像頭和互聯網搜索獲取垃圾圖像,并進行數據增強預處理;在GMamba模型中引入輕量模塊GML和核心模塊GMC,分別通過輕量掃描機制LSM和核心掃描機制CSM,增強局部與長程空間依賴特征的提取能力;采用混合損失函數,結合焦點損失和交叉熵損失,動態優化類別不平衡問題;將預處理后的圖像數據輸入GMamba模型進行訓練與測試,獲得最優模型;最后,將待分類圖像輸入最優模型,輸出分類結果。本發明提出的基于GMamba的垃圾自動識別方法,以輕量化設計和高準確率實現高效、精準的垃圾分類,特別適用于資源受限設備,具有廣闊的應用前景。
本發明授權一種基于GMamba模型的垃圾分類方法在權利要求書中公布了:1.一種基于GMamba模型的垃圾分類方法,其特征在于,包括如下步驟: a.收集并預處理垃圾圖像數據集,首先在自然場景中通過攝像頭采集垃圾圖像,同時利用互聯網搜索構建垃圾圖像數據集T,并對數據集T進行數據預處理,得到處理后的新垃圾圖像數據集MT;在預處理過程中,對數據集T中的每張圖像I∈T進行尺寸歸一化、對比度調整和數據增強操作,以優化圖像清晰度并增強特征提取的有效性; b.構建一種基于GMamba模型的垃圾分類模型,改進方法包括在Mamba網絡中引入LSM輕量掃描機制,采用空洞采樣和特征重組機制,在保持全局感受野的同時減少計算量;具體方法為,對所述步驟a中的輸入垃圾圖片I進行四個方向的空洞采樣,按固定步長對輸入特征圖I進行間隔采樣,分解為多個較小的塊;間隔采樣各個塊索引的計算過程如下所示: 其中i∈{0,1,2,…,H-1},j∈{0,1,2,…,W-1}是輸入特征圖的空間坐標,H和W分別是輸入特征圖I的高度和寬度,p是固定的步長,表示向下取整,使用sin和cos函數引入周期性偏移,確保采樣點分布更均勻,a,b是間隔采樣的各個塊索引空間坐標;然后采樣后的塊Pk可以表示為: 其中k∈{0,1,2,…,C-1},C是輸入特征圖I的通道數;然后對每個采樣后的塊Pk應用SSM模塊,提取局部特征,計算過程如下所示: At=SoftplusNA·Pk+bA Bt=NB·Pk+bB Ct=NC·SiLUPk+bC ht=Atht-1+BtPk 其中,NA、NB、NC是固定的可學習參數,通過模型訓練優化,初始化通常采用正態分布,bA、bB、bC是固定的可學習偏置矩陣,初始化為零或小隨機值,Softplus·和SiLU·表示激活函數,確保矩陣計算的元素保持正數,ht是時間t的隱藏狀態,ht-1是前一個隱藏狀態,狀態轉換矩陣At、輸入矩陣Bt和輸出矩陣Ct根據輸入Pk在每個時間步動態生成,是處理后的局部特征圖輸出;最后將所有通道的局部特征合并為一個全局特征圖,計算過程如下所示: 其中,Concat·表示特征圖拼接操作,Fglobal為最終生成的全局特征圖; 引入CSM核心掃描機制,采用多方向掃描路徑和全面掃描機制,橋接了一維序列掃描和二維平面遍歷之間的差距,高效地捕獲圖像中的長程依賴關系和上下文信息;CSM核心掃描機制包括選擇性交叉掃描和交叉合并兩個主要步驟,具體方法為,對所述步驟a中的輸入垃圾圖片I展開為多個一維序列,以便進行選擇性掃描,計算過程如下所示: Sd=FlattendI 其中Flattend·表示特征圖展平操作,d∈{1,2,3,4}表示掃描的方向,具體取值為四種路徑:行正向、行逆向、列正向和列逆向,Sd表示第d個方向的序列;每個掃描路徑的序列Sd單獨輸入到SSM模塊中,四個SSM模塊并行處理四個方向的序列,得到四組增強后的序列計算過程如下所示: Dt=SoftplusND·Sd+bD Et=NE·Sd+bE Ft=NF·SiLUSd+bF qt=Dtqt-1+EtSd 其中,ND、NE、NF是固定的可學習參數,通過模型訓練優化,初始化通常采用正態分布,bD、bE、bF是固定的可學習偏置矩陣,初始化為零或小隨機值,qt是時間t的隱藏狀態,qt-1是前一個隱藏狀態,狀態轉換矩陣Dt、輸入矩陣Et和輸出矩陣Ft根據輸入Sd在每個時間步動態生成;然后對四個方向的進行反序列化,將每個序列重構為二維特征圖Yd,每個方向生成一個新的特征圖Fd,然后對四個方向的特征圖進行融合,計算過程如下所示: Fd=ReshapeYd 其中UnFlattend·表示特征圖反序列化操作,Reshape·表示調整特征圖維度操作,滿足后續矩陣計算的要求,Ffuse表示融合后的全局特征圖; 訓練階段采用混合損失函數,結合焦點損失和交叉熵損失,優化類別不平衡問題,提升模型泛化性能; c.將預處理后的垃圾圖像數據集輸入GMamba模型進行訓練與驗證,通過迭代訓練保存最優模型權重,并使用驗證集評估模型性能,評估指標包括Top-1準確率、精確率、召回率、F1分數、參數量以及訓練時間; d.將待分類的垃圾圖像輸入至步驟c訓練得到的GMamba模型,通過正向計算輸出分類結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江農林大學,其通訊地址為:311300 浙江省杭州市臨安區武肅街666號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。