深圳壹賬通智能科技有限公司陳家豪獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉深圳壹賬通智能科技有限公司申請的專利一種樣本篩選方法、系統及神經網絡模型訓練方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114154570B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111445742.1,技術領域涉及:G06F18/2113;該發明授權一種樣本篩選方法、系統及神經網絡模型訓練方法是由陳家豪;蔣宏達;徐亮設計研發完成,并于2021-11-30向國家知識產權局提交的專利申請。
本一種樣本篩選方法、系統及神經網絡模型訓練方法在說明書摘要公布了:本發明涉及人工智能技術領域,提供一種樣本篩選方法、系統及神經網絡模型訓練方法,通過計算未標注樣本集和標注樣本集之間的距離,并根據距離進行排序,得到排序結果;通過提取未標注樣本集的表征參數,得到對應的活躍值;基于排序結果和活躍值,從未標注樣本集中選擇部分樣本進行標注,得到新的標注樣本集;本發明在選擇與訓練任務相關的樣本的同時,還保持了對無關數據的低采樣率,并避免了采集到與訓練任務無關的離群點,從而保證了采樣到有價值的樣本,由此在神經網絡模型的訓練過程中,避免了與任務毫無關聯的樣本對訓練結果的影響,進而提高了神經網絡模型的識別精度。
本發明授權一種樣本篩選方法、系統及神經網絡模型訓練方法在權利要求書中公布了:1.一種樣本篩選方法,其特征在于,包括: 構建第一訓練集,所述第一訓練集包括未標注樣本集和標注樣本集; 分別對所述未標注樣本集和所述標注樣本集進行聚類分析,得到第一聚類群和第二聚類群,根據所述第一聚類群和所述第二聚類群,計算所述未標注樣本集和所述標注樣本集之間的距離,并按照從小到大的順序進行排序,得到排序結果; 將所述未標注樣本集輸入預訓練的語言識別模型中,通過激活函數提取對應的表征參數,計算各表征參數的活躍值; 根據所述排序結果和所述活躍值,從所述未標注樣本集中選擇部分樣本進行標注,并將標注后的樣本加入所述標注樣本集中,形成新的標注樣本集; 組合所述未標注樣本集中剩余的樣本、所述新的標注樣本集,形成篩選后的第一訓練集; 以及,所述根據所述排序結果,從所述未標注樣本集中選擇部分樣本進行標注的步驟包括: 按照排序結果,選擇多個位置區間; 為每個位置區間分配采樣率,其中,排序靠前的位置區間的采樣率大于排序靠后的位置區間的采樣率; 根據采樣率,提取各位置區間對應的來自第一聚類群的聚類,對提取的各聚類中的所有樣本進行標注。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人深圳壹賬通智能科技有限公司,其通訊地址為:518066 廣東省深圳市前海深港合作區前灣一路1號A棟201室(入駐深圳市前海商務秘書有限公司);或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。