北京三快在線科技有限公司曾疆維獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京三快在線科技有限公司申請的專利樣本篩選方法、裝置、設備、存儲介質及程序產品獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114492756B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210107237.4,技術領域涉及:G06F18/214;該發明授權樣本篩選方法、裝置、設備、存儲介質及程序產品是由曾疆維;謝乾龍;王興星設計研發完成,并于2022-01-28向國家知識產權局提交的專利申請。
本樣本篩選方法、裝置、設備、存儲介質及程序產品在說明書摘要公布了:本申請公開了一種樣本篩選方法、裝置、設備、存儲介質及程序產品,屬于神經網絡技術領域。該方法獲取多個第一樣本內容項和多個第二樣本內容項,對于每個第一樣本內容項,對該第一樣本內容項分別進行不同的特征刪減處理,得到該第一樣本內容項的兩個副本,再基于多個第一樣本內容項的副本,確定每個第一樣本內容項的特征向量,基于多個第一樣本內容項的特征向量和多個第二樣本內容項的特征向量,從多個第一樣本內容項中篩選負樣本內容項。由于得到的特征向量可以表征樣本內容項的內容信息,因此,根據該內容信息篩選的負樣本內容項具有較高的可靠性,則根據篩選的負樣本內容項訓練得到的模型準確性較高,從而可以提高內容項推薦效果。
本發明授權樣本篩選方法、裝置、設備、存儲介質及程序產品在權利要求書中公布了:1.一種樣本篩選方法,其特征在于,所述方法包括: 獲取多個第一樣本內容項和多個第二樣本內容項,所述第一樣本內容項為向目標賬號推薦的歷史內容項,所述第二樣本內容項為所述目標賬號歷史點擊過的內容項; 對于每個第一樣本內容項,對所述第一樣本內容項分別進行第一特征刪減處理和第二特征刪減處理,得到第一副本和第二副本; 基于所述多個第一樣本內容項的第一副本和第二副本,確定每個第一樣本內容項的特征向量,所述特征向量用于表征所述第一樣本內容項的內容信息; 基于所述多個第一樣本內容項的特征向量和所述多個第二樣本內容項的特征向量,從所述多個第一樣本內容項中篩選負樣本內容項,所述負樣本內容項用于訓練內容項推薦模型; 所述基于所述多個第一樣本內容項的第一副本和第二副本,確定每個第一樣本內容項的特征向量,包括: 基于所述多個第一樣本內容項的第一副本和第二副本,構建多個樣本對; 確定每個樣本對的樣本標簽; 基于所述多個樣本對以及所述每個樣本對的樣本標簽,確定每個第一樣本內容項的特征向量; 所述基于所述多個樣本對以及所述每個樣本對的樣本標簽,確定每個第一樣本內容項的特征向量,包括: 對于每個樣本對,基于所述樣本對中兩個副本的樣本特征,確定所述樣本對中兩個副本的相似度; 基于所述多個樣本對的相似度和樣本標簽,確定目標向量矩陣,所述目標向量矩陣中存儲多個第一樣本內容項的特征向量; 從所述目標向量矩陣中獲取每個第一樣本內容項的特征向量; 所述基于所述多個第一樣本內容項的特征向量和所述多個第二樣本內容項的特征向量,從所述多個第一樣本內容項中篩選負樣本內容項,包括: 對于每個第二樣本內容項,確定所述第二樣本內容項的特征向量與所述多個第一樣本內容項的特征向量的相似度,得到多個相似度; 獲取推薦參數,所述推薦參數用于表示向所述目標賬號推薦的內容項與所述第二樣本內容項的相似度; 基于所述推薦參數,從所述多個第一樣本內容項中篩選相似度符合所述推薦參數的第一樣本內容項作為負樣本內容項。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京三快在線科技有限公司,其通訊地址為:100080 北京市海淀區北四環西路9號2106-030;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。