北京沃東天駿信息技術有限公司張若興獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京沃東天駿信息技術有限公司申請的專利一種文本抽樣方法、裝置、設備和存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117149942B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210556057.4,技術領域涉及:G06F16/334;該發明授權一種文本抽樣方法、裝置、設備和存儲介質是由張若興設計研發完成,并于2022-05-20向國家知識產權局提交的專利申請。
本一種文本抽樣方法、裝置、設備和存儲介質在說明書摘要公布了:本發明實施例公開了一種文本抽樣方法、裝置、設備和存儲介質,該方法包括:通過對待抽樣語料進行向量化處理,確定待抽樣語料對應的預設維度向量集;將預設維度向量集所構成的語義空間劃分為第一預設數量的第一語義子空間,并基于高斯核密度估計確定各第一語義子空間內的抽樣密度;根據抽樣密度將各第一語義子空間劃分為第二預設數量的第二語義子空間,并確定各第二語義子空間內的鄰域樣本集;對各鄰域樣本集進行抽樣,根據所有鄰域樣本集對應的抽樣結果確定文本抽樣結果。上述技術方案,將待抽樣語料對應的語義空間劃分為第二語義子空間,根據各第二語義子空間中抽樣得到的抽樣結果確定文本抽樣結果,實現對待抽樣語料的分層抽樣。
本發明授權一種文本抽樣方法、裝置、設備和存儲介質在權利要求書中公布了:1.一種文本抽樣方法,其特征在于,包括: 通過對待抽樣語料進行向量化處理,確定所述待抽樣語料對應的預設維度向量集; 將所述預設維度向量集所構成的語義空間劃分為第一預設數量的第一語義子空間,并基于高斯核密度估計確定各所述第一語義子空間內的抽樣密度; 根據所述抽樣密度將各所述第一語義子空間分別劃分為第二預設數量的第二語義子空間,并確定各所述第二語義子空間內的鄰域樣本集; 對各所述鄰域樣本集進行抽樣,根據各所述鄰域樣本集對應的抽樣結果確定文本抽樣結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京沃東天駿信息技術有限公司,其通訊地址為:100176 北京市大興區北京經濟技術開發區科創十一街18號院2號樓4層A402室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。