粵港澳大灣區數字經濟研究院(福田)趙亮獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉粵港澳大灣區數字經濟研究院(福田)申請的專利文本智能標注方法、系統、智能終端及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115658885B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211026245.2,技術領域涉及:G06F16/353;該發明授權文本智能標注方法、系統、智能終端及存儲介質是由趙亮;王昊;曾忠燊;張家興設計研發完成,并于2022-08-25向國家知識產權局提交的專利申請。
本文本智能標注方法、系統、智能終端及存儲介質在說明書摘要公布了:本發明公開了文本智能標注方法、系統、智能終端及存儲介質,其中,上述方法包括:獲取待標注文本;根據預先訓練好的文本分類模型獲取上述待標注文本的預測標注信息,并根據上述預測標注信息對上述待標注文本進行標注,其中,上述文本分類模型預先根據訓練樣本數據進行訓練,上述訓練樣本數據包括真實樣本數據和根據上述真實樣本數據生成的模擬樣本數據。與現有技術相比,本發明中使用的文本分類模型可以預先結合真實樣本數據和模擬樣本數據訓練獲得。即使在真實樣本數據較少或難以采集到真實樣本數據時,也可以基于采集的少量真實樣本數據生成大量模擬樣本數據,從而提高文本分類模型的訓練效果,進而提高文本標注的效果和準確性。
本發明授權文本智能標注方法、系統、智能終端及存儲介質在權利要求書中公布了:1.一種文本智能標注方法,其特征在于,所述文本智能標注方法包括: 獲取待標注文本; 根據預先訓練好的文本分類模型獲取所述待標注文本的預測標注信息,并根據所述預測標注信息對所述待標注文本進行標注,其中,所述文本分類模型根據訓練樣本數據進行預訓練,所述訓練樣本數據包括真實樣本數據和根據所述真實樣本數據生成的模擬樣本數據,所述真實樣本數據中包括預先采集的真實文本; 所述文本分類模型在預訓練過程中的每一次迭代時都重新生成模擬樣本數據; 在所述文本分類模型預訓練過程中,根據所述真實樣本數據生成所述模擬樣本數據之后,分別獲取各未標注文本的目標特征,其中,所述未標注文本包括未標注的真實文本和未標注的模擬文本,所述目標特征包括目標隱向量,所述未標注的真實文本的目標隱向量是預先設置的默認隱向量,所述未標注的模擬文本的目標隱向量是文本直接生成模型或文本受控生成模型生成所述未標注的模擬文本的過程中產生的隱向量;根據所述目標特征,通過預先設置的多層全連接網絡獲取各所述未標注文本的排序分數;根據所述排序分數向目標對象依次展示各所述未標注文本。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人粵港澳大灣區數字經濟研究院(福田),其通訊地址為:518045 廣東省深圳市福田區福保街道市花路長富金茂大廈1號樓39樓3901單元;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。