廣州歡聊網(wǎng)絡(luò)科技有限公司譚又偉獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉廣州歡聊網(wǎng)絡(luò)科技有限公司申請的專利一種實體的別名挖掘方法、裝置、計算機設(shè)備和存儲介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN113988076B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-09發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202111288969.X,技術(shù)領(lǐng)域涉及:G06F40/295;該發(fā)明授權(quán)一種實體的別名挖掘方法、裝置、計算機設(shè)備和存儲介質(zhì)是由譚又偉;丁寧設(shè)計研發(fā)完成,并于2021-11-02向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種實體的別名挖掘方法、裝置、計算機設(shè)備和存儲介質(zhì)在說明書摘要公布了:本發(fā)明涉及一種實體的別名挖掘方法、裝置、計算機設(shè)備和存儲介質(zhì)。在本實施例中,所述方法包括:獲取用戶行為數(shù)據(jù)、用戶播放聲音的數(shù)據(jù),所述用戶行為數(shù)據(jù)包括檢索點擊行為數(shù)據(jù)、播放行為數(shù)據(jù);基于用戶行為數(shù)據(jù),抽取會話數(shù)據(jù);從檢索點擊行為數(shù)據(jù)、用戶播放聲音的數(shù)據(jù)中抽取實體;基于會話數(shù)據(jù)、實體、用戶播放聲音的數(shù)據(jù)構(gòu)造樣本,并輸入詞向量模型訓(xùn)練得到實體向量;基于實體向量之間的余弦相似度、編輯距離、拼音的編輯距離識別實體的別名。采用引入用戶行為數(shù)據(jù)的方式構(gòu)造表示模型樣本數(shù)據(jù),提升了實體的embedding效果,解決了實體的多詞一義的問題,能夠挖掘出實體精確度更高的別名,且不需要大量人力,維護成本低。
本發(fā)明授權(quán)一種實體的別名挖掘方法、裝置、計算機設(shè)備和存儲介質(zhì)在權(quán)利要求書中公布了:1.一種實體的別名挖掘方法,其特征在于,包括: 獲取用戶行為數(shù)據(jù)、用戶播放聲音的數(shù)據(jù),所述用戶行為數(shù)據(jù)包括檢索點擊行為數(shù)據(jù)、播放行為數(shù)據(jù); 基于用戶行為數(shù)據(jù),抽取會話數(shù)據(jù); 從檢索點擊行為數(shù)據(jù)、用戶播放聲音的數(shù)據(jù)中抽取實體; 基于會話數(shù)據(jù)、實體、用戶播放聲音的數(shù)據(jù)構(gòu)造樣本,并輸入詞向量模型訓(xùn)練得到實體向量; 基于實體向量之間的余弦相似度、編輯距離、拼音的編輯距離識別實體的別名; 所述基于用戶行為數(shù)據(jù),抽取會話數(shù)據(jù),包括: 基于檢索點擊行為數(shù)據(jù)抽取點擊會話數(shù)據(jù); 基于播放行為數(shù)據(jù)抽取播放會話數(shù)據(jù); 所述檢索點擊行為數(shù)據(jù)包括用戶信息、檢索行為數(shù)據(jù);所述基于檢索點擊行為數(shù)據(jù)抽取點擊會話數(shù)據(jù),包括: 基于在預(yù)設(shè)操作時間間隔用戶的檢索行為數(shù)據(jù)抽取點擊會話數(shù)據(jù); 所述檢索點擊行為數(shù)據(jù)包括用戶的檢索詞,所述用戶播放聲音的數(shù)據(jù)包括聲音唯一標識、標題、描述、標簽、主播唯一標識;所述從檢索點擊行為數(shù)據(jù)、用戶播放聲音的數(shù)據(jù)中抽取實體,包括: 從檢索詞、標題、描述中抽取實體; 所述基于實體向量之間的余弦相似度、編輯距離、拼音的編輯距離識別實體的別名,包括: 若兩實體向量之間的余弦相似度大于第一預(yù)設(shè)閾值,則該兩實體互為別名; 若兩實體向量之間的余弦相似度大于第二預(yù)設(shè)閾值,所述第二預(yù)設(shè)閾值小于第一預(yù)設(shè)閾值,且兩實體向量之間的編輯距離大于第三預(yù)設(shè)閾值,或兩實體向量之間的拼音的編輯距離大于第四預(yù)設(shè)閾值,則該兩實體互為別名。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人廣州歡聊網(wǎng)絡(luò)科技有限公司,其通訊地址為:510000 廣東省廣州市天河區(qū)黃埔大道中311號自編2-25、26;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。


熱門推薦
- 三星電子株式會社林鎮(zhèn)佑獲國家專利權(quán)
- 新鄉(xiāng)市萬和過濾技術(shù)股份公司牛新伍獲國家專利權(quán)
- 儀坤動力科技(上海)有限公司霍晉陽獲國家專利權(quán)
- 東莞市捷圣智能科技有限公司廖瑞平獲國家專利權(quán)
- 華為技術(shù)有限公司張旸獲國家專利權(quán)
- 深圳市繹立銳光科技開發(fā)有限公司陳彬獲國家專利權(quán)
- 英飛凌科技股份有限公司H·波蘭克獲國家專利權(quán)
- 中興通訊股份有限公司余萬濤獲國家專利權(quán)
- 北京三星通信技術(shù)研究有限公司李麗絲獲國家專利權(quán)
- 三星顯示有限公司金檣熙獲國家專利權(quán)