陽光保險集團股份有限公司韓佳獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉陽光保險集團股份有限公司申請的專利一種文檔排序方法、排序裝置、電子設備和存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115098668B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210806608.8,技術領域涉及:G06F16/338;該發明授權一種文檔排序方法、排序裝置、電子設備和存儲介質是由韓佳;杜新凱;呂超;谷姍姍;張晗;史輝;劉珊珊設計研發完成,并于2022-07-08向國家知識產權局提交的專利申請。
本一種文檔排序方法、排序裝置、電子設備和存儲介質在說明書摘要公布了:本申請提供了一種文檔排序方法、排序裝置、電子設備和存儲介質。所述排序方法包括:在接收到用戶輸入的查詢語句之后,召回與該查詢語句相關的多個候選文檔;每個候選文檔中包括與該查詢語句相關的關聯語句;針對每個候選文檔中的關聯語句,將該查詢語句和該候選文檔中的關聯語句進行拼接處理,獲得拼接語料;將該拼接語料輸入到預先訓練好的相似度分值預測模型中,獲得該候選文檔的相似度分值;所述相似度分值表示該候選文檔中的關聯語句與所述查詢語句的相似度;根據每個候選文檔的相似度分值,確定所述多個候選文檔的文檔排序結果。通過所述排序方法和排序裝置,能夠準確地對文檔進行排序,提高用戶的體驗度。
本發明授權一種文檔排序方法、排序裝置、電子設備和存儲介質在權利要求書中公布了:1.一種文檔排序方法,其特征在于,所述排序方法包括: 在接收到用戶輸入的查詢語句之后,召回與該查詢語句相關的多個候選文檔;每個候選文檔中包括與該查詢語句相關的關聯語句; 針對每個候選文檔中的關聯語句,將該查詢語句和該候選文檔中的關聯語句進行拼接處理,獲得拼接語料; 將該拼接語料輸入到預先訓練好的相似度分值預測模型中,獲得該候選文檔的相似度分值;所述相似度分值表示該候選文檔中的關聯語句與所述查詢語句的相似度; 根據每個候選文檔的相似度分值,確定所述多個候選文檔的文檔排序結果; 所述相似度分值預測模型通過以下步驟訓練而被得到: 獲取語料訓練數據集; 基于所述語料訓練數據集訓練初始相似度分值預測模型,獲得相似度分值預測模型; 通過以下步驟獲取所述語料訓練數據集: 獲取原始單句語料,并對所述原始單句語料進行預處理,獲得單句語料; 根據所述單句語料,獲得初始語料訓練數據集;所述初始語料訓練數據集包括多個被設置語義標簽的語料對; 根據所述初始語料訓練數據集,獲得語料訓練數據集;所述語料訓練數據集包括與每個目標語料對應的多組語料樣本;每組語料樣本中包括多個被設置相關度標簽的語料樣本; 所述根據所述初始語料訓練數據集,獲得語料訓練數據集,包括; 針對所述初始語料訓練數據集中的每個單句語料,根據該單句語料的句式,從所述初始語料訓練數據集中篩選出與該單句語料的句式完全相同的復刻語料,并將該單句語料和所述復刻語料作為目標語料,將所述目標語料所在的語料對作為目標語料對; 根據目標語料對的語義標簽,從所述目標語料對中分別篩選出與該目標語料的語義相似的相似語料和語義不相似的不相似語料; 對該目標語料、所述相似語料和所述不相似語料進行排列組合,獲得與該目標語料對應的多組語料樣本;每組語料樣本中的每個語料樣本包括目標語料、第一語料和第二語料;所述第一語料為所述目標語料后的第一個語料,所述第二語料為所述目標語料后的第二個語料; 針對每組語料樣本,根據該組語料樣本中的第一語料和第二語料之間的語義關系,對該組語料樣本中的每個語料樣本設置相關度標簽,以得到多個被設置相關度標簽的語料樣本;所述相關度標簽的類別包括:第一標簽;第二標簽和第三標簽;所述第一標簽表示第一語料比第二語料與目標語料更相關,所述第二標簽表示第一語料和第二語料與目標語料相關性一致,所述第三標簽表示第二語料比第一語料與目標語料更相關; 將所有被設置相關度標簽的語料樣本組成的集合確定為語料訓練數據集。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人陽光保險集團股份有限公司,其通訊地址為:518000 廣東省深圳市福田區紅荔西路7002號第一世界廣場A座17層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。