北京北大軟件工程股份有限公司趙文獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉北京北大軟件工程股份有限公司申請(qǐng)的專利一種生成文本摘要的方法、裝置及存儲(chǔ)介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN114860873B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-22發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202210424334.6,技術(shù)領(lǐng)域涉及:G06F16/334;該發(fā)明授權(quán)一種生成文本摘要的方法、裝置及存儲(chǔ)介質(zhì)是由趙文;靳新磊;高謙;馬達(dá)森;季昕設(shè)計(jì)研發(fā)完成,并于2022-04-22向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種生成文本摘要的方法、裝置及存儲(chǔ)介質(zhì)在說明書摘要公布了:本申請(qǐng)一些實(shí)施例提供了一種生成文本摘要的方法、裝置及存儲(chǔ)介質(zhì),涉及信息處理技術(shù)領(lǐng)域,該方法包括對(duì)初始文本進(jìn)行分塊處理,獲取處理后的文本數(shù)據(jù);將所述文本數(shù)據(jù)輸入到目標(biāo)摘要生成模型,獲取目標(biāo)摘要,其中,所述目標(biāo)摘要生成模型包括第一目標(biāo)文本模型和第二目標(biāo)文本模型,所述第一目標(biāo)文本模型是通過訓(xùn)練第一文本模型得到的,所述第二目標(biāo)文本模型是通過訓(xùn)練第二文本模型得到的,所述第一目標(biāo)文本模型用于提取所述文本數(shù)據(jù)包括的目標(biāo)信息,所述第二目標(biāo)文本模型用于根據(jù)所述目標(biāo)信息生成所述目標(biāo)摘要。本申請(qǐng)一些實(shí)施例可以對(duì)文本進(jìn)行準(zhǔn)確地信息提取,生成質(zhì)量較高的文本摘要,且解決了文本信息丟失的問題。
本發(fā)明授權(quán)一種生成文本摘要的方法、裝置及存儲(chǔ)介質(zhì)在權(quán)利要求書中公布了:1.一種生成文本摘要的方法,其特征在于,包括: 對(duì)初始文本進(jìn)行分塊處理,獲取處理后的文本數(shù)據(jù),其中,所述文本數(shù)據(jù)包括至少兩個(gè)文本數(shù)據(jù)塊,每個(gè)文本數(shù)據(jù)塊采用候選語句集合來表征; 將所述文本數(shù)據(jù)輸入到目標(biāo)摘要生成模型,獲取目標(biāo)摘要,其中,所述目標(biāo)摘要生成模型包括第一目標(biāo)文本模型和第二目標(biāo)文本模型,所述第一目標(biāo)文本模型是通過訓(xùn)練第一文本模型得到的,所述第二目標(biāo)文本模型是通過訓(xùn)練第二文本模型得到的,所述第一目標(biāo)文本模型用于提取所述文本數(shù)據(jù)中每個(gè)文本數(shù)據(jù)塊中的目標(biāo)語句,通過對(duì)每個(gè)文本數(shù)據(jù)塊中的目標(biāo)語句拼接得到目標(biāo)信息,所述第二目標(biāo)文本模型用于根據(jù)所述目標(biāo)信息生成所述目標(biāo)摘要; 在得到所述第一目標(biāo)文本模型和所述第二目標(biāo)文本模型的訓(xùn)練階段,對(duì)所述第一文本模型和所述第二文本模型使用非端到端的訓(xùn)練方式;在驗(yàn)證階段,對(duì)待測(cè)試第一目標(biāo)文本模型和待測(cè)試第二目標(biāo)文本模型使用了聯(lián)合驗(yàn)證的方式,具體包括: 將驗(yàn)證集中的文本輸入至待測(cè)試第一目標(biāo)文本模型,獲取待測(cè)試第一目標(biāo)文本模型輸出的參考語句數(shù)據(jù),將參考語句數(shù)據(jù)輸入至待測(cè)試第二目標(biāo)文本模型,獲取待測(cè)試第二目標(biāo)文本模型輸出的與文本對(duì)應(yīng)的摘要數(shù)據(jù);基于摘要數(shù)據(jù)和驗(yàn)證數(shù)據(jù)集中的參考摘要數(shù)據(jù),優(yōu)化第一目標(biāo)文本模型和第二目標(biāo)文本模型的參數(shù),直至確認(rèn)第一目標(biāo)文本模型和第二目標(biāo)文本模型通過驗(yàn)證,得到目標(biāo)摘要生成模型; 在所述獲取目標(biāo)摘要之后,所述方法還包括: 分別提取所述目標(biāo)摘要和所述初始文本中的數(shù)字字符串,并剔除所述數(shù)字字符串中的小數(shù)點(diǎn),所述數(shù)字字符串的位數(shù)不小于3;基于所述初始文本中的數(shù)字字符串,對(duì)所述目標(biāo)摘要中的數(shù)字字符串進(jìn)行檢驗(yàn),獲取出錯(cuò)字符;根據(jù)初始文本中的數(shù)字字符串,替換所述出錯(cuò)字符,得到替換后的目標(biāo)摘要。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人北京北大軟件工程股份有限公司,其通訊地址為:100089 北京市海淀區(qū)北四環(huán)西路67號(hào)中關(guān)村國際創(chuàng)新大廈11層1101-1103、1106-1108室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 華為技術(shù)有限公司何伯勇獲國家專利權(quán)
- 臺(tái)州職業(yè)技術(shù)學(xué)院何建慧獲國家專利權(quán)
- 三星顯示有限公司金正起獲國家專利權(quán)
- OPPO廣東移動(dòng)通信有限公司劉佳獲國家專利權(quán)
- 阿瑟雷克斯股份有限公司S·巴赫梅爾獲國家專利權(quán)
- 株式會(huì)社麥迪帕克特金圣鎮(zhèn)獲國家專利權(quán)
- 上海拓牛智能科技有限公司沈泉獲國家專利權(quán)
- 德州儀器公司高見澤彰一獲國家專利權(quán)
- 華為技術(shù)有限公司王明哲獲國家專利權(quán)
- 青島科技大學(xué)王衛(wèi)獲國家專利權(quán)


熱門推薦
- 英飛凌科技股份有限公司A·巴赫蒂獲國家專利權(quán)
- 佩克阿西斯特公司杰拉爾多·諾列加獲國家專利權(quán)
- 三星顯示有限公司金圣民獲國家專利權(quán)
- 賽靈思公司B·S·馬丁獲國家專利權(quán)
- 云南省農(nóng)業(yè)科學(xué)院農(nóng)產(chǎn)品加工研究所田浩獲國家專利權(quán)
- 中國平安人壽保險(xiǎn)股份有限公司陸福鏗獲國家專利權(quán)
- 南京國電南自維美德自動(dòng)化有限公司丁俊健獲國家專利權(quán)
- 賽峰短艙公司蒂埃里·雅克·艾伯特·勒多克特獲國家專利權(quán)
- 四川中科朗星光電科技有限公司楊博獲國家專利權(quán)
- 南京南瑞繼保電氣有限公司王凱獲國家專利權(quán)