南京物浦大數(shù)據(jù)有限公司高永偉獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉南京物浦大數(shù)據(jù)有限公司申請的專利一種基于文本分類模型的公平競爭審查輔助方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN114860882B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-19發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202210550470.X,技術(shù)領(lǐng)域涉及:G06F16/334;該發(fā)明授權(quán)一種基于文本分類模型的公平競爭審查輔助方法是由高永偉;汪洵;薛馭;羅昌志;周榮華設(shè)計研發(fā)完成,并于2022-05-18向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于文本分類模型的公平競爭審查輔助方法在說明書摘要公布了:本發(fā)明公開了一種基于文本分類模型的公平競爭審查輔助方法,包括構(gòu)建政府政策文本信息庫,獲取政府發(fā)布的政策文本,進(jìn)行子類劃分,采集不同的政策文本,構(gòu)建預(yù)訓(xùn)練語言模型,通過專家對采集的政策文本進(jìn)行標(biāo)注數(shù)據(jù),識別政策文本內(nèi)專家標(biāo)注的數(shù)據(jù),對審查樣本庫內(nèi)部的政策文本進(jìn)行模型訓(xùn)練分析,根據(jù)訓(xùn)練分析結(jié)果對政策文本進(jìn)行初篩和復(fù)核,統(tǒng)計不同政策文本的公平審查結(jié)果,對構(gòu)建的模型進(jìn)行信息迭代,旨在解決原有的相似度模型準(zhǔn)確率不高,缺少語義理解的問題,根據(jù)政府的政策文書搭建模型實(shí)時訓(xùn)練數(shù)據(jù),通過對文本的自主學(xué)習(xí),得到文本的語義特征,利用該模型對待審查的政府政策文件進(jìn)行分類審查,輔助專家進(jìn)行判斷,減少審查的人力成本。
本發(fā)明授權(quán)一種基于文本分類模型的公平競爭審查輔助方法在權(quán)利要求書中公布了:1.一種基于文本分類模型的公平競爭審查輔助方法,其特征在于: S1:構(gòu)建政府政策文本信息庫,獲取政府發(fā)布的政策文本,對不同的政策文本進(jìn)行關(guān)鍵詞標(biāo)記,按照不同的關(guān)鍵詞進(jìn)行分類,對分類后的政策文本按照發(fā)布時間、優(yōu)先級、新增記錄和文本有效性進(jìn)行子類劃分; S2:采集不同的政策文本,篩查不同政策文本是否存在專家標(biāo)注數(shù)據(jù),對不同的政策文本按照有專家標(biāo)注數(shù)據(jù)和無專家標(biāo)注數(shù)據(jù)進(jìn)行分類,提取無專家標(biāo)注數(shù)據(jù)的政策文本,進(jìn)行預(yù)訓(xùn)練,構(gòu)建預(yù)訓(xùn)練語言模型,預(yù)訓(xùn)練模型結(jié)構(gòu)采用BERT模型結(jié)構(gòu); S3:通過專家對采集的政策文本進(jìn)行標(biāo)注數(shù)據(jù),識別政策文本內(nèi)專家標(biāo)注的數(shù)據(jù),對標(biāo)注內(nèi)容按照違反審查標(biāo)準(zhǔn)和不違反審查標(biāo)準(zhǔn)對提取出的政策文本進(jìn)行分類,將分類后的政策文本按照類別錄入審查樣本庫; 設(shè)定審查樣本庫內(nèi)部有N個審查標(biāo)準(zhǔn),添加不違反所有審查標(biāo)準(zhǔn)選項(xiàng),設(shè)定審查樣本庫包括N+1個審查類別,設(shè)定預(yù)訓(xùn)練語言模型內(nèi)部輸入的某一政策文本為x,該文本長度為L,設(shè)定其所述類別為y,將輸入?yún)?shù)轉(zhuǎn)為one-hot向量化表示,設(shè)定模型輸出維度為N+1,類別y對應(yīng)所在維度值為1,預(yù)訓(xùn)練BERT模型對該政策文本每個字進(jìn)行映射,將文本的每個字映射到一個512維的高維向量空間,該政策文本通過BERT模型處理轉(zhuǎn)變?yōu)長×512的hidden向量; 對政策文本不同字的向量求平均值,將該政策文本表示為一個512維的text向量,利用一個全連接層+softmax,將text向量映射為概率向量prop,設(shè)定全連接層+softmax包含一個權(quán)重矩陣w,其維度設(shè)定為R512×N+1,其中,prop向量維度設(shè)定為N+1維度,prop向量的每個維度的值表示該政策文本屬于這個維度所代表的審查類別的概率; 利用交叉熵?fù)p失函數(shù)計算得到預(yù)訓(xùn)練語言模型預(yù)測結(jié)果概率和真實(shí)結(jié)果的損失值,設(shè)定預(yù)測結(jié)果概率和真實(shí)結(jié)果的損失值為loss,利用反向傳播去調(diào)整預(yù)訓(xùn)練語言模型參數(shù),根據(jù)公式: x=x1,x2...xL,y=0....1....0 hidden=Bertx,hidden∈RL×512 text=averagehidden,text∈R1×512 prop=softmaxw·text,w∈R512×N+1,prop∈R1×N+1 根據(jù)上述公式對輸入的政策文本進(jìn)行模型訓(xùn)練,直到損失值不再下降,搭建政策文本審查類別分類模型; S4:根據(jù)訓(xùn)練分析結(jié)果對政策文本進(jìn)行初篩和復(fù)核,統(tǒng)計不同政策文本的公平審查結(jié)果,對構(gòu)建的模型進(jìn)行信息迭代。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人南京物浦大數(shù)據(jù)有限公司,其通訊地址為:210000 江蘇省南京市建鄴區(qū)嘉陵江東街18號3棟2層295室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。


熱門推薦
- 廣東多尼斯網(wǎng)絡(luò)科技有限公司陳四龍獲國家專利權(quán)
- 萬華化學(xué)集團(tuán)股份有限公司張立娟獲國家專利權(quán)
- 雅馬哈株式會社柘植秀幸獲國家專利權(quán)
- 深圳市中興微電子技術(shù)有限公司吳毅強(qiáng)獲國家專利權(quán)
- 廣東美的制冷設(shè)備有限公司郭紹勝獲國家專利權(quán)
- 日本電信電話株式會社宮原和大獲國家專利權(quán)
- 三星電子株式會社金森宏治獲國家專利權(quán)
- 索達(dá)-索拉電子有限公司伊利亞·紐姆曼獲國家專利權(quán)
- 柯尼卡美能達(dá)株式會社鈴木悠太獲國家專利權(quán)
- 旭化成株式會社張珣獲國家專利權(quán)