深圳市標(biāo)準(zhǔn)技術(shù)研究院劉楊獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉深圳市標(biāo)準(zhǔn)技術(shù)研究院申請的專利結(jié)合文字視覺特征和文字內(nèi)容特征的違規(guī)廣告識(shí)別方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號為:CN114155529B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-05發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202111303591.6,技術(shù)領(lǐng)域涉及:G06V30/148;該發(fā)明授權(quán)結(jié)合文字視覺特征和文字內(nèi)容特征的違規(guī)廣告識(shí)別方法是由劉楊;路宏峰;張浩;曾振威;雷道宇設(shè)計(jì)研發(fā)完成,并于2021-11-05向國家知識(shí)產(chǎn)權(quán)局提交的專利申請。
本結(jié)合文字視覺特征和文字內(nèi)容特征的違規(guī)廣告識(shí)別方法在說明書摘要公布了:本發(fā)明涉及計(jì)算機(jī)技術(shù),具體涉及結(jié)合文字視覺特征和文字內(nèi)容特征的違規(guī)廣告識(shí)別方法,分別利用三種方式將彩色圖像轉(zhuǎn)化為文字視覺圖像本身特征、文字視覺圖像的筆畫特征和圖片文字識(shí)別轉(zhuǎn)換為文本特征三種特征;利用vgg16抽取圖像本身特征;利用RAN抽取漢字的筆順特征;采用CNN?encoderDecoder架構(gòu)抽取漢字的筆畫特征后和圖像本身特征嵌入轉(zhuǎn)化融合;利用DenseNet進(jìn)行特征學(xué)習(xí)分類;利用OCR對圖像文字部分轉(zhuǎn)化為文本信息;對文本信息進(jìn)行規(guī)則匹配審核;應(yīng)用RoFormer的神經(jīng)網(wǎng)絡(luò)模型對句子粒度的文本信息進(jìn)行特征學(xué)習(xí)分裂;識(shí)別違規(guī)廣告結(jié)果。該方法可為各大網(wǎng)站平臺(tái)的廣告審核監(jiān)管系統(tǒng)提供有力支持。
本發(fā)明授權(quán)結(jié)合文字視覺特征和文字內(nèi)容特征的違規(guī)廣告識(shí)別方法在權(quán)利要求書中公布了:1.結(jié)合文字視覺特征和文字內(nèi)容特征的違規(guī)廣告識(shí)別方法,其特征在于:包括以下步驟: 步驟1、輸入格式多樣含有視覺化文字的待檢測廣告圖片,并進(jìn)行降噪、圖像裁剪等圖像預(yù)處理步驟; 步驟2、將圖片中視覺化的文字轉(zhuǎn)化為三種不同特征的向量輸入,分別是文字視覺圖像本身特征、文字視覺圖像的筆畫信息特征和圖片文字識(shí)別轉(zhuǎn)換為文本特征; 步驟3、構(gòu)建基于神經(jīng)網(wǎng)絡(luò)的特征分類器,將圖像本身特征和筆畫信息特征進(jìn)行嵌入融合后進(jìn)行特征分類;步驟3的實(shí)現(xiàn)包括結(jié)合圖像本身的特征和視覺文字的筆順信息轉(zhuǎn)化為嵌入表示,通過DenseNet神經(jīng)網(wǎng)絡(luò)進(jìn)行特征學(xué)習(xí)分類,具體過程包括: 步驟3.1、輸入待識(shí)別圖片,利用vgg16神經(jīng)網(wǎng)絡(luò)抽取圖像本身特征; 步驟3.2、使用RAN部件分析網(wǎng)絡(luò)根據(jù)十大漢字常用空間結(jié)構(gòu)對具有視覺效果的文字的空間架構(gòu)和偏旁部件進(jìn)行分析,抽取漢字的筆順特征信息; 步驟3.3、將圖像本身特征和筆順特征轉(zhuǎn)化成嵌入表示后進(jìn)行concat向量拼接,通過DenseNet神經(jīng)網(wǎng)絡(luò)進(jìn)行特征分類學(xué)習(xí),識(shí)別圖片中視覺化文字是否含有違規(guī)部分; 步驟4、構(gòu)建基于規(guī)則匹配和神經(jīng)網(wǎng)絡(luò)的文本審核系統(tǒng)對文字識(shí)別轉(zhuǎn)換后的文本特征進(jìn)行審核,判斷是否含有惡意推廣的違規(guī)廣告內(nèi)容;步驟4的實(shí)現(xiàn)包括利用OCR技術(shù)提取圖像中的文本特征,然后利用規(guī)則匹配的方式審核文本是否含有電商平臺(tái)鏈接惡意推廣內(nèi)容,再利用基于深度學(xué)習(xí)網(wǎng)絡(luò)RoFormer的分類模型對文本特征進(jìn)行分類;具體過程包括: 步驟4.1、利用OCR技術(shù)提取待檢測圖片中文本內(nèi)容; 步驟4.2、采用正則表達(dá)式匹配的方式對文本內(nèi)容進(jìn)行惡意推廣的匹配審核,包括QQ號、微信號、手機(jī)號、平臺(tái)外鏈的惡意推廣內(nèi)容的審核; 步驟4.3構(gòu)建RoFormer深度學(xué)習(xí)模型,將文本內(nèi)容以句子或段落為粒度直接輸入模型進(jìn)行特征提取分類,識(shí)別出包含違規(guī)廣告的信息; 步驟5、結(jié)合分類器和審核結(jié)果,判斷待測廣告圖片是否含有違規(guī)廣告信息。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人深圳市標(biāo)準(zhǔn)技術(shù)研究院,其通訊地址為:518000 廣東省深圳市彩田路2038號海天綜合大廈13-16樓;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。