杭州電子科技大學;人民日報社俞俊獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州電子科技大學;人民日報社申請的專利基于大規模預訓練模型的短視頻新聞生成系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117041458B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310821664.3,技術領域涉及:H04N5/265;該發明授權基于大規模預訓練模型的短視頻新聞生成系統是由俞俊;余宙;戴鈞樞;吳陳斌;王成菥;劉曉鵬;張馳設計研發完成,并于2023-07-06向國家知識產權局提交的專利申請。
本基于大規模預訓練模型的短視頻新聞生成系統在說明書摘要公布了:本發明提出了一種基于大規模預訓練模型的短視頻新聞生成系統,包括:前端網頁模塊和后端短視頻新聞生成平臺;前端網頁模塊具體分為交互組件、視頻參數可視化組件、數據發送上傳組件、數據接收組件;后端短視頻新聞生成平臺具體分為摘要生成模塊、圖文匹配模塊、視頻合成模塊。本發明以摘要生成、信息抽取、圖文匹配以及視頻合成技術為基礎,提供一種基于大規模預訓練模型的短視頻新聞生成系統,一定程度上減輕了新聞工作者在尋找素材和剪輯視頻上的工作壓力。只需輸入新聞文本,便可以輸出一段流暢的短視頻新聞,方便工作者后續剪輯,在實際應用中可根據具體不同的應用場景進行擴展靈活生成對應的短視頻新聞。
本發明授權基于大規模預訓練模型的短視頻新聞生成系統在權利要求書中公布了:1.一種基于大規模預訓練模型的短視頻新聞生成系統,其特征在于,包括:前端網頁模塊和后端短視頻新聞生成平臺; 前端網頁模塊,包括:交互組件、視頻參數可視化組件、數據發送上傳組件、數據接收組件; 交互組件,實現同用戶進行交互,包括按鈕、文本輸入框、頁面切換; 視頻參數可視化組件,將可預選的視頻參數可視化供用戶選擇; 數據發送上傳組件,將用戶上傳的新聞稿、所選取的模板、視頻參數發送上傳至后端短視頻新聞生成平臺; 數據接收轉換組件,接收后端短視頻新聞生成平臺處理完成后的新聞稿以及新聞視頻; 后端短視頻新聞生成平臺,包括:摘要生成模塊、圖文匹配模塊、視頻合成模塊; 摘要生成模塊,由輸入的新聞稿,通過數據清洗、分段進行預處理,再通過摘要生成模型生成新聞摘要; 圖文匹配模塊,根據輸入的新聞摘要,通過信息抽取獲取每段新聞文本的關鍵詞和事件三元組,通過搜索引擎爬取各段新聞摘要相關圖片集,通過圖文匹配模型匹配相關性最高的圖片,生成帶有圖文的新聞稿件; 視頻合成模塊,根據輸入的新聞圖文信息,合成新聞視頻;網頁將視頻參數傳輸到后端模型,最終把新聞視頻輸出; 摘要生成模塊,包括: 收集了新聞摘要數據集,進行數據清洗,構建了新聞中文摘要數據集M; 使用中文分詞器對數據集M中的每個新聞原文Contenti及新聞摘要Abstracti進行分詞,M={Contenti,Abstracti|1≤i≤n};其中n為數據集中新聞個數, 和為對應文本的某個詞向量,和為詞向量個數; 所用的新聞摘要生成模型為文本預訓練模型GPT2,所用GPT2模型的自回歸學習建模為通過將GPT2模型損失函數部分修改為只計算預測新聞的摘要部分進行訓練;所用GPT2模型通過Transformer解碼器構建,使用了集束搜索作為解碼策略,每個時間步保留numbeams個當前分數最高的輸出,輸出每個時間步條件概率連乘起來最大的序列,并使用n-grams懲罰減少序列或單詞重復問題; 測試時輸入的新聞摘要,生成前進行分段操作;將新聞文本分為p個段落,遍歷整個新聞文本,若某個句子結束時累計字數若超過num,則進行分段操作,文末字數不足num則拼接至上一段,則 視頻合成模塊,包括: 根據輸入的新聞摘要圖文信息,提取新聞文本和對應的圖片,使用文本轉換語音的python庫pyttsx3,由預設的音色、語速實現文本轉語音生成音頻文件,并通過Whisper模型識別語音生成字幕文件; 根據字幕文件中的時間流,獲得視頻的總時長為tall=ts+tend,其中tend為字幕文件中最后一個句子結束的結束時刻,ts為預設的開頭模板視頻的時長,每個句子應出現的時刻為ti’=ts+ti,1≤i≤nw,其中ti為字幕文件中某一個句子出現的開始時刻,nw為字幕文件中句子個數; 在開頭模板播放后重復播放ts時間的視頻中間模板,再加入視頻結束模板,從而合成了一段完整的視頻模板; 圖片出現的時刻與對應段落的開始時刻相同,再使用視頻編輯的python庫moviepy,實現圖片在視頻中的動態旋轉、縮放、平移效果,從而實現預設的不同轉場效果; 使用音視頻處理的開源框架ffmpeg,為視頻添加字幕和音頻,從而生成完整的短視頻新聞。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州電子科技大學;人民日報社,其通訊地址為:310018 浙江省杭州市錢塘區白楊街道2號大街1158號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。