浙江大學卜佳俊獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浙江大學申請的專利一種基于計算機視覺的電影旁白區間檢測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116109967B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211650735.X,技術領域涉及:G06V20/40;該發明授權一種基于計算機視覺的電影旁白區間檢測方法是由卜佳俊;趙心治;周晟設計研發完成,并于2022-12-21向國家知識產權局提交的專利申請。
本一種基于計算機視覺的電影旁白區間檢測方法在說明書摘要公布了:一種基于計算機視覺的電影旁白區間檢測方法,包括:首先,打開電影獲取連續幀的圖像;其次,對獲得的圖像進行采樣,并通過文字識別來獲取字幕所在的位置坐標;然后,對所有圖像幀檢測在坐標內是否有字幕出現,計算字幕出現的時間區間,其余時間區間填充為旁白的時間,最后,再對檢測結果進行微調,并根據旁白區間和常規語速給出推薦插入的旁白字數。根據以上步驟,即可判斷得出電影的所有旁白區間以及每個旁白的推薦插入字數。本發明可應用于對電影進行旁白推薦,幫助更好的表達電影內容,為電影編輯提供更多選擇和可能。
本發明授權一種基于計算機視覺的電影旁白區間檢測方法在權利要求書中公布了:1.一種基于計算機視覺的電影旁白區間檢測方法,其特征在于,包括以下步驟: S1:輸入一個電影其他視頻格式的文件路徑; S2:讀取視頻圖像,按照一定幀率讀取圖像并對這組圖像進行分析,確定字幕在整個畫面中的上下邊界位置; S21:對讀取到的圖像進行OCR識別,判斷圖像中是否有文字; S22:若S21得到的圖像中包含文字,則進行梯度檢測,對檢測到的矩形框進行傾斜角計算; S23:若S22中計算得到的傾斜角小于一定閾值,則標記為有效字幕,記錄該矩形的左上角和右下角坐標; S24:當找到一定數量的有效字幕后,則字幕位置檢測結束,取記錄中的最大矩形作為檢測出的字幕所在位置; S3:對整部電影的視頻圖像按照一定幀率進行檢測,得到所有字幕出現的起始時間和結束時間; S31:對每一幀圖像按照S2中得到的字幕位置的上下邊界進行截取,并且對截取后的圖像進行OCR文字識別,其中判斷圖像中是否有文字; S32:如果S31中識別到了文字,則進行梯度檢測,對檢測到的矩形框進行傾斜角計算; S33:若S32中計算得到的傾斜角小于一定閾值且字幕中心在畫面的中間附近,則標記為有效字幕; S34:若在S33中檢測到了有效字幕,則規范化處理文本中的一些標點符號,其中包括把一些半角符號規范化成全角符號,方便后面根據字幕的字數與字幕的時間,計算該條字幕附近的旁白的語速并且進行字數推薦; S35:根據S34的結果以及上一幀圖像的處理,判斷當前幀圖像的字幕情況; S351:若上一幀圖像沒有檢測到字幕,但是當前幀圖像檢測到字幕了,則代表這是一條新的字幕,記錄該條字幕的起始時間; S352:若上一幀圖像有檢測到字幕,并且當前幀圖像沒有檢測到字幕,則代表該字幕消失掉了,記錄為該條字幕的結束時間,此時形成一條完整的字幕記錄; S353:若上一幀圖像有檢測到字幕,并且當前幀圖像也檢測到字幕,則需要判斷兩條字幕是否是同一條字幕; S3531:將檢測到的字幕去掉標點符號,并且進行相似度檢測,檢測結果在[0,1]之間; S3532:如果檢測結果相似度小于一定閾值,則說明是一條新的字幕,記錄為該條字幕的結束時間,此時形成一條完整的字幕記錄; S3533:如果檢測結果相似度大于一定閾值,就認為是同一條字幕; S4:遍歷檢測到的所有字幕,對于一定時間間隔的兩條相鄰字幕,中間插入一條旁白,以此形成電影的旁白區間列表; S5:遍歷每一條旁白,根據該旁白上一條字幕的字數和起止時間,得出字幕的語速,并且根據該語速和該旁白的起止時間,得出該旁白的推薦字數。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江大學,其通訊地址為:310058 浙江省杭州市西湖區余杭塘路866號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。