成都華棲云科技有限公司顏濤獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網獲悉成都華棲云科技有限公司申請的專利一種對課堂實錄文本進行多維總結的方法及系統獲國家發(fā)明授權專利權,本發(fā)明授權專利權由國家知識產權局授予,授權公告號為:CN120319248B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發(fā)布的發(fā)明授權授權公告中獲悉:該發(fā)明授權的專利申請?zhí)?專利號為:202510795857.5,技術領域涉及:G10L15/26;該發(fā)明授權一種對課堂實錄文本進行多維總結的方法及系統是由顏濤;張亞敏;袁官銳;蔣文;姜錸設計研發(fā)完成,并于2025-06-16向國家知識產權局提交的專利申請。
本一種對課堂實錄文本進行多維總結的方法及系統在說明書摘要公布了:本發(fā)明提供了一種對課堂實錄文本進行多維總結的方法及系統,涉及信息處理技術領域;本發(fā)明使用統計學加大模型判斷的方式,對整個課堂實錄通過課間休息完成對課堂的分割;使用動態(tài)上下文窗口計算的方法,確保上下文處于一個合理的區(qū)間,每片上下文長度分布均勻;分層總結采用先小片段再由小片段總結大片段的模型,使小模型可以較好適配超長上下文的總結;此外,本發(fā)明使用提示詞插件化和腳本插件化的方法,每層均具備不同的多個插件,提示詞插件以語言大模型為基礎輸出總結性內容,腳本插件從全局維度輸出業(yè)務統計結果;基于上述以上關鍵技術點,可以實現在較小參數規(guī)模的語言大模型中,對課堂實錄的數據進行分層的多維度總結。
本發(fā)明授權一種對課堂實錄文本進行多維總結的方法及系統在權利要求書中公布了:1.一種對課堂實錄文本進行多維總結的方法,其特征在于,包括: 步驟1:對課堂實錄視頻進行語音識別得到說話內容,使用VAD對說話內容進行斷句并對每一斷句進行說話人識別,構造為結構化的說話人語音識別內容; 步驟2:根據說話內容進行課間休息分割; 步驟3:根據課間休息分割結果,將說話內容按課堂節(jié)次進行拆分,得到各節(jié)次的課堂說話內容; 步驟4:通過說話人語音識別內容調整滑動窗口上下文算法的窗口大小,并將課堂說話內容拆分為多個內容片段;其中,各內容片段之間設置有一級重疊區(qū); 步驟5:開始一級數據總結提取,對各內容片段進行一級提示詞提取;其中,每個一級提示詞對應設置有一級數據提取提示詞插件文件、一級輸出結果提示詞插件文件和一級重疊區(qū)提示詞插件文件; 步驟6:檢查一級重疊區(qū)的數據,使用一級重疊區(qū)提示詞插件文件對一級重疊區(qū)進行二次處理,使得一級重疊區(qū)的數據與對應時戳覆蓋完成,時戳順序正確; 步驟7:對各一級提示詞按照不同維度時間片段進行展開,得到一級數據總結內容; 步驟8:調整滑動窗口上下文算法的窗口大小,并將一級數據總結內容拆分為多個總結片段;其中,各總結片段之間設置有二級重疊區(qū); 步驟9:開始二級數據總結提取,對各總結片段進行二級提示詞提取;其中,每個二級提示詞對應設置有二級數據提取提示詞插件文件、二級輸出結果提示詞插件文件和二級重疊區(qū)提示詞插件文件; 步驟10:檢查二級重疊區(qū)的數據,使用二級重疊區(qū)提示詞插件文件對二級重疊區(qū)進行二次處理,使得二級重疊區(qū)的數據與對應時戳覆蓋完成,時戳順序正確; 步驟11:對各二級提示詞按照不同維度時間片段進行展開,得到二級數據總結內容; 步驟12:開始三級數據總結提取,獲取二級數據總結內容下各條目所對應原始的說話人語音識別內容,并直接對原始的說話人語音識別內容進行三級提示詞提取;其中,每個三級提示詞對應設置有提示詞文件和格式校對文件; 步驟13:將提取到的一級提示詞、二級提示詞、三級提示詞、一級數據總結內容、二級數據總結內容和各提示詞對應設置的文件作為業(yè)務輸出用于后處理; 在步驟2中,通過如下步驟進行課間休息分割: 建立一個分鐘為單位的數組,并根據時戳將對應的說話內容進行按分鐘進行字數統計填充;其中,若說話內容為空,則填充為0; 通過數組判斷是否連續(xù)三個時間點的字數小于特定閾值;若是,則標記數組對應片段為課間休息備選片段,公式如下: 令初始化課間休息區(qū)間集合 對于每一個,如果,則: 當且時, ; ; 其中,為時間調整中間變量,wi表示第i分鐘的文字數,T是總分鐘數; 通過語言大模型對課間休息備選片段進行總結,并在課間休息備選片段的上下浮動獲取上下文;其中,備選片段為,,上下各浮動2分鐘獲取上下文,調整邏輯如下: 給定,令則調整后的片段為;其中,和分別為調整前的開始與結束時間點,和分別為調整后的開始與結束時間點 若識別出現下課語義和上課語義,則標記對應時間段為課間休息時段,并通過課間休息時段進行課間休息分割。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人成都華棲云科技有限公司,其通訊地址為:610000 四川省成都市高新區(qū)天府五街200號菁蓉匯4號樓A區(qū)9樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。