華南師范大學;秦皇島職業技術學院王素華獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉華南師范大學;秦皇島職業技術學院申請的專利一種基于人工智能的試題知識點生成方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119830231B 。
龍圖騰網通過國家知識產權局官網在2025-09-16發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510303148.0,技術領域涉及:G06F18/26;該發明授權一種基于人工智能的試題知識點生成方法及系統是由王素華;侯蕊;薛云;閆西木;閆鵬飛;王蕾;陳建設計研發完成,并于2025-03-14向國家知識產權局提交的專利申請。
本一種基于人工智能的試題知識點生成方法及系統在說明書摘要公布了:本發明涉及一種基于人工智能的試題知識點生成方法及系統,屬于數據處理技術領域。包括以下步驟:試題文本數據預處理、試題文本數據分詞、試題數據集劃分、模型預訓練、試題文本向量化、試題文本標簽詞標注;將Bert模型的輸出詞向量輸入卷積神經網絡的卷積層,采用不同卷積核進行卷積操作,利用池化層將卷積得到的列向量的最大值提取出來,通過全連接層和Softmax處理,獲得最后的標簽詞標注結果;試題知識點生成:根據試題的標簽詞通過有效關聯規則生成試題包含的知識點。本發明通過多粒度分詞提高了模型的泛化能力;通過挖掘標簽詞與知識點的關聯關系完善了試題知識點,并對標簽詞設置權重,提高了生成知識點的有效性和準確性。
本發明授權一種基于人工智能的試題知識點生成方法及系統在權利要求書中公布了:1.一種基于人工智能的試題知識點生成方法,其特征在于:包括以下步驟: 試題文本數據預處理:采集獲取大規模的試題數據,并進行知識點標簽標注,建立試題數據集; 試題文本數據分詞:將試題集中試題文本使用不同的粒度進行分詞迭代,分割生成新的文本; 試題數據集劃分:將試題數據集劃分為訓練集、驗證集和測試集; 模型預訓練:將標簽進行標簽詞映射,通過提示學習預訓練完成Bert模型預訓練; 試題文本向量化:通過Bert模型將分詞生成的新文本中每個分詞進行向量化表示; 試題文本標簽詞標注:將Bert模型的輸出詞向量輸入卷積神經網絡的卷積層,分別采用不同卷積核進行卷積操作,然后利用池化層將卷積得到的列向量的最大值提取出來,通過全連接層和Softmax處理,獲得標簽詞標注結果; 試題知識點生成:根據試題的標簽詞通過有效關聯規則生成試題包含的知識點; 模型指標評價:通過選取精確率、召回率以及F1值作為模型知識點生成的評價標準進行模型評估; 所述試題文本數據分詞,包括以下步驟: 對試題的文本采用粗粒度的分詞方法進行分詞,從而分割生成多個詞語;對生成的詞語采用細粒度的分詞方法獲取字符級的第一輸入文本;對粗粒度分詞生成的每個詞語隨機切割成若干個字符串得到第二輸入文本;將第一輸入文本和第二輸入文本合并得到分詞結果; 所述模型預訓練,包括以下步驟: 標簽詞映射:對訓練集中的標簽集,通過定義標簽映射函數將標簽集中的每個標簽映射成對應的標簽詞,并建立標簽詞集; 提示學習預訓練:給定訓練樣本Q={q1,…,qh,…,qz},Q∈A,qh表示句子里第h個字符;定義提示模板為:qh是一個[R]實體,其中[R]是一個標簽槽,表示qh所屬類別對應的標簽詞; 對于原始句子Q,在獲得z個提示模板后,通過逗號連接得到完整的提示P={p1,…,ph,…,pz},ph表示針對qh的提示; 將Q和P拼接起來作為Bert的輸入: F=[CLS]Q[SEP]P; 其中,[CLS]表示句子的開頭,[SEP]用于分隔兩個句子,得到的新序列F符合BERT的輸入規范; 將新序列F輸入到Bert中進行預訓練,使得模型預測出[MASK]標記所對應的實體標簽詞; 所述提示學習預訓練中,模型的損失函數根據預測結果和真實標簽之間的差異計算: L=-∑hBhlogpBh’|F; 其中,L表示模型提示預訓練的損失函數,Bh表示第h個字符的真實標簽,Bh’表示模型的預測標簽。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人華南師范大學;秦皇島職業技術學院,其通訊地址為:510000 廣東省廣州市中山大道西55號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。