中國民用航空飛行學院潘衛軍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中國民用航空飛行學院申請的專利基于遠程塔臺場景的管制員語音疲勞預測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120108386B 。
龍圖騰網通過國家知識產權局官網在2025-08-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510602935.5,技術領域涉及:G10L15/02;該發明授權基于遠程塔臺場景的管制員語音疲勞預測方法是由潘衛軍;陳申豪;梁叡涵;張琛;陳晟;王鈺皓;宋大江;鄭耀;王琪翔;馮玉江;王玄;左青海;王潤東;欒天設計研發完成,并于2025-05-12向國家知識產權局提交的專利申請。
本基于遠程塔臺場景的管制員語音疲勞預測方法在說明書摘要公布了:本發明涉及語音數據處理技術領域,公開基于遠程塔臺場景的管制員語音疲勞預測方法,包括步驟:收集遠程塔臺通話數據中帶有管制員語音的音頻樣本,并進行去噪聲處理,得到去噪聲后的語音信號;對語音信號進行疲勞狀態標注;對若干帶有標注的語音信號提取韻律類特征、音質類特征和語譜類特征,并融合為綜合特征;基于提取的綜合特征對Bi?LSTM?GRU模型進行訓練,使其輸出疲勞預測結果;采集管制員的實時語音數據,將實時語音數據輸入訓練好的Bi?LSTM?GRU模型,對管制員的疲勞狀態進行預測。本發明的目的在于提高管制員語音疲勞狀態的預測準確度。
本發明授權基于遠程塔臺場景的管制員語音疲勞預測方法在權利要求書中公布了:1.基于遠程塔臺場景的管制員語音疲勞預測方法,其特征在于,包括以下步驟, 步驟1,收集遠程塔臺通話數據中帶有管制員語音的音頻樣本,并進行去噪聲處理,得到去噪聲后的語音信號;對語音信號進行疲勞狀態標注; 步驟2,對若干帶有標注的語音信號提取韻律類特征、音質類特征和語譜類特征,并融合為綜合特征; 步驟3,基于提取的綜合特征對Bi-LSTM-GRU模型進行訓練,使其輸出疲勞預測結果;所述Bi-LSTM-GRU模型包括輸入層、后向層、前向層、輸出層,其中輸入層分別向后向層和前向層傳輸時間步的綜合特征,后向層在時間步上處理反向時間序列,前向層在時間步上處理正向時間序列,輸出層對前、后兩個方向的輸出進行拼接; Bi-LSTM-GRU模型的后向層包括T個GRU單元,T個時間步的綜合特征一一對應輸入T個GRU單元;每個GRU單元包括更新門和重置門,計算公式如下, A.更新門,用于決定當前時間步輸入的綜合特征xt和下一個時間步的隱藏狀態ht+1對當前時間步的隱藏狀態ht的影響,進而控制先前信息在當前時間步的保留程度, 其中,Zt為更新門的激活值;表示sigmoid激活函數;Wz為更新門權重矩陣;bz為更新門的偏置項;ht+1表示GRU單元在反向傳播時,來自下一個時間步的隱藏狀態;t∈T,T為時間步總數; B.重置門,用于控制當前時間步輸入的綜合特征xt與下一個時間步的隱藏狀態ht+1的融合程度, 其中,rt為重置門的激活值;Wr為重置門權重矩陣;br為重置門的偏置項; C.候選隱藏狀態,計算當前時間步的新信息, 其中,為候選隱藏狀態;tanh表示雙曲正切激活函數;Wh為候選隱藏狀態對xt的權重矩陣;Uh為候選隱藏狀態對ht+1的權重矩陣;bh為候選隱藏狀態偏置項; D.GRU單元的最終隱藏狀態, 其中,為GRU單元在時間步t輸出的最終隱藏狀態; Bi-LSTM-GRU模型的前向層包括T個LTSM單元,T個時間步的綜合特征一一對應輸入T個LTSM單元;每個LSTM單元包括輸入門、遺忘門、輸出門和細胞狀態,計算公式如下, A.輸入門,用于決定當前時間步輸入的綜合特征xt和上一個時間步的隱藏狀態ht-1對當前細胞狀態的影響,進而控制后面信息在當前時間步的保留程度, 其中,it為輸入門的激活值;表示sigmoid激活函數;Wi為輸入門權重矩陣;bi表示輸入門的偏置項;ht-1表示LSTM單元在正向傳播時,來自上一個時間步的隱藏狀態;t∈T; B.遺忘門,用于控制上一個時間步的細胞狀態ct-1中需要被遺忘的信息, 其中,ft為遺忘門的激活值;Wf為遺忘門權重矩陣;bf為遺忘門的偏置項; C.細胞狀態,決定了長期記憶的保留和更新, 其中,為當前時間步的候選細胞狀態;tanh表示雙曲正切激活函數;Wc為細胞狀態權重矩陣;bc為細胞狀態的偏置項;ct為當前時間步的細胞狀態; D.輸出門,用于控制當前時間步輸出的隱藏狀態ht,其依賴于當前時間步的細胞狀態ct, 其中,ot為輸出門的激活值;Wo為輸出門權重矩陣;bo為輸出門的偏置項;為LTSM單元在時間步t輸出的最終隱藏狀態; Bi-LSTM-GRU模型的輸出層由每個時間步GRU單元的輸出和LSTM單元的輸出組成,其中GRU單元在時間步上從第T個時間步到第1個時間步處理反向時間序列,LSTM單元在時間步上從第1個時間步到第T個時間步處理正向時間序列;最終,對兩個方向的輸出在同一個時間步上進行拼接或求和,得到雙向隱藏狀態, 其中,Ht表示當前時間步輸出的雙向隱藏狀態; 經過T個時間步后,輸出層輸出T個雙向隱藏狀態Ht,t∈T,T個雙向隱藏狀態Ht經過全連接層后,融合為Ht`,最終Bi-LSTM-GRU模型輸出的疲勞預測結果為, 其中,為Bi-LSTM-GRU模型輸出的疲勞預測結果;Softmax表示Softmax激活函數;Wout為輸出層權重矩陣;bout為輸出層偏置項; 步驟4,采集管制員的實時語音數據,將實時語音數據輸入訓練好的Bi-LSTM-GRU模型,對管制員的疲勞狀態進行預測; 所述Bi-LSTM-GRU模型的損失函數為: 其中,L為損失函數;xt為第t個時間步真實的綜合特征;為第t個時間步預測的綜合特征;為超參數,有,初始狀態下;為第t個時間步的動態優化權重,有, 其中,為第t-1個時間步的動態優化權重;為第t+1個時間步的動態優化權重;為初始優化權重;為學習率,設;exp為自然指數函數;為調整率,;t為時間步的索引。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國民用航空飛行學院,其通訊地址為:618307 四川省德陽市廣漢市南昌路四段46號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。