南昌市一境信息技術(shù)有限公司余天水獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉南昌市一境信息技術(shù)有限公司申請的專利基于AI多模態(tài)大模型的智能對話系統(tǒng)及方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120491834B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-09-12發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510977222.7,技術(shù)領(lǐng)域涉及:G06F3/01;該發(fā)明授權(quán)基于AI多模態(tài)大模型的智能對話系統(tǒng)及方法是由余天水;涂冬華設(shè)計研發(fā)完成,并于2025-07-16向國家知識產(chǎn)權(quán)局提交的專利申請。
本基于AI多模態(tài)大模型的智能對話系統(tǒng)及方法在說明書摘要公布了:本發(fā)明涉及基于AI多模態(tài)大模型的智能對話系統(tǒng)及方法,所述方法包括實時采集用戶的生物特征數(shù)據(jù);利用對抗生成網(wǎng)絡(luò)克隆用戶的個性化表達模式;驅(qū)動音頻分身與用戶進行多輪對話交互,并通過表情識別模塊捕捉用戶實時生理信號,結(jié)合對話上下文生成動態(tài)應(yīng)答內(nèi)容建議;基于強化學(xué)習(xí)模型分析交互過程。本發(fā)明實現(xiàn)了語音韻律特征、語言結(jié)構(gòu)特征及面部動態(tài)特征的多模態(tài)深度融合,從而突破了現(xiàn)有技術(shù)中單模態(tài)或簡單特征拼接的局限,能夠精準且全面地捕捉用戶的情感狀態(tài)、表達意圖及細微的生理反應(yīng),為構(gòu)建高保真用戶表征奠定了堅實基礎(chǔ)。
本發(fā)明授權(quán)基于AI多模態(tài)大模型的智能對話系統(tǒng)及方法在權(quán)利要求書中公布了:1.一種基于AI多模態(tài)大模型的智能對話方法,其特征在于,所述方法包括: 實時采集用戶的生物特征數(shù)據(jù),包括語音流、面部視頻流及交互文本,通過多模態(tài)融合編碼器提取語音韻律特征、語言結(jié)構(gòu)特征及面部動態(tài)特征,輸出聯(lián)合特征向量; 基于聯(lián)合特征向量構(gòu)建用戶數(shù)字分身模型,利用對抗生成網(wǎng)絡(luò)克隆用戶的個性化表達模式,生成包含語言節(jié)奏、慣用詞匯、地域口音映射關(guān)系的音頻分身; 加載預(yù)設(shè)場景知識庫,驅(qū)動音頻分身與用戶進行多輪對話交互,并通過表情識別模塊捕捉用戶實時生理信號,結(jié)合對話上下文生成動態(tài)應(yīng)答內(nèi)容建議; 基于強化學(xué)習(xí)模型分析交互過程,生成包含語言冗余度、邏輯連貫性、微表情管理指標的多維評估報告,同步存儲最優(yōu)表現(xiàn)片段至風(fēng)格樣本庫; 所述生成包含語言節(jié)奏、慣用詞匯、地域口音映射關(guān)系的音頻分身,具體包括: 構(gòu)建條件對抗生成網(wǎng)絡(luò),其中: 生成器接收聯(lián)合特征向量及場景標簽,輸出帶韻律標記的方言文本序列; 鑒別器對比真實用戶語音樣本與生成樣本,通過頻譜圖動態(tài)時間規(guī)整算法優(yōu)化地域口音相似度; 建立個性化語音規(guī)則庫,存儲用戶特有的填充詞使用頻率、疑問句尾音上揚模式及緊張狀態(tài)下的語速波動曲線; 所述鑒別器對比真實用戶語音樣本與生成樣本,通過頻譜圖動態(tài)時間規(guī)整算法優(yōu)化地域口音相似度,具體包括: 對真實用戶語音樣本執(zhí)行多尺度聲紋共振解析,提取方言特有的聲學(xué)不變量集合以生成方言聲紋量子圖譜,方言聲紋量子圖譜包括聲調(diào)滑移軌跡的量子化能級分布、爆破音口腔氣壓脈沖的混沌吸引子特征,以及鼻化元音的諧振腔拓撲指紋; 獲取合成語音樣本,將合成語音樣本映射至方言聲學(xué)流形空間,基于所述方言聲紋量子圖譜進行變分編碼,標識頻譜特征偏移區(qū)域并量化聲學(xué)畸變程度,形成包含失真熱點的聲學(xué)異常張量場; 在包含失真熱點的聲學(xué)異常張量場內(nèi)構(gòu)建自適應(yīng)方言連讀的時空規(guī)整網(wǎng)格,通過聲調(diào)能級的黎曼流形同步校準、混沌吸引子的李群同構(gòu)變換,以及諧振腔指紋的共形映射補償,生成方言聲學(xué)守恒流形; 基于方言聲學(xué)守恒流形驅(qū)動聲波量子態(tài)重組,植入真實樣本的聲調(diào)量子糾纏特征,重構(gòu)爆破音脈沖的混沌同步參數(shù),注入鼻化諧振的拓撲約束條件,輸出優(yōu)化聲場傳播算子; 將優(yōu)化聲場傳播算子導(dǎo)入聲學(xué)全息調(diào)制引擎,計算方言特征點的聲壓梯度場分布,生成對抗機械諧振的相消干涉波陣面,合成地域語調(diào)的量子相干態(tài)序列,形成方言聲學(xué)全息投影; 通過多通道反饋回路將方言聲學(xué)全息投影與真實用戶語音樣本的聲學(xué)不變量集合進行遞歸比對,捕捉殘留的頻譜相位偏差并量化共振峰遷移誤差,生成聲學(xué)誤差修正向量; 基于聲學(xué)誤差修正向量重構(gòu)聲門脈沖波傳導(dǎo)路徑,通過喉腔湍流場逆推算法優(yōu)化聲帶弛豫振蕩參數(shù),植入地域性顎咽閉合慣性特征,得到方言生物聲學(xué)優(yōu)化算子; 利用方言生物聲學(xué)優(yōu)化算子執(zhí)行多輪迭代收斂計算,通過量子相干態(tài)干涉消除合成諧波失真,重組聲調(diào)滑移軌跡的量子化能級分布,生成高保真方言語音樣本; 基于高保真方言語音樣本,最終以優(yōu)化地域口音相似度。
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人南昌市一境信息技術(shù)有限公司,其通訊地址為:330000 江西省南昌市紅谷灘區(qū)九龍湖大道1388號綠地博覽城1#商業(yè)辦公樓11樓1105-1106室;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。