成都理工大學黃于鑒獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉成都理工大學申請的專利一種大模型與智能推薦的智能體構建方法和系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120277272B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510765642.9,技術領域涉及:G06F16/9535;該發明授權一種大模型與智能推薦的智能體構建方法和系統是由黃于鑒;明泰;侯婷;李鑫磊;夏佳宏;劉曉敏;曾彤飛;王澄;趙雙;杜明珊;溫泉設計研發完成,并于2025-06-10向國家知識產權局提交的專利申請。
本一種大模型與智能推薦的智能體構建方法和系統在說明書摘要公布了:本發明涉及智能推薦技術領域,特別是涉及一種大模型與智能推薦的智能體構建方法和系統,構建方法包括:基于提示工程構建基于大語言模型的基礎智能體;基于Milvus向量數據庫和所述大語言模型構建記憶機制、推薦機制,并基于所述推薦機制構建反饋學習機制;將所述記憶機制、推薦機制、反饋學習機制嵌入所述基礎智能體,構建智能體,其中,所述智能體的輸入為用戶信息,輸出為推薦列表以及推薦解釋。本發明利用大語言模型,構建一個能夠理解和處理復雜用戶需求、進行任務規劃并使用推薦系統等工具的智能推薦智能體,并采用虛擬數字人的方式應用智能體,實現與用戶的語音交互等功能。
本發明授權一種大模型與智能推薦的智能體構建方法和系統在權利要求書中公布了:1.一種大模型與智能推薦的智能體構建方法,其特征在于,包括: 基于提示工程構建基于大語言模型的基礎智能體; 基于Milvus向量數據庫和所述大語言模型構建記憶機制、推薦機制,并基于所述推薦機制構建反饋學習機制; 將所述記憶機制、推薦機制、反饋學習機制嵌入所述基礎智能體,構建智能體,其中,所述智能體的輸入為用戶信息,輸出為推薦列表以及推薦解釋; 構建所述記憶機制包括: 基于所述Milvus向量數據庫構建長期記憶,基于所述大語言模型的上下文構建短期記憶,其中,構建所述長期記憶包括: 獲取用戶與物品數據并進行預處理,其中,所述用戶與物品數據包括用戶數據、物品數據、用戶與物品交互數據; 對預處理后的用戶與物品數據進行特征提取,并對提取的特征以及每次推薦任務中智能體的行為和結果進行向量化處理,獲取向量數據; 將所述向量數據存儲到所述Milvus向量數據庫并建立索引,完成長期記憶的存儲; 其中,對用戶數據、物品數據、用戶與物品交互數據進行數據預處理,包括去除噪聲、處理缺失值; 對預處理后的用戶與物品數據進行特征提取包括: 用戶活躍度計算: 其中,表示用戶的集合;表示第個物品的交互集合,表示物品個數; 矩陣分解: 將用戶-物品評分矩陣R分解為兩個低維矩陣和,為用戶潛在因子,為物品潛在 因子,通過用戶歷史行為,以顯式評分表示,挖掘用戶興趣和物品屬性的匹配關系: 其中,表示第i個物品潛在因子的轉置矩陣,為用戶-物品評分矩陣; 分詞: 將原始文本內容切分為原子級token: 其中,tokenize表示BertTokenizer提供的分詞方法;text表示原始文本內容; 表示第個token,; 將token映射為其對應的整數ID: 其中,dict表示BertTokenizer預訓練后的詞匯表;[CLS]表示句首標記;[SEP]表示句尾分隔符標記; 編碼: 計算初始隱藏狀態: 其中,表示可學習權重矩陣;表示可學習偏置項;P表示位置編碼;S表示段 嵌入,表示token映射后的整數ID; 通過多層Transformer編碼器提取從局部到全局的語義特征: 其中,表示全局層數,表示層的語義特征,表示層的語義特征,LN表 示層歸一化層;Att表示自注意力機制,捕捉序列內所有位置的全局依賴關系;FNN表示前饋 網絡,對層歸一化的結果進行非線性變換,學習復雜的局部特征交互; 進行所述向量化處理的方法為: 其中,表示離散的類別索引;為權重矩陣,表示特征向量; 構建所述推薦機制包括: 利用所述Milvus向量數據庫的近鄰搜索功能,篩選與用戶向量數據相似度前n的推薦; 對所述推薦進行排序和篩選,獲取推薦列表,并基于用戶信息和推薦列表生成推薦解釋; 其中,利用所述Milvus向量數據庫的近鄰搜索功能,篩選與用戶向量數據相似度前n的推薦包括: 對所述推薦進行排序和篩選,獲取推薦列表,并基于用戶信息和推薦列表生成推薦解釋包括: 其中,是表示激活函數;表示CNN特征提取;表示用戶-物品Embedding的外積 運算,表示用戶對物品的點擊概率或評分; 構建所述反饋學習機制包括: 采集用戶對所述推薦列表的反饋行為; 通過獎勵函數對所述反饋行為進行評估,獲取用戶滿意度并存儲為歷史經驗,并加入下一次推薦任務中; 所述獎勵函數通過對用戶反饋行為進行賦值,并取若干行為賦值的均值,通過預設的滿意度區間,判斷所述均值對應的用戶滿意度; 其中,對用戶反饋行為進行賦值: 其中,表示顯式正反饋的次數;表示用戶對物品得到首次曝光時間,單位:秒,;表示用戶對物品的最后一次顯式負反饋時間距當前時間的天數,表示 用戶對物品的反饋評估賦值; 計算用戶滿意度: 其中,表示用戶歷史交互的所有物品集合,表示用戶的滿意度。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人成都理工大學,其通訊地址為:610059 四川省成都市成華區二仙橋東三路1號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。