電子科技大學;四川省數字經濟研究院(宜賓)曹晟獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉電子科技大學;四川省數字經濟研究院(宜賓)申請的專利一種針對大模型提示注入攻擊的攻防一體化方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120434064B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510941601.0,技術領域涉及:H04L9/40;該發明授權一種針對大模型提示注入攻擊的攻防一體化方法是由曹晟;程翔;任嘉怡;趙豐陽;張淋;陳潔;陳廳;李雄;張小松設計研發完成,并于2025-07-09向國家知識產權局提交的專利申請。
本一種針對大模型提示注入攻擊的攻防一體化方法在說明書摘要公布了:本發明提供了一種針對大模型提示注入攻擊的攻防一體化方法,方法包括:使用基于情感強化和控制輸出的攻擊策略對用戶指令進行大模型提示注入攻擊,形成惡意內容;然后將預防策略Sandwich,Instruction和檢測方法Knownanswer進行融合,構建協同工作的多層次防御策略UnD對上述惡意內容進行提示注入防御,得到輸出結果,最后使用攻擊干擾率、攻擊誤導率、METEOR得分、防御成功率、已知答案匹配率進行效果評估。本發明在攻擊方面實現了攻擊效率更高的提示注入攻擊,在防御方面實現了檢測和預防的協同,提高了大模型在面對提示注入攻擊時的安全性,確保大語言模型在各種應用場景中安全可靠運行。
本發明授權一種針對大模型提示注入攻擊的攻防一體化方法在權利要求書中公布了:1.一種針對大模型提示注入攻擊的攻防一體化方法,其特征在于,所述方法包括: 步驟S1,獲取用戶指令,隨機選取問答文本數據集的問題,將其作為用戶在大模型上的用戶指令; 步驟S2,對用戶指令進行提示注入攻擊,基于目標攻擊意圖,結合大模型的行為特性,構建具有雙重功能的攻擊方法CoA,通過嵌入情感強化詞匯和控制輸出詞匯,構建攻擊提示詞,然后將攻擊提示詞與用戶指令進行結合形成惡意內容; 步驟S3,對惡意內容進行提示注入防御,將預防策略Sandwich,Instruction和檢測方法Knownanswer進行融合,構建防御提示詞,組成協同工作的多層次防御機制UnD,首先在步驟S2生成的惡意內容首部嵌入Instruction防御字段,引導模型優先執行用戶指令,然后在惡意內容尾部加入Sandwich防御字段,形成語義保護層,阻斷攻擊提示詞對大模型的影響,最后嵌入Knownanswer的檢測字段形成防御內容,便于后續預防時同步實現檢測功能; 步驟S4,對不同輸出結果進行對比驗證,分別將步驟S1的用戶指令、步驟S2的惡意內容和步驟S3的防御內容輸入到大模型中得到對應的輸出結果,在攻擊方面通過METEOR得分計算攻擊結果與原輸出結果的語義相似度,并結合METEOR得分情況和攻擊結果的具體內容構建攻擊干擾率AIR和攻擊誤導率AMR,以對攻擊效率進行評估,在防御方面,選擇一種大模型作為專家,判斷防御結果和原輸出結果是否一致,從而得到防御成功率DSR,再統計含有已知答案的防御結果占總樣本的比例得到已知答案匹配率KMR,結合KMR與DSR對預防和檢測效果進行綜合評估。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人電子科技大學;四川省數字經濟研究院(宜賓),其通訊地址為:611731 四川省成都市高新區(西區)西源大道2006號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。