南京大學張賀獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京大學申請的專利基于領域自適應的跨項目漏洞檢測模型獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115168865B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210745440.4,技術領域涉及:G06F21/57;該發明授權基于領域自適應的跨項目漏洞檢測模型是由張賀;毛潤豐;殷慧琳;榮國平;周鑫;邵棟設計研發完成,并于2022-06-28向國家知識產權局提交的專利申請。
本基于領域自適應的跨項目漏洞檢測模型在說明書摘要公布了:本發明提供一種基于領域自適應的跨項目漏洞檢測模型,通過深度神經網絡學習項目代碼特征,并采用領域自適應方法減小源項目和目標項目的數據分布差異,步驟包括:根據軟件代碼度量相似度分析選擇源項目;解析項目源代碼獲取抽象語法樹,并進行代碼預處理;構建深度學習模型進行模型預訓練;基于多域數據集學習源項目和目標項目的深度特征表示;使用半監督度量遷移學習框架Semi?SupervisedMetricTransferLearning,SSMTL對源項目和目標項目的深度特征進行領域自適應處理;基于標記數據訓練分類器,并對目標項目中的數據進行漏洞預測。該方案可適用于源項目中擁有充足的標記漏洞數據,通過利用漏洞檢測模型提高目標項目的漏洞檢測效率,降低人工成本。
本發明授權基于領域自適應的跨項目漏洞檢測模型在權利要求書中公布了:1.一種基于領域自適應的跨項目漏洞檢測模型,其特征在于,包括以下步驟: S1:獲取源項目集合與目標項目的代碼度量指標,并使用歐式距離衡量項目之間的代碼度量相似度,選擇與目標項目最為接近的項目作為源項目; S2:使用代碼解析工具掃描項目源代碼,基于源代碼中的每個函數生成一個抽象語法樹,遍歷抽象語法樹中的所有節點,生成順序的token序列,并對序列進行規范化處理,根據該函數是否在通用漏洞披露CommonVulnerabilityandExposure,CVE數據庫中被報告為其添加標簽,所述標簽指示函數代碼中有漏洞或無漏洞; S3:使用Word2vec模型對生成序列進行嵌入訓練,將生成的對應向量輸入雙向長短期記憶Bi-directionalLongShort-TermMemory,Bi-LSTM神經網絡模型中進行訓練,并保存結果最優的模型; S4:使用基于多域數據集的跨項目特征學習方式從預訓練好的模型中學習源項目和目標項目代碼的深度特征表示; S5:使用SSMTL框架對源項目和目標項目中的深度特征及標簽進行領域自適應學習,生成距離度量矩陣,并對特征進行轉換,以減小項目之間的數據分布差異; S6:使用線性判別分析作為分類器對轉換后的標記代碼特征進行訓練,并對目標項目的數據進行漏洞預測,最終輸出預測為漏洞的函數信息,并驗證分類器的預測效果; 其中,所述S5包括以下步驟: S5-1:使用SSMTL框架對源項目和目標項目的深度特征進行領域自適應處理,學習距離度量矩陣; S5-2:使用學習到的距離度量矩陣對源項目和目標項目的特征矩陣進行轉換; 該步驟中使用的SSMTL是一種流形的半監督度量學習框架,在應對跨項目漏洞檢測場景時,SSMTL從以下三個方面對源項目和目標項目中的深度特征表示進行領域自適應處理: 1學習正則化距離度量,從而尋求一個最優的距離度量使漏洞類和非漏洞類的數據樣本距離增大,分類同為漏洞類或同為非漏洞類的數據樣本距離減小,正則化距離度量的學習除了考慮輸入的特征向量外,通過提供數據形式的外部信息或側信息來度量適當的距離函數; 2使用協變量偏移自適應精確地最小化源項目和目標項目之間的分布差異,影響協變量偏移的正則化項定義如下: 其中v0xi是數據樣本xi在源項目中歐式距離度量下的初始權值,通過ν0xi的值確定數據樣本xi與源項目數據或目標項目數據的相似程度,如果其值越高,則與源項目相比,xi更接近于目標項目; 3使用基于圖的流形假設,根據如果兩個樣本相對于流形上的某個度量具有較高的相關性,則它們在進行投影時保持相似的原理,將數據的幾何形狀建模為圖的形式,衡量任意樣本與其鄰居節點的距離,其中數據構成圖的頂點,邊緣表示適當的鄰域關系,假設G=V,E為連通圖,V分別對應源項目和目標項目的N個數據樣本,E表示數據樣本之間的關系,則任意兩個樣本xi和xj之間的相似度計算公式定義如下: 其中σij 2=σiσj,σi是元素xi和它的K近鄰之間的距離。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京大學,其通訊地址為:210023 江蘇省南京市棲霞區仙林大道163號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。