南京郵電大學;江蘇拓郵信息智能技術研究院有限公司亓晉獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京郵電大學;江蘇拓郵信息智能技術研究院有限公司申請的專利基于深度學習的多源異構軟件數據缺陷預測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120429725B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510933263.6,技術領域涉及:G06F18/241;該發明授權基于深度學習的多源異構軟件數據缺陷預測方法是由亓晉;李文杰;孫瑩;張燕;孫雁飛;董振江;林軍設計研發完成,并于2025-07-08向國家知識產權局提交的專利申請。
本基于深度學習的多源異構軟件數據缺陷預測方法在說明書摘要公布了:本發明提供一種基于深度學習的多源異構軟件數據缺陷預測方法,通過從K+1個不同的軟件數據源收集軟件缺陷數據,并得到多源異構缺陷數據;得到預處理后的數據;構建多源異構缺陷預測模型,多源異構缺陷預測模型包括特征映射模塊、多領域對抗模塊、領域對齊模塊和標簽預測模塊,特征映射模塊對輸入數據進行特征提取與映射后分別輸出特征表示給多領域對抗模塊、領域對齊模塊和標簽預測模塊;使用預處理后的數據對多源異構缺陷預測模型進行訓練后,得到訓練后的模型;獲得預測結果;該方法能夠學習多源異構數據間的相關性,顯著減少多源異構數據之間邊緣分布的差異,充分挖掘出多個源數據之間可遷移的信息,能夠提高缺陷預測準確性和穩定性。
本發明授權基于深度學習的多源異構軟件數據缺陷預測方法在權利要求書中公布了:1.一種基于深度學習的多源異構軟件數據缺陷預測方法,其特征在于:包括以下步驟, S1、從K+1個不同的軟件數據源收集軟件缺陷數據,并得到多源異構缺陷數據包括K個源域的原始數據以及目標域原始數據; S2、對多源異構缺陷數據進行預處理后,得到預處理后的數據包括源域和目標域,其中,源域表示收集軟件缺陷數據的第k個不同軟件數據源對應的數據集,k=1,2,...,K,目標域表示待預測軟件數據所屬的數據集; S3、構建多源異構缺陷預測模型,多源異構缺陷預測模型包括特征映射模塊、多領域對抗模塊、領域對齊模塊和標簽預測模塊,特征映射模塊對輸入數據進行特征提取與映射后分別輸出特征表示給多領域對抗模塊、領域對齊模塊和標簽預測模塊,多領域對抗模塊采用對抗訓練方法對輸入的特征表示進行處理得到調整后的特征表示并輸出給領域對齊模塊和標簽預測模塊,領域對齊模塊對輸入的調整后的特征表示計算調整多個領域特征的類內分布和類間分布;標簽預測模塊由輸入的特征表示進行類別標簽預測,分別得到預測概率,將預測概率最高的類別標簽作為預測結果; 多源異構缺陷預測模型中,多領域對抗模塊包括用于對抗訓練的域鑒別器D和特征映射網絡,其中,域鑒別器D的表達式為: , 其中,表示域鑒別器D的輸出特征,表示特征拼接,表示域鑒別器D的網絡參數,表示第k個源域經過兩層特征映射網絡后的輸出特征,表示目標域經過兩層特征映射網絡后的輸出特征; 領域對齊模塊中,計算調整多個領域特征的類內分布和類間分布,具體為, 1)類內分布和類間分布的計算分別如下: , , 其中,C表示源域和目標域的類別數量,K表示源域的總數,表示第個源域中第類數據樣本的數量,和分別表示目標域中第類和第類的帶標簽樣本數量,表示第k個源域中類別為的數據樣本經過兩層特征映射網絡后的輸出特征,和分別表示目標域中第類和第類數據樣本經過兩層特征映射網絡后的輸出特征; 2)對類內分布進行最小化,對類間分布進行最大化; 標簽預測模塊中,得到預測概率f: , 其中,表示分類器,表示特征拼接,表示分類器參數,表示第k個源域經過兩層特征映射網絡后的輸出特征,表示目標域經過兩層特征映射網絡后的輸出特征; S4、使用預處理后的數據對多源異構缺陷預測模型進行訓練后,得到訓練后的模型; 步驟S4中,采用以下整體優化目標函數對多源異構缺陷預測模型進行訓練: , 其中,和分別為損失權重,表示特征映射模塊輸出的特征表示,表示域鑒別器D的輸出特征,表示預測概率,特征映射模塊中第二層特征映射網絡參數的差異損失,其中,K表示源域的總數,表示L2范數,表示第個源域輸入的第二層特征映射網絡的網絡參數,表示目標域輸入的第二層特征映射網絡的網絡參數;分類器的分類損失,其中,表示第個源域中第個帶標簽樣本的真實類別標簽的獨熱編碼,表示目標域中第個帶標簽樣本的真實類別標簽的獨熱編碼,表示第個源域中第個數據樣本經過特征映射模塊處理后用于分類計算的特征表示,表示目標域中第個數據樣本經過特征映射模塊處理后用于分類計算的特征表示,為第個源域的數據樣本數量,表示目標域中帶標簽樣本的數量;損失,其中,表示第個源域的反轉樣本域的域標簽的獨熱編碼中第i個元素,表示目標域的反轉樣本域的域標簽的獨熱編碼中第個元素,表示域鑒別器對第個源域中第個樣本特征表示的輸出,表示域鑒別器對目標域中第個樣本特征表示的輸出,為目標域的數據樣本數量;分布損失LIIA=類內分布Lintra-類間分布Linter;域鑒別損失,其中,表示第個源域的域標簽的獨熱編碼中第i個元素,表示目標域的域標簽的獨熱編碼中第個元素; S5、將待預測軟件數據經過預處理后,輸入到訓練后的模型進行預測,獲得預測結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京郵電大學;江蘇拓郵信息智能技術研究院有限公司,其通訊地址為:210003 江蘇省南京市鼓樓區新模范馬路66號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。