大連理工大學姚琳獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉大連理工大學申請的專利基于差分隱私的基因組數據生成方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117012273B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310981599.0,技術領域涉及:G16B20/20;該發明授權基于差分隱私的基因組數據生成方法是由姚琳;崔桂彰;吳國偉;閆泓淼設計研發完成,并于2023-08-07向國家知識產權局提交的專利申請。
本基于差分隱私的基因組數據生成方法在說明書摘要公布了:本發明屬于信息安全技術領域,提供了一種基于差分隱私的基因組數據生成方法。本發明通過訓練生成對抗網絡來生成數據,在每一輪的迭代中首先依據真實數據在不平衡位點處的分布確定約束條件,將條件向量與潛變量一同作為生成器的輸入,條件生成數據并計算損失更新生成器參數。然后采用自適應的隱私預算分配策略,依梯度大小和隱私損失調整分配的隱私預算,通過按分配的隱私預算對鑒別器梯度加噪的方式使模型滿足差分隱私機制。最后通過計算總代價函數的梯度來判斷是否達到最佳的隱私效用權衡點,如果梯度大于0則根據加噪后梯度更新鑒別器,繼續開始新一輪的迭代,否則訓練終止,輸出此時的生成模型和生成數據。
本發明授權基于差分隱私的基因組數據生成方法在權利要求書中公布了:1.一種基于差分隱私的基因組數據生成方法,其特征在于,步驟如下: 1訓練生成模型,采用條件生成的方式用生成器生成數據,根據生成數據分別計算用于條件生成的生成器的損失函數和對生成數據進行評價的鑒別器的損失函數,根據各自的損失函數更新生成器和鑒別器;SNPs數據條件生成的具體步驟如下: 1.1將數據持有者掌握的真實SNPs數據作為生成模型的訓練數據集,首先計算訓練數據集中每個SNPs位點的等位基因頻率,找出其中等位基因頻率低于閾值的不平衡SNPs位點; 在條件生成SNPs位點數據時,從不平衡SNPs位點中按相等的概率隨機選擇一個SNPs位點,再按照等位基因頻率隨機選擇該SNPs位點處的取值,將該SNPs位點處的取值作為約束條件; 1.2將約束條件與隨機高斯噪聲即潛變量一同作為生成器的輸入,按條件生成的方式生成數據; 鑒別器從生成模型的訓練集中篩選出滿足步驟1.1中約束條件即對應SNPs位點取值和約束條件相同的數據,從中隨機進行采樣,將采集到的真實數據和使用當前生成器條件生成的數據作為鑒別器的輸入;鑒別器使用WGAN中的wassertein距離作為損失函數其中Pr表示真實數據分布,Pg表示生成數據分布;計算鑒別器的損失函數LD的梯度,按差分隱私保護策略添加噪聲,更新鑒別器參數; 然后計算生成器的損失函數LG,依據鏈式求導法則計算生成器的損失函數對其參數的梯度并反向傳播更新生成器參數; 生成器的損失函數:LG=LD+αLB+βLC 其中是巴氏距離,用來表示生成數據和真實數據間的遺傳距離;Prxik和Pgxik分別是真實數據和生成數據在第i個SNPs位點處第k個等位基因的頻率,q是第i個位點等位基因的總數,n是SNPs位點總數;是條件懲罰項,來迫使生成器學習按約束條件進行生成;α和β分別是巴氏距離和條件懲罰項對應的權重系數; 對生成模型進行隱私保護,通過對鑒別器梯度加噪實現差分隱私機制,選擇合適的總隱私預算以獲得好的隱私效用權衡; 1.3采用自適應的隱私預算分配策略,依梯度大小和隱私損失調整分配的隱私預算: 首先在訓練開始前,選擇一個初始隱私預算∈0;在訓練過程中計算t次迭代的平均梯度大小,并檢測重構誤差計算隱私損失,并依據梯度的大小和隱私損失調整每隔t次迭代調整隱私預算為: 其中,E||gwx||2是兩次調整間鑒別器損失函數梯度2-范數的期望,E||g0x||2是初始梯度2-范數的期望,Ploss是成員推理攻擊下的隱私損失,r是預算增長率; 隱私損失Ploss根據訓練集和非訓練集樣本在訓練集中概率的差異來定義,通過重構誤差即目標樣本和重構樣本的最小距離來計算,公式定義如下: 其中,xt是訓練集樣本,xv是非訓練集樣本;lt是目標訓練樣本的重構誤差,lv是非訓練集的平均重構誤差; 通過對鑒別器的梯度進行添加方差為的高斯噪聲,以滿足∈,δ差分隱私;其中p是采樣的比例,nd為一次迭代中鑒別器迭代的次數,∈是分配到的隱私預算,δ是差分隱私的松弛項; 1.4將鑒別器的損失函數LD作為生成數據的可用性損失Uloss,當生成數據的可用性滿足要求后,根據隱私損失Ploss和可用性損失Uloss來計算總代價函數C:其中a和b是可用性和隱私性的權重;根據總代價C的梯度來判斷是否需要終止迭代,若梯度大于0則繼續迭代,否則訓練終止,輸出此時的生成模型和生成數據。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人大連理工大學,其通訊地址為:116024 遼寧省大連市甘井子區凌工路2號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。