吉林大學周豐豐獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉吉林大學申請的專利一種基于生成對抗網(wǎng)絡的蛋白質(zhì)翻譯后修飾數(shù)據(jù)增強方法獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN120412756B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-08-29發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202510920403.6,技術(shù)領(lǐng)域涉及:G16B40/00;該發(fā)明授權(quán)一種基于生成對抗網(wǎng)絡的蛋白質(zhì)翻譯后修飾數(shù)據(jù)增強方法是由周豐豐;徐藝萍;李柯薇;范雨思;王月英;王楚越設(shè)計研發(fā)完成,并于2025-07-04向國家知識產(chǎn)權(quán)局提交的專利申請。
本一種基于生成對抗網(wǎng)絡的蛋白質(zhì)翻譯后修飾數(shù)據(jù)增強方法在說明書摘要公布了:本發(fā)明適用于蛋白質(zhì)組學技術(shù)領(lǐng)域,提供了一種基于生成對抗網(wǎng)絡的蛋白質(zhì)翻譯后修飾數(shù)據(jù)增強方法。本發(fā)明可有效緩解類別不平衡、增強陽性樣本識別能力,通過改進型聚類增強條件生成對抗網(wǎng)絡(RP?CGAN)生成少數(shù)類偽樣本,結(jié)合ESM?2預訓練蛋白質(zhì)語言模型提取特征,提升陽性樣本識別能力與泛化能力;融合ESM?2特征提取與RP?CGAN數(shù)據(jù)增強技術(shù),提升整體預測性能與分類穩(wěn)定性,多分類器關(guān)鍵指標顯著提升;經(jīng)多維指標篩選與自適應調(diào)控,確保增強數(shù)據(jù)與真實分布相近;借助輕量化架構(gòu)與收斂策略,優(yōu)化訓練效率與模型穩(wěn)定性;具備強穩(wěn)定性與跨領(lǐng)域潛力,可遷移至其他蛋白質(zhì)修飾預測任務,并具備跨領(lǐng)域不平衡分類場景中的應用潛力。
本發(fā)明授權(quán)一種基于生成對抗網(wǎng)絡的蛋白質(zhì)翻譯后修飾數(shù)據(jù)增強方法在權(quán)利要求書中公布了:1.一種基于生成對抗網(wǎng)絡的蛋白質(zhì)翻譯后修飾數(shù)據(jù)增強方法,其特征在于,包括以下步驟: 步驟S1:數(shù)據(jù)預處理與特征提取; 讀取蛋白質(zhì)序列文件,劃分訓練集與測試集,采用ESM-2預訓練蛋白質(zhì)語言模型進行特征編碼,生成標準化特征向量; 步驟S2:聚類增強型條件生成對抗網(wǎng)絡的樣本增強; 構(gòu)建由生成器和判別器組成的RP-CGAN模型;生成器輸入包含隨機噪聲向量、目標類別標簽及通過K均值聚類生成的類別中心向量,輸出目標類別偽樣本;判別器采用雙輸出結(jié)構(gòu),分別判斷樣本真實性與類別標簽,結(jié)合Softplus相對對抗損失、二分類交叉熵損失及梯度正則項優(yōu)化訓練穩(wěn)定性; 步驟S3:偽樣本篩選; 應用訓練完成的RP-CGAN模型生成超出目標數(shù)量的偽樣本,通過多指標約束的篩選機制,選擇與真實樣本分布最接近的偽樣本; 步驟S4:分類器訓練與評估; 將真實訓練數(shù)據(jù)與篩選后的偽樣本合并,輸入分類器進行訓練,優(yōu)化分類性能; 步驟S5:預測輸出; 使用訓練好的分類器對新蛋白質(zhì)序列進行預測,輸出修飾位點概率得分; 所述RP-CGAN模型的生成器設(shè)計包括: 輸入條件為隨機噪聲向量z~N0,1、類別標簽yc∈{0,1+及通過K均值聚類獲取的類別中心向量通過聯(lián)合輸入拼接機制生成近似于真實分布的樣本 所述類別中心向量的生成步驟包括: 對少數(shù)類和多數(shù)類樣本分別進行K均值聚類,通過DBI指標確定最優(yōu)聚類簇數(shù);提取少數(shù)類與多數(shù)類的最優(yōu)聚類中心作為生成器的先驗條件輸入; 所述偽樣本篩選步驟包括: 通過混淆矩陣計算敏感性與特異性,動態(tài)確定偽樣本增強數(shù)量n*;使用生成器生成m×n*個偽樣本;利用AutoEncoder構(gòu)建特征空間,計算偽樣本與真實樣本的皮爾遜相關(guān)系數(shù)、歐氏距離和最小均方誤差三類距離指標,對三類距離指標進行歸一化并加權(quán)融合,得到綜合得分;選擇綜合得分最低的前n*個偽樣本,構(gòu)成最終增強樣本集合
如需購買、轉(zhuǎn)讓、實施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人吉林大學,其通訊地址為:130012 吉林省長春市朝陽區(qū)前進大街2699號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準確性。
2、報告中的分析和結(jié)論僅反映本公司于發(fā)布本報告當日的職業(yè)理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據(jù)或者憑證。


熱門推薦
- 阿里巴巴集團控股有限公司申瀟瀟獲國家專利權(quán)
- 南京鑫和匯通電子科技有限公司汪輝獲國家專利權(quán)
- 上海新微技術(shù)研發(fā)中心有限公司吳炫燁獲國家專利權(quán)
- 凌衛(wèi)東獲國家專利權(quán)
- 阿里巴巴集團控股有限公司鄭衛(wèi)東獲國家專利權(quán)
- 南京南瑞繼保電氣有限公司王凱獲國家專利權(quán)
- 賽峰短艙公司蒂埃里·雅克·艾伯特·勒多克特獲國家專利權(quán)
- 索音醫(yī)療公司穆罕默德·霍納爾瓦爾獲國家專利權(quán)
- 株洲慶云電力機車配件工廠有限公司張?zhí)K獲國家專利權(quán)
- 廈門英仕衛(wèi)浴有限公司陸海濤獲國家專利權(quán)