廣東工業大學林健愷獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廣東工業大學申請的專利基于卷積神經網絡和殘差注意力機制的蛋白質表達預測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119851768B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510021637.7,技術領域涉及:G16B40/00;該發明授權基于卷積神經網絡和殘差注意力機制的蛋白質表達預測方法是由林健愷;曾偉良;鄭智勇;林鈞逸設計研發完成,并于2025-01-07向國家知識產權局提交的專利申請。
本基于卷積神經網絡和殘差注意力機制的蛋白質表達預測方法在說明書摘要公布了:本發明提供了一種基于卷積神經網絡和殘差注意力機制的蛋白質表達預測方法,屬于生物信息學和人工智能領域。本方法包括以下步驟:對DNA序列進行數據清洗和二進制獨熱編碼,將編碼后的DNA序列輸入特征提取層,提取DNA的局部特征;通過卷積神經網絡提取局部特征,通過多頭注意力機制獲取全局特征,并結合殘差連接;最終將全局特征輸入全連接層,生成蛋白質表達預測結果。進一步地,利用SHAP可解釋性方法,對預測模型輸出結果進行解釋,量化DNA序列中每個位置的堿基對預測值的貢獻。本發明結合深度學習與可解釋性技術,顯著提高了蛋白質表達預測的精度和可信度,適用于預測蛋白質表達。
本發明授權基于卷積神經網絡和殘差注意力機制的蛋白質表達預測方法在權利要求書中公布了:1.基于卷積神經網絡和殘差注意力機制的蛋白質表達預測方法,其特征在于,所述方法包括: S1、基于DNA編碼器對DNA序列中的堿基進行編碼,通過編碼方式能夠將DNA序列轉化為機器學習模型可以處理的數值格式,并且保留了堿基的順序信息; S2、獲取蛋白質熒光表達值預測模型;所述模型包括特征提取層、主要的神經網絡訓練模型以及全連接層,其中主要的神經網絡訓練模型包括堆疊的卷積結構和多頭注意力機制網絡; S3、將原始數據作為DNA編碼器的輸入,獲得編碼后的DNA序列矩陣; S4、將編碼后的DNA序列矩陣作為特征提取層的輸入,獲得DNA序列的預訓練特征; S5、將DNA序列的預訓練特征作為主要的神經網絡訓練模型的輸入,獲得DNA序列的預訓練特征的全局特征; S6、在獲得DNA序列的預訓練特征的全局特征后,這些特征被輸入到全連接層,并通過一個線性變換生成最終的輸出,該輸出即為蛋白質熒光值預測,表示蛋白質的表達水平; S7、根據訓練過后的權重網絡結合SHAPSHapleyAdditiveexPlanations可解釋性方法,篩選出對最后的預測結構有因果關系的DNA序列的位置以及堿基,根據最優特征子集實現蛋白質熒光表達。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廣東工業大學,其通訊地址為:510006 廣東省廣州市番禺區廣州大學城外環西路100號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。