吉林大學;通化師范學院孫銘蔚獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉吉林大學;通化師范學院申請的專利一種抗癌肽識別方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN117292742B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202311138515.3,技術領域涉及:G16B5/00;該發明授權一種抗癌肽識別方法及系統是由孫銘蔚;周柚;胡昊元;佘燕達;肖鈺彬;李沅書設計研發完成,并于2023-09-05向國家知識產權局提交的專利申請。
本一種抗癌肽識別方法及系統在說明書摘要公布了:本發明適用于肽識別技術領域,提供了一種抗癌肽識別方法及系統,識別方法包括以下步驟:輸入給定的肽序列,對肽序列進行數據增強,得到原始序列;第一通道使用Bi?LSTM從原始序列中提取特征;第二通道將原始序列轉化為化學分子式的形式,并使用SMILES簡化化學分子式,將SMILES表示的序列輸入至預訓練的BERT模型,得到深度抽象特征;第三通道融合BPF、DPC、PAAC和K?mer四種特征,共同提取原始序列不同層面的特征;拼接三個通道提取的特征,通過全連接層對輸入的肽序列進行分類。本發明中ACP?BC模型具有較強的穩健性和通用性,在預測ACP和非ACP方面具有巨大的潛力。
本發明授權一種抗癌肽識別方法及系統在權利要求書中公布了:1.一種抗癌肽識別方法,其特征在于,包括以下步驟: 步驟S1、對輸入的肽序列進行數據增強,得到原始序列;所述肽序列進行數據增強的方式為替換、反轉、局部隨機混排和組合增強中的任意兩種方式結合; 步驟S21、使用Bi-LSTM從原始序列中提取特征;原始序列首先通過融合在模型內部的Embedding層映射為256維的向量,再輸入至Bi-LSTM進行提取特征; 步驟S22、將原始序列轉化為化學分子式的形式,并使用SMILES簡化化學分子式,將SMILES表示的序列輸入至預訓練的BERT模型,得到深度抽象特征; 步驟S23、融合BPF、DPC、PAAC和K-mer四種特征,共同提取原始序列不同層面的特征; 步驟S3、拼接經步驟S21、步驟S22和步驟S23提取的特征,通過全連接層對輸入的肽序列進行分類; 所述BPF表示為: ; 式中,fp1為字母表中第一個氨基酸字母的編碼,fp2為字母表中第二個氨基酸字母的編碼,以此類推,fpk為字母表中第K個氨基酸字母的編碼;其中,K表示肽P的N端長度,BPFk的維度為1*20; 所述DPC表示為: ; 式中,為400種二肽中a和b型氨基酸所代表的二肽,為a和b型氨基酸所代表的二肽的數目,N為肽的長度; 所述PAAC表示為: ; 式中,λ為用戶設置的綜合參數,推薦值為10;fi為蛋白質中每個氨基酸的頻率;w為用戶設置的權重因子,默認值為0.05;τk為第k層相關因子,反映所有第k個相鄰殘基之間的序列順序相關性; 所述K-mer表示為: ; ; 假設一個肽序列的長度為L,則有種不同的可能K-mer,序列中出現步;將一個肽序列轉化為K-mer稀疏矩陣M,將任意K個連續的氨基酸看作一個單元。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人吉林大學;通化師范學院,其通訊地址為:130000 吉林省長春市前進大街2699號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。