南京郵電大學郭麗獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京郵電大學申請的專利一種跨物種編碼多肽sORF的預測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114154396B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111305379.3,技術領域涉及:G06F30/27;該發明授權一種跨物種編碼多肽sORF的預測方法是由郭麗;姜雯雯;夏道良設計研發完成,并于2021-11-05向國家知識產權局提交的專利申請。
本一種跨物種編碼多肽sORF的預測方法在說明書摘要公布了:本發明屬于生物信息領域,公開了一種跨物種編碼多肽sORF的預測方法,整合了sORF數據庫中人和小鼠、TAIR數據庫中擬南芥以及NCBI數據庫中部分原核生物的可編碼蛋白的DNA序列,并通過數據過濾策略和負樣本產生策略構建各物種相應的正負樣本;提取序列特征,并利用最大相關最小冗余和增量選擇的方法對訓練集進行特征篩選,得到不同方法對應的最佳特征集,構建肽編碼sORF預測模型;利用貪婪的網格搜索方法進行參數優化,構建基于支持向量機的最佳預測模型,并通過靈敏度、特異度、準確率和馬修斯相關系數對預測模型經行評估。本方法有助于分類識別肽編碼sORFs,對肽編碼sORFs的研究和基因注釋有重要意義。
本發明授權一種跨物種編碼多肽sORF的預測方法在權利要求書中公布了:1.一種跨物種編碼多肽sORF的預測方法,其特征在于,包括以下步驟: 將非編碼序列產生策略應用于多個物種的肽編碼sORFs的數據集,分別得到與之對應的非編碼sORFs數據集;非編碼序列產生策略為:固定起始密碼子和終止密碼子,隨機打亂每個正sORF序列;確保在序列末端的終止密碼子之前沒有任何終止密碼子; 將各物種的肽編碼sORFs和非編碼sORFs分別去冗余,得到各物種相應的正負樣本,構建訓練集和測試集;去冗余方法為:通過CDHit程序,將各物種的肽編碼sORFs和非編碼sORFs分別去冗余,得到各物種相應的正負樣本,構建訓練集和測試集;去冗余閾值設為0.80,濾除相似度大于80%的DNA序列; 根據9種不同的特征選取策略,提取各數據集中相應的特征參數;所述9種不同的特征選取策略分別為:CPPred、2mer、3mer、TN、ITN、Cylindrical、Spherical、Codon、Amino;結合最大相關最小冗余策略和增量選擇方法選取表現較好的特征,構建相應特征集;構建基于支持向量機肽編碼sORFs的預測模型,將訓練集的特征集用于模型訓練;利用貪婪的網格搜索方法對訓練模型進一步優化,分別得到指定參數范圍內的最佳預測模型;利用預測模型對測試集進行預測,分析各數據集預測結果,比較評估不同特征選取策略的預測效率,得到表現最好的特征集和預測模型作為最佳的特征集和預測模型。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京郵電大學,其通訊地址為:210003 江蘇省南京市棲霞區文苑路9號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。