中國農業科學院作物科學研究所;三亞中國農業科學院國家南繁研究院李慧慧獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉中國農業科學院作物科學研究所;三亞中國農業科學院國家南繁研究院申請的專利基于機器學習的作物全基因組預測方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120164521B 。
龍圖騰網通過國家知識產權局官網在2025-09-09發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510643432.2,技術領域涉及:G16B20/00;該發明授權基于機器學習的作物全基因組預測方法及系統是由李慧慧;高尚;何坤輝;張治梁設計研發完成,并于2025-05-19向國家知識產權局提交的專利申請。
本基于機器學習的作物全基因組預測方法及系統在說明書摘要公布了:本發明提供一種基于機器學習的作物全基因組預測方法及系統,首先獲取目標作物多個生長周期內的基因表達數據集合,基因表達數據集合含多個由遺傳標記和表型性狀數據組成的基因序列樣本,接著對基因表達數據集合進行特征提取,得到基因關聯特征和生長性狀特征,然后利用預設機器學習模型對基因關聯特征和生長性狀特征進行融合預測,生成融合預測特征,依據此融合預測特征確定全基因組預測結果,該全基因組預測結果可指示作物在不同環境下的性狀表達趨勢,最后基于全基因組預測結果生成適應性優化策略并反饋至作物培育系統,觸發培育參數調整,實現作物培育的精準化和智能化,提升培育效率與作物適應性。
本發明授權基于機器學習的作物全基因組預測方法及系統在權利要求書中公布了:1.一種基于機器學習的作物全基因組預測方法,其特征在于,所述方法包括: 獲取目標作物在多個生長周期內的基因表達數據集合,所述基因表達數據集合包括多個基因序列樣本,每個基因序列樣本由至少一個基因位點的遺傳標記和對應的表型性狀數據組成; 對所述基因表達數據集合進行特征提取,得到每個基因序列樣本的基因關聯特征和生長性狀特征; 基于預設的機器學習模型對所述基因關聯特征和所述生長性狀特征進行融合預測,生成所述基因序列樣本的融合預測特征; 根據所述融合預測特征確定所述目標作物的全基因組預測結果,所述全基因組預測結果用于指示所述目標作物在不同環境條件下的性狀表達趨勢; 基于所述全基因組預測結果生成適應性優化策略,并將所述適應性優化策略反饋至作物培育系統以觸發培育參數調整操作; 所述對所述基因表達數據集合進行特征提取,得到每個基因序列樣本的基因關聯特征和生長性狀特征,包括: 遍歷所述基因表達數據集合中的每個基因序列樣本,提取所述基因位點的遺傳標記之間的連鎖不平衡系數; 調用預訓練的基因特征編碼器對各個所述連鎖不平衡系數進行多層級編碼處理,生成所述基因序列樣本的基因交互特征向量; 對所述表型性狀數據進行環境適應性分析處理,得到所述基因序列樣本在不同生長環境下的性狀穩定性評分; 將所述基因交互特征向量和所述性狀穩定性評分進行特征對齊處理,得到所述基因序列樣本的基因關聯特征; 對所述基因序列樣本的遺傳標記進行性狀關聯映射處理,得到所述基因序列樣本的生長性狀特征; 所述對所述基因序列樣本的遺傳標記進行性狀關聯映射處理,得到所述基因序列樣本的生長性狀特征,包括: 獲取所述基因序列樣本在不同生長周期內的表型性狀數據,提取所述表型性狀數據的動態變化梯度; 根據所述動態變化梯度與所述遺傳標記的連鎖不平衡系數之間的Spearman秩相關系數,構建性狀關聯映射矩陣; 對所述性狀關聯映射矩陣進行奇異值分解處理,得到所述表型性狀數據的主成分特征; 對所述主成分特征進行標準化處理,并對所述基因交互特征向量進行歸一化處理,將標準化后的主成分特征與歸一化后的基因交互特征向量進行特征維度對齊,通過多層感知機進行非線性空間投影處理,得到所述基因序列樣本的生長性狀特征; 所述基于預設的機器學習模型對所述基因關聯特征和所述生長性狀特征進行融合預測,生成所述基因序列樣本的融合預測特征,包括: 對所述基因關聯特征進行標準化處理,得到標準化基因關聯特征; 對所述生長性狀特征進行歸一化處理,得到歸一化生長性狀特征; 調用所述機器學習模型中的動態權重分配模塊,根據所述標準化基因關聯特征與所述歸一化生長性狀特征之間的相關性評分生成特征融合權重; 通過所述機器學習模型的第三全連接層將所述標準化基因關聯特征和所述歸一化生長性狀特征統一至相同維度后,基于所述特征融合權重進行加權拼接處理,得到所述基因序列樣本的融合預測特征; 所述根據所述融合預測特征確定所述目標作物的全基因組預測結果,包括: 調用預訓練的基因組預測模型對所述融合預測特征進行跨環境泛化處理,得到所述目標作物在預設環境變量下的性狀表達概率分布; 提取所述性狀表達概率分布中方差超過預設閾值的基因位點標識符,生成候選關鍵位點集合; 計算所述候選關鍵位點集合中每個基因位點在環境擴展特征中的特征激活強度,篩選激活強度均值高于遺傳顯著性水平的基因位點形成關鍵基因位點集合; 將所述性狀表達概率分布與所述關鍵基因位點集合進行特征關聯綁定處理,生成所述全基因組預測結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人中國農業科學院作物科學研究所;三亞中國農業科學院國家南繁研究院,其通訊地址為:100081 北京市海淀區中關村南大街12號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。