浙江大學朱峰獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浙江大學申請的專利一種基于大語言模型和圖像表征的藥物-靶點相互作用預測方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119993257B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510068501.1,技術領域涉及:G16B15/30;該發明授權一種基于大語言模型和圖像表征的藥物-靶點相互作用預測方法是由朱峰;牟敏杰;牛天樂;葛一超;張瀚毓設計研發完成,并于2025-01-16向國家知識產權局提交的專利申請。
本一種基于大語言模型和圖像表征的藥物-靶點相互作用預測方法在說明書摘要公布了:本發明公開了一種基于大語言模型和圖像表征的藥物?靶點相互作用預測方法,使用大語言模型ESM?2編碼靶點序列,使用大語言模型X?MOL編碼藥物SMILES,生成特征矩陣,通過圖像表征技術生成藥物和靶點的二維圖像表征;構建藥物?靶點相互作用預測模型MapCPI,將藥物和靶點的二維圖像表征輸入MapCPI,得到藥物?靶點相互作用預測概率,判斷藥物?靶點是否發生結合。模型利用這些編碼信息,不依賴于靶點結構信息即可有效提取藥物?靶點相互作用特征,從而實現對藥物?靶點相互作用的預測,并且展現出良好的泛化性能。本發明通過結合大語言模型和圖像表征技術提高了藥物?靶點相互作用預測的準確度和效率。
本發明授權一種基于大語言模型和圖像表征的藥物-靶點相互作用預測方法在權利要求書中公布了:1.一種基于大語言模型和圖像表征的藥物-靶點相互作用預測方法,其特征在于,包括以下步驟: S1:收集藥物-靶點相互作用基準數據集,并獲取藥物SMILES和靶點序列; S2:使用大語言模型ESM-2編碼靶點序列,使用大語言模型X-MOL編碼藥物SMILES,生成特征矩陣,通過圖像表征技術生成藥物和靶點的二維圖像表征,具體包括: 2.1)使用大語言模型ESM-2對蛋白質數據庫中的蛋白質序列進行編碼生成蛋白編碼矩陣,使用大語言模型X-MOL對化合物數據庫中所有生物活性化合物進行編碼生成化合物編碼矩陣,通過平均池化操作將靶點和藥物的原始特征矩陣轉換成向量; 2.2)基于余弦相似性計算蛋白編碼矩陣之間的成對距離生成蛋白特征距離矩陣,同樣地基于余弦相似性計算化合物編碼矩陣之間的成對距離生成化合物特征距離矩陣,計算公式為: ; 其中a和b代表不同的特征,和表示所有樣本在該維特征上組成的特征值向量; 2.3)通過均勻流形近似和投影算法將蛋白特征距離矩陣或者化合物特征距離矩陣進行降維,投影到二維空間,分別得到蛋白特征的散點分布或化合物特征的散點分布; 2.4)使用Jonker-Volgenant算法,將蛋白特征的散點分布或化合物特征的散點分布進行線性分配,得到規則化的蛋白模板圖像或規則化的化合物模板圖像,規則化的蛋白模板圖像和規則化的化合物模板圖像構成藥物和靶點的二維圖像表征; S3:構建藥物-靶點相互作用預測模型MapCPI,將藥物和靶點的二維圖像表征輸入MapCPI,得到藥物-靶點相互作用預測概率; S4:根據藥物-靶點相互作用預測概率判斷藥物-靶點是否發生結合。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江大學,其通訊地址為:310058 浙江省杭州市西湖區余杭塘路866號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。