微軟 BioEmu
3 月 1 日消息,微軟研究院于 2 月 20 日發布博文,宣布推出 AI 模型 BioEmu-1,能夠預測蛋白質隨時間推移的運動和形狀變化,在生物醫學、藥物發現和結構生物學領域帶來新可能。
借助 AI 探究蛋白質
從形成肌肉纖維到保護我們免受疾病侵害,在幾乎所有生物過程中,蛋白質都發揮著至關重要的作用。
科學家近年來利用深度學習,在研究蛋白質結構方面已取得重大進展,能夠根據氨基酸序列準確預測蛋白質結構。然而, 僅從氨基酸序列預測單一蛋白質結構就像觀看電影的單幀畫面,只提供了一個高度靈活分子的截圖。
微軟 BioEmu-1
不同于 DeepMind 的 AlphaFold 專注于確定靜態蛋白質結構,BioEmu-1 模擬蛋白質在不同構象之間的動態轉換,為理解蛋白質運動、設計有效治療方案提供了新的工具。
AlphaFold 3 在結構生物學領域取得了重大進展,改進了蛋白質與 DNA、RNA 和小分子的相互作用模型,但它無法預測蛋白質隨時間的變化。
BioEmu-1 彌補了這一不足,它可以生成多個可能的構象,而不僅僅是單一的最佳擬合結構,這在藥物開發中尤為重要。
BioEmu-1 利用生成式深度學習,從大型數據集中學習模式,然后生成與這些模式一致的新樣本,通過結合靜態蛋白質結構、分子動力學模擬數據和實驗穩定性數據進行訓練。
BioEmu-1 的核心機制是一個擴散模型,它迭代地生成蛋白質結構并根據學習到的約束條件提高其準確性。BioEmu-1 的關鍵輸出是平衡系綜的預測和自由能預測。
BioEmu-1 使用三種類型的數據集進行訓練:(1)AlphaFold 數據庫 (AFDB) 結構;(2)廣泛的 MD 模擬數據集;(3)實驗性蛋白質折疊穩定性數據集。
通過這些數據集的訓練,BioEmu-1 可以識別蛋白質序列映射到多個不同結構,預測合理的結構變化,并學習以正確的概率對折疊和未折疊結構進行采樣。
BioEmu-1 每小時可生成數千個蛋白質結構樣本,相比需要數周時間的傳統分子動力學模擬,顯著加快了研究速度并降低了計算成本,其預測自由能的誤差幅度在 1 kcal / mol 以內,與傳統分子動力學模擬相當,但計算成本卻顯著降低。
【來源: IT之家】