最新的AlphaFold模型不再局限于蛋白質折疊,還能夠在配體、蛋白質、核酸以及翻譯后修飾等方面生成高度精確的結構預測。DeepMind 其衍生公司 已將該系統用于藥物設計。
大約五年前,谷歌最多產的以AI為中心的研究實驗室之一,DeepMind,推出了 AlphaFold。這是一種可以準確預測人體內許多蛋白質結構的人工智能系統。
從那時起,DeepMind 對系統進行了改進,于 2020 年發布了更新且功能更強大的 AlphaFold 版本--AlphaFold 2。
實驗室的工作仍在繼續。
10月31日,DeepMind表示,最新版本 AlphaFold 已經出爐,不少人將其取名為“ AlphaFold 3”。
據悉,最新的 AlphaFold 系統由DeepMind及其衍生公司 Isomorphic Labs (專注于利用 AI 做藥物發現)共同開發,不再局限于蛋白質折疊,還能夠在配體、蛋白質、核酸以及翻譯后修飾等方面生成高度精確的結構預測。且 Isomorphic Labs 公司已經將該系統用于藥物發現工作。
不過最新版本的“ AlphaFold 3 ”還處于預覽階段,后續開發工作還在進行。
AlphaFold新版本有哪些升級?
第一大升級:預測蛋白質數據庫(PDB)中大多數分子類型的結構,達原子精度。
根據DeepMind的說法,AlphaFold可以預測蛋白質數據庫(一個廣泛使用的科學數據庫)中幾乎所有分子的結構。DeepMind聲稱,該模型通常以“原子精度”生成這些預測。
AlphaFold 新版本不僅可以估計蛋白質的形狀,還可以估計其他生物分子的形狀。包括:小分子(配體)、蛋白質、核酸(DNA和RNA)、具有翻譯后修飾(PTM)的分子。
第二大升級:預測相關配體的結構。
所謂配體,是指其他不同分子與蛋白質結合,并導致蛋白質功能方式發生變化。配體在細胞信號傳導中起著重要作用,細胞信號傳導是細胞相互影響行為的關鍵生物過程。
一種情況是,當配體附著或結合到蛋白質上時,組合結構稱為“蛋白質-配體復合物”。研究人員歷來使用一種稱為“對接”的方法評估這種復合物的形狀。但這一方法的局限性是,只有當有大量關于蛋白質-配體復合物的蛋白質成分的數據可用時,才能使用這種方法。
根據 DeepMind 的說法,新版本的 AlphaFold 新版本可以比“對接”方法更準確地預測蛋白質-配體復合物的形狀。與這些方法相比,AlphaFold 新版本需要的數據要少得多。
DeepMind最新模型為蛋白質-配體結構預測設定了新的標準,在預測蛋白質-配體相互作用方面,新AlphaFold的性能比傳統方法高出約20%,并且還可以預測尚未進行結構表征的全新蛋白質。
因此,AlphaFold 新版本可能會使科學家更容易研究新發現的蛋白質-配體復合物,而這些復合物的信息很少,而且可以幫助科學家識別和設計潛在的藥物新分子。
Isomorphic Labs 最新公布了3個案例實驗:抗癌分子的結合(PORCN)、關鍵癌癥靶標的共價配體結合(KRAS),脂質激酶變構抑制劑(PI5P4Kγ)的結構預測。結果顯示,該模型預測的結構與案例實驗中測定的結構非常接近。
這一舉動引起相關學者和藥企的關注。有人在國內外社交平臺表示:“設計新的分子比開發工具更重要,開發類似工具的人可能要改行,畢竟設計新的高價值的分子才可能是更好的生財之道?!?/p>
不過,也有人希望新版本能力再做進一步提升:很多時候,最新的 Alphafold 的相對準確率(RMSD誤差<2A)也只有50-60%,這對于藥物設計來說往往會有很多問題。
更進一步說,蛋白質和小分子復合物的結構預測,應該是結合了AI和CADD兩種方法,即分別基于數據庫和物理原理,
第三大升級:預測核酸、以及翻譯后修飾結構。
核酸是關鍵遺傳信息的攜帶者,并破譯翻譯后修飾--即蛋白質誕生后發生的化學變化。
例如,在 CasLambda 與 crRNA 以及 DNA 結合的結構中,CasLambda 共享 CRISPR-Cas9 系統的基因編輯能力,通常被稱為“基因剪刀”,研究人員可以利用它來改變動植物和微生物的DNA,而 CasLambda 的較小尺寸可能使其在基因編輯中更加有效。
據一位從事藥物設計的公司創始人評價:做核酸藥物的人有福了,至少有個結果。不過結果是否準確,還需找個有經驗的CADD(計算機輔助藥物設計)研究員來評估。
此外,也有人指出,“我更關心 Alphafold 3 是否可以用于預測病毒的蛋白質結構。AFDB(數據庫)中有很多預測結構,幾乎涵蓋了所有物種,但沒有病毒。而且新版本對RNA結構預測還不太好?!?/p>
總體而言,至于 AlphaFold 3 具體性能表現,DeepMind 和 Isomorphic Labs 研究人員透露:
?考慮到比較系統使用已知的蛋白質結構作為基礎,AlphaFold 3 在配體對接的準確性方面,優于開源分子建模模擬軟件 AutoDock Vina 等傳統系統;
?與AlphaFold 2.3相比,AlphaFold 3 在預測蛋白質-蛋白質結構方面,抗體結合結構顯著增強;
?此在蛋白質-核酸相互作用方面,AlphaFold 3 優于其他競爭方法,如RoseTTA2FoldNA等;
?在 RNA 結構預測方面,AlphaFold 3 優于自動化技術,但略低于頂級CASP 15 參賽者,后者涉及專家手動干預。
但饒有意味的是,針對最新版本,DeepMind的博客文章并沒有介紹方法,也沒有對比薛定諤的方法。這可能是競爭關系的原因。
無論如何,從表面上看,AlphaFold 3 的功能有了大幅度的提升,如果真如DeepMind所說,那么新版模型擴展的功能和性能提升可以加速生物醫學突破,為疾病通路、基因組學、生物可再生材料、植物免疫、潛在治療靶點、藥物設計機制提供各種全新的可能性。
“AlphaFold3 ”能否繼續開源?
盡管 AlphaFold 最新版本推出不到兩天,但已經有不少人已經開始期盼望繼續開源,“因為學術界對蛋白質的研究已經空前高漲?!?/p>
一個典型例子是:
盡管 OpenAI 的 ChatGPT 在 2022 年底亮相時就席卷全球,但 2022 年被引用次數最多的論文并非關于生成人工智能(AIGC),甚至不是來自大型科技公司,而是歐洲分子生物學實驗室(EMBL-EBI)和 DeepMind 出版的“AlphaFold 蛋白質結構數據庫”,被引次數為 1331 次。
更有趣的是,引用量第二同樣屬于“蛋白質折疊模型”--ColabFold。該系統由馬克斯·普朗克多學科科學研究所(MPG)打造,引用次數為 1138 次。
從一定程度上說,盡管企業界將2022年描述為“生成人工智能年”,但學術界則認為:2022年絕對是“蛋白質折疊預測年”。
“目前 Alphafold 擁有3項以上的專利,這不該是理所當然的,也不該是常態。不過AF歷代版本確實是目前生物領域最先進的工具,沒有之一?!?/p>
更有人指出,“閉源不是最好的解決方案,為什么大多數國家都傾向于使用AlphaFold ?我有點懷疑大多數國家是否有人才和預算,來制造像AlphaFold 和蛋白質數據庫這樣的東西?!?/p>
據悉,DeepMind在 AlphaFold 3發布當天披露,已累計超過140萬用戶(來自190多個國家)訪問了AlphaFold蛋白質結構數據庫。
不過未來“AlphaFold 3”能否真正推動藥物開發,還有待時間去驗證。
-
AI
+關注
關注
87文章
26909瀏覽量
264698 -
數據庫
+關注
關注
7文章
3616瀏覽量
63579 -
DeepMind
+關注
關注
0文章
128瀏覽量
10723
原文標題:「AlphaFold 3」要來了?DeepMind最新推出新一代蛋白質結構預測工具,已用于藥物設計
文章出處:【微信號:IoT_talk,微信公眾號:醫健AI掘金志】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論