每日經濟新聞 2024-05-12 21:38:07
每經記者|蔡鼎 每經編(bian)輯|蘭素英
一直以來,從氨基酸序列出發(fa)預測蛋白質的(de)(de)(de)三(san)維結構(gou)是(shi)結構(gou)生(sheng)物信息(xi)學中最具挑戰(zhan)性的(de)(de)(de)問題。但幾年前,由(you)谷歌旗下公司DeepMind創建的(de)(de)(de)基于(yu)深度學習的(de)(de)(de)人工智能測序式模型(xing)AlphaFold解(jie)決(jue)了這(zhe)個問題。
北京時間5月8日(周三(san))晚間,《自(zi)然》雜志(zhi)刊登了DeepMind的(de)AlphaFold團(tuan)隊(dui)和(he)倫敦(dun)藥(yao)物(wu)(wu)研發公司Isomorphic Labs共同署名(ming)的(de)論(lun)文,介紹了AlphaFold 3,這是AlphaFold的(de)第三(san)代版(ban)本,全新的(de)蛋白質(zhi)結構(gou)預測系統能以(yi)前所未有的(de)精度預測“蛋白質(zhi)數據庫(Protein Data Bank)”內(nei)幾乎所有分子(zi)類型的(de)復合物(wu)(wu)結構(gou)。
論文稱,AlphaFold 3是一款革命性的系(xi)統。對于蛋白質與(yu)其他分子(zi)(zi)類型的相互作(zuo)用(yong),AlphaFold 3在基準測(ce)試中(zhong)的準確率比現有(you)最(zui)好(hao)的傳統方法高出50%,且無需輸入任何結構信息,這使得AlphaFold 3成(cheng)為首個在生物分子(zi)(zi)結構預測(ce)方面超越基于物理工具的方法的人工智能(neng)系(xi)統。
實(shi)際上,自初(chu)代(dai)AlphaFold問世以(yi)來,結構生(sheng)物(wu)學家們對其能(neng)力邊界的(de)討論(lun)就(jiu)從(cong)未停止。此(ci)前有(you)研究(jiu)(jiu)證實(shi)AlphaFold還無法預測(ce)新(xin)的(de)突變對蛋白質的(de)影響。不過(guo),這(zhe)仍無法掩蓋AlphaFold在(zai)預測(ce)生(sheng)物(wu)結構方面(mian)前所(suo)未有(you)的(de)強大能(neng)力。美國洛斯(si)(si)·阿拉(la)莫斯(si)(si)國家實(shi)驗室研究(jiu)(jiu)員(yuan)、新(xin)墨西哥(ge)州聯盟高級科學家Thomas C. Terwilliger在(zai)去年(nian)11月發表于(yu)《自然》雜(za)志上的(de)論(lun)文中稱,盡管AlphaFold的(de)預測(ce)并(bing)非全部準(zhun)確,但其提(ti)供了可信的(de)假說,可以(yi)用(yong)(yong)作提(ti)示機制。所(suo)有(you)這(zhe)些能(neng)力很可能(neng)只是人工智(zhi)能(neng)方法在(zai)結構生(sheng)物(wu)學中日(ri)益廣泛應用(yong)(yong)的(de)開端(duan)。
自(zi)初代AlphaFold問(wen)世(shi)以來,結(jie)構(gou)生物(wu)學家們對其能力邊界的(de)討論就從未停(ting)止。圖(tu)為(wei)由AlphaFold模擬的(de)一種人類蛋白質的(de)結(jie)構(gou)。 視(shi)覺中國圖(tu)
AlphaFold 3準確率比現有最好方法高50%
論文稱,基于AlphaFold 2能力的(de)提升(sheng),AlphaFold 3如今(jin)能預(yu)測(ce)蛋(dan)白(bai)質(zhi)與蛋(dan)白(bai)質(zhi)、核酸、小(xiao)分子、離子、修飾蛋(dan)白(bai)質(zhi)殘基的(de)復合物以(yi)及抗體-抗原(yuan)相互作用,其預(yu)測(ce)準確性(xing)顯著(zhu)超過當前預(yu)測(ce)工具,包括(kuo)AlphaFold-Multimer。DeepMind團隊稱,這(zhe)(zhe)意味著(zhu)AlphaFold 3將人類(lei)帶到了蛋(dan)白(bai)質(zhi)之外(wai)的(de)更(geng)廣泛的(de)生(sheng)物分子領域。這(zhe)(zhe)一飛躍可能開(kai)啟更(geng)多變革性(xing)的(de)科學(xue),從開(kai)發生(sheng)物可再生(sheng)材(cai)料和更(geng)具彈性(xing)的(de)材(cai)料,到加速藥(yao)物設計和基因組學(xue)研究等。
AlphaFold 2于(yu)(yu)2020年問世,可根據(ju)蛋(dan)白(bai)質的(de)(de)氨(an)基酸(蛋(dan)白(bai)質的(de)(de)基本成分)序列預測其3D結(jie)構(gou)。論文第一(yi)作者、DeepMind高級研(yan)究科學(xue)家John Jumper和(he)同(tong)事稱,到目(mu)(mu)前為止,全球數(shu)(shu)以百萬計(ji)的(de)(de)研(yan)究人員已(yi)經(jing)使用AlphaFold 2在瘧疾疫(yi)苗、癌癥(zheng)治療(liao)和(he)酶設計(ji)等領域取得了進展。同(tong)時(shi)(shi),AlphaFold 2據(ju)稱已(yi)被用于(yu)(yu)預測數(shu)(shu)以億計(ji)的(de)(de)結(jie)構(gou),而(er)按照(zhao)目(mu)(mu)前全球的(de)(de)結(jie)構(gou)生物學(xue)實驗的(de)(de)速(su)度,這需要(yao)花費數(shu)(shu)億年的(de)(de)研(yan)究時(shi)(shi)間(jian)。
據悉(xi),AlphaFold 3的核心是深度學習(xi)模塊Evoformer的改進版,Evoformer是AlphaFold 2的基礎(chu)架構。論文稱,只(zhi)要給定分子輸(shu)入列表,AlphaFold 3就會使用一個(ge)類似于人工智能(neng)圖像生(sheng)成器的融合網絡(luo)來(lai)組合預測結果,不僅能(neng)生(sheng)成它們的聯合三維(wei)結構,還能(neng)揭示(shi)分子是如何結合在(zai)一起(qi)的。
論文稱,AlphaFold 3在(zai)(zai)預(yu)測(ce)類(lei)似藥物(wu)的(de)相(xiang)互(hu)作(zuo)用(包括(kuo)蛋(dan)白質與配體(ti)(ti)的(de)結合以及抗體(ti)(ti)與目標蛋(dan)白質的(de)結合)方面達到了前所未有的(de)準確性。在(zai)(zai)基(ji)準測(ce)試中,AlphaFold 3的(de)準確率(lv)比現有最好的(de)傳(chuan)統方法(fa)高出50%,且無需(xu)輸入任何(he)結構信息,這使得AlphaFold 3成為首個在(zai)(zai)生物(wu)分(fen)子結構預(yu)測(ce)方面超越基(ji)于(yu)物(wu)理工具的(de)方法(fa)的(de)人工智(zhi)能系統。
DeepMind團隊認為,AlphaFold 3有(you)(you)能力將生物界帶到前所未(wei)有(you)(you)的(de)高度。該系統能夠使科學家看到細胞(bao)系統的(de)所有(you)(you)復雜性,包括結構(gou)、相互(hu)作用和修飾,同時(shi)揭示了(le)它們是(shi)如何相互(hu)聯(lian)系的(de),并(bing)有(you)(you)助(zhu)于(yu)理解這些聯(lian)系是(shi)如何影響生物功能的(de)——比(bi)如藥物的(de)作用、激(ji)素的(de)產生和DNA修復的(de)健康保護過程。
AlphaFold 3的(de)(de)表(biao)現表(biao)明,開發(fa)正確(que)的(de)(de)深(shen)度學(xue)習(xi)框架可以大(da)量減(jian)少在這(zhe)些任務中獲得生物(wu)學(xue)相關性能(neng)所需(xu)的(de)(de)數(shu)(shu)(shu)據(ju)量,并擴大(da)已經收(shou)集的(de)(de)數(shu)(shu)(shu)據(ju)的(de)(de)影響。DeepMind預(yu)計結構建模將繼續(xu)改(gai)進(jin),這(zhe)不(bu)僅是因為深(shen)度學(xue)習(xi)的(de)(de)進(jin)步(bu),而且還因為實驗結構確(que)定(ding)方(fang)法的(de)(de)持(chi)續(xu)進(jin)步(bu),例(li)如低溫電(dian)子(zi)(zi)顯微(wei)鏡和斷層(ceng)掃(sao)描的(de)(de)巨大(da)改(gai)進(jin),將提供豐富的(de)(de)新(xin)訓練數(shu)(shu)(shu)據(ju),以進(jin)一步(bu)提高此類模型的(de)(de)泛化能(neng)力。實驗和計算方(fang)法的(de)(de)并行發(fa)展(zhan)有望推動人們更快速地進(jin)入一個對分子(zi)(zi)結構和疾病治療更加了解的(de)(de)時代(dai)。
論文(wen)同時介紹(shao),DeepMind新(xin)推出的AlphaFold服務(wu)器是全球預測蛋白質如何與(yu)細(xi)胞內其他分(fen)子相互作用的最準(zhun)確的工具。
AlphaFold服(fu)務(wu)器(qi)是一(yi)個(ge)免費的(de)(de)平臺,生物(wu)(wu)學家(jia)(jia)可以利用AlphaFold 3的(de)(de)強大功能來(lai)模擬由蛋白質、DNA、RNA以及(ji)(ji)一(yi)系(xi)列配體、離(li)子(zi)和化學修飾物(wu)(wu)組成(cheng)的(de)(de)結構。“AlphaFold服(fu)務(wu)器(qi)的(de)(de)影響(xiang)將通過它們如(ru)何使科學家(jia)(jia)加速發現生物(wu)(wu)學和新研究領域的(de)(de)開放性問題來(lai)實現。我們剛(gang)剛(gang)開始挖掘AlphaFold 3的(de)(de)潛力,迫不及(ji)(ji)待地想(xiang)看(kan)看(kan)未(wei)來(lai)會發生什么(me)。”DeepMind團隊在論文中寫道。
而且,AlphaFold服務器(qi)可以幫(bang)助科學家提(ti)出(chu)新的假設(she)(she),并(bing)在實(shi)驗室中進(jin)(jin)行(xing)測試,從而加(jia)快工作(zuo)進(jin)(jin)度,實(shi)現進(jin)(jin)一(yi)步(bu)的創新。如果(guo)采(cai)用傳(chuan)統方(fang)法,要實(shi)現蛋白質結構預測,不(bu)僅需要博士級別的知識水平,還(huan)要花(hua)費數十萬美(mei)元才(cai)能完成。谷歌云平臺plaorm還(huan)為研究人(ren)員(yuan)(yuan)提(ti)供了生成預測的便捷方(fang)法,即使研究人(ren)員(yuan)(yuan)沒有計算(suan)資(zi)源或不(bu)掌(zhang)握機器(qi)學習方(fang)面的專業知識也(ye)能操作(zuo)。據悉,Isomorphic Labs正將AlphaFold 3與(yu)一(yi)套互補的內部(bu)人(ren)工智(zhi)能模型相結合(he),為內部(bu)項目以及制藥合(he)作(zuo)伙伴(ban)進(jin)(jin)行(xing)藥物(wu)設(she)(she)計,以期加(jia)快并(bing)提(ti)高藥物(wu)設(she)(she)計的成功率。
AlphaFold并非完全準確,但可作為提示機制
AlphaFold在不斷迭代中展(zhan)現出了強大的性能(neng),而科學界(jie)對(dui)這一(yi)預測(ce)系統的邊界(jie)探討也一(yi)直存在。
美(mei)國洛斯(si)·阿拉莫(mo)斯(si)國家實(shi)驗室(shi)研(yan)究(jiu)員、新墨西哥(ge)州聯盟高級(ji)科學家Thomas C. Terwilliger在去年11月發表于《自然》雜志上的(de)(de)論文中稱,AlphaFold的(de)(de)預(yu)(yu)測(ce)是有(you)價值的(de)(de)假(jia)設,雖(sui)然可以(yi)加速藥物的(de)(de)發現,但(dan)并(bing)不能取代實(shi)驗結構(gou)確(que)定工作。Terwilliger團隊(dui)的(de)(de)研(yan)究(jiu)顯示,雖(sui)然AlphaFold的(de)(de)預(yu)(yu)測(ce)通常驚人的(de)(de)準確(que),但(dan)他們發現AlphaFold預(yu)(yu)測(ce)的(de)(de)許多(duo)部分與相(xiang)應晶體結構(gou)的(de)(de)實(shi)驗數(shu)據不兼容。
另外,一(yi)些(xie)研究人員也曾嘗試將AlphaFold應用于會破壞蛋白質天然結構的(de)各類突(tu)(tu)變,包括與早期乳腺癌(ai)有(you)關(guan)的(de)一(yi)個突(tu)(tu)變,但結果(guo)發現,AlphaFold還無法預測新(xin)的(de)突(tu)(tu)變對蛋白質的(de)影響,因為沒(mei)有(you)演化上相關(guan)的(de)序列可(ke)以用來研究。
不(bu)過(guo)需要(yao)指出的(de)(de)是,Terwilliger團隊在(zai)上述論文(wen)中仍對AlphaFold的(de)(de)能力(li)給出了非常(chang)正(zheng)面的(de)(de)評價。該團隊寫(xie)道——盡管存在(zai)局(ju)限(xian)性,但(dan)AlphaFold預(yu)測已經在(zai)改變蛋白質結(jie)構(gou)假(jia)設的(de)(de)產(chan)生(sheng)和檢驗方式。盡管AlphaFold預(yu)測并非完(wan)全準確,但(dan)它(ta)們(men)提(ti)供了可(ke)信的(de)(de)假(jia)說,可(ke)以作為(wei)提(ti)示機制,并允許設計(ji)具有特定(ding)預(yu)期結(jie)果的(de)(de)實驗。
“所有(you)這些能力很可能只是人(ren)工(gong)智(zhi)能方法在(zai)結(jie)(jie)(jie)構(gou)生物學中日益廣泛(fan)應用(yong)的(de)開端。人(ren)工(gong)智(zhi)能方法必將從蛋(dan)白質擴展到核酸、配體、共價(jia)修飾、環境(jing)條件,以(yi)(yi)(yi)及(ji)所有(you)這些實體之(zhi)間(jian)的(de)相互(hu)作(zuo)用(yong)以(yi)(yi)(yi)及(ji)多種結(jie)(jie)(jie)構(gou)狀態。隨著(zhu)更多因(yin)素的(de)加入以(yi)(yi)(yi)及(ji)序(xu)列和結(jie)(jie)(jie)構(gou)信息數據庫的(de)擴大,這些預測的(de)準(zhun)確性以(yi)(yi)(yi)及(ji)與(yu)之(zhi)相關的(de)不(bu)確定(ding)(ding)性很可能會不(bu)斷(duan)提高(gao)。預測結(jie)(jie)(jie)果將成為越來(lai)越有(you)用(yong)的(de)結(jie)(jie)(jie)構(gou)假說,為生物系統的(de)實驗和理論(lun)分析奠定(ding)(ding)堅實的(de)基礎。”Terwilliger團隊補充道。
封(feng)面圖片來源:視覺(jue)中(zhong)國
如需轉載請與《每日經濟新聞》報社聯系。
未經(jing)《每日經(jing)濟新聞》報社授權,嚴禁轉載或鏡(jing)像,違者必究。
讀者熱線(xian):4008890008
特(te)別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不(bu)希望作品(pin)出現在本(ben)站,可(ke)聯系我們要求撤下您的作品(pin)。
歡(huan)迎關注每(mei)日經濟新(xin)聞APP