阿爾法折疊法從結(jié)構(gòu)角度解答新的科學(xué)問(wèn)題
英國(guó)《自然》雜志22日發(fā)表了一項(xiàng)結(jié)構(gòu)生物學(xué)重磅研究,世界知名人工智能團(tuán)隊(duì)深度思維(DeepMind)報(bào)告了“阿爾法折疊”(AlphaFold)對(duì)人類(lèi)蛋白質(zhì)組(人類(lèi)基因組編碼的所有蛋白質(zhì)的集合)的準(zhǔn)確結(jié)構(gòu)預(yù)測(cè)。此次得到的數(shù)據(jù)集,涵蓋了人類(lèi)蛋白質(zhì)組近60%氨基酸的結(jié)構(gòu)位置預(yù)測(cè),且預(yù)測(cè)結(jié)果具有可信度。
確定蛋白質(zhì)的結(jié)構(gòu)能為理解生物學(xué)過(guò)程提供寶貴信息,并有望指導(dǎo)藥物研發(fā)??紤]到理解人類(lèi)蛋白質(zhì)組對(duì)健康和醫(yī)藥的重要性,研究人員付出了大量努力來(lái)確定這些蛋白質(zhì)結(jié)構(gòu)。
雖然開(kāi)展了數(shù)十年的研究攻關(guān),但通過(guò)傳統(tǒng)實(shí)驗(yàn)方法確定的結(jié)構(gòu),只覆蓋了人類(lèi)蛋白質(zhì)組17%的氨基酸——氨基酸是連接起來(lái)形成蛋白質(zhì)的亞單位。利用傳統(tǒng)實(shí)驗(yàn)方法解析結(jié)構(gòu)需要克服諸多十分耗時(shí)的障礙,因此,擴(kuò)大蛋白質(zhì)組覆蓋面仍是一項(xiàng)艱巨挑戰(zhàn)。
此次,深度思維團(tuán)隊(duì)的研究人員利用前沿機(jī)器學(xué)習(xí)方法“阿爾法折疊”,確定了覆蓋幾乎整個(gè)人類(lèi)蛋白質(zhì)組(98.5%的所有人類(lèi)蛋白)的蛋白質(zhì)的結(jié)構(gòu)。研究人員發(fā)現(xiàn),“阿爾法折疊”能對(duì)人類(lèi)蛋白質(zhì)組58%的氨基酸的結(jié)構(gòu)位置給出可信預(yù)測(cè)。其中,對(duì)35.7%的結(jié)構(gòu)位置的預(yù)測(cè)達(dá)到了很高的置信度,是實(shí)驗(yàn)方法覆蓋的結(jié)構(gòu)數(shù)量的兩倍。在蛋白水平上,“阿爾法折疊”對(duì)43.8%的蛋白的至少3/4的氨基酸序列給出了可信預(yù)測(cè)。
研究團(tuán)隊(duì)認(rèn)為,大規(guī)模的準(zhǔn)確結(jié)構(gòu)預(yù)測(cè)將成為一種重要工具,讓我們能從結(jié)構(gòu)的角度解答新的科學(xué)問(wèn)題,而“阿爾法折疊”的預(yù)測(cè)結(jié)果將幫助進(jìn)一步闡明蛋白質(zhì)的作用。
研究團(tuán)隊(duì)表示,“阿爾法折疊”的預(yù)測(cè)信息將通過(guò)歐洲生物信息研究所(EMBL-EBI)托管的公用數(shù)據(jù)庫(kù)免費(fèi)向公眾開(kāi)放。
就在本月16日,深度思維公布了“阿爾法折疊2”的問(wèn)世,就計(jì)算機(jī)方法而言,“阿爾法折疊2”能以前所未有的準(zhǔn)確度根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測(cè)其三維結(jié)構(gòu)。