神經(jīng)網(wǎng)絡(luò)“構(gòu)想”的新蛋白質(zhì)結(jié)構(gòu)。
半個(gè)世紀(jì)以來,科學(xué)家一直在尋找解決“蛋白質(zhì)折疊問題”的方法。這是生物學(xué)領(lǐng)域的一項(xiàng)重大挑戰(zhàn),難倒了幾代科學(xué)家。
但現(xiàn)在,人工智能(AI)解決了這一問題。據(jù)《自然》雜志1日發(fā)表的論文,包括美國華盛頓大學(xué)、倫斯勒理工學(xué)院和哈佛大學(xué)的研究人員在內(nèi)的研究小組描述了一種升級的阿爾法折疊系統(tǒng),該系統(tǒng)由深度思維(DeepMind)公司開發(fā),會“構(gòu)想”出具有穩(wěn)定結(jié)構(gòu)的新蛋白質(zhì)。
研究人員表示,這是AI網(wǎng)絡(luò)在解決生物學(xué)領(lǐng)域最大的挑戰(zhàn)之一——根據(jù)氨基酸序列確定蛋白質(zhì)三維(3D)結(jié)構(gòu)方面取得的巨大飛躍,是生命科學(xué)和醫(yī)學(xué)的福音,極大地促進(jìn)了人們對細(xì)胞基本結(jié)構(gòu)的理解,并將推動更快、更先進(jìn)的藥物制造進(jìn)程。
蛋白質(zhì)存在于每個(gè)細(xì)胞中,是一種線狀分子,會自發(fā)折疊成復(fù)雜的3D形狀,其形狀與功能密切相關(guān)。
例如,抗體蛋白折疊的形狀能使它們精確識別和瞄準(zhǔn)特定的異物,就像一把鑰匙插入鎖中一樣。在細(xì)胞發(fā)育、DNA修復(fù)和新陳代謝等幾乎所有生物學(xué)過程中,這種折疊非常關(guān)鍵。
因此,了解蛋白質(zhì)折疊結(jié)構(gòu)對于了解生物體的功能以及最終生命的運(yùn)作方式至關(guān)重要。
然而,蛋白質(zhì)根據(jù)其氨基酸序列可能折疊成的不同構(gòu)型的數(shù)量是個(gè)天文數(shù)字。在阿爾法折疊出現(xiàn)之前,科學(xué)家只知道人體大約2萬種蛋白質(zhì)中約17%的3D結(jié)構(gòu)。
已知的蛋白質(zhì)結(jié)構(gòu)是幾十年來科學(xué)家在實(shí)驗(yàn)室里通過X射線結(jié)晶學(xué)和核磁共振等方法煞費(fèi)苦心計(jì)算出來的,這些方法需要數(shù)百萬美元的設(shè)備和數(shù)月乃至數(shù)年的反復(fù)試驗(yàn)。
近年來,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等AI技術(shù)使這項(xiàng)工作的準(zhǔn)確性發(fā)生了革命性變化。
利用阿爾法折疊,科學(xué)家獲得了幾乎所有(98.5%)人類蛋白質(zhì)組的3D結(jié)構(gòu)。其中36%的預(yù)測準(zhǔn)確率非常高,另外22%的預(yù)測準(zhǔn)確率較高。
此次,研究人員向AI提供了完全隨機(jī)的蛋白質(zhì)結(jié)構(gòu)的氨基酸序列,并向其中引入一些突變,直到AI神經(jīng)網(wǎng)絡(luò)預(yù)測到它們能將其折疊成穩(wěn)定的結(jié)構(gòu)為止,最終共產(chǎn)生了2000種全新的蛋白質(zhì)序列。
研究論文共同作者、美國華盛頓大學(xué)醫(yī)學(xué)院蛋白質(zhì)設(shè)計(jì)研究所貝克實(shí)驗(yàn)室的博士后學(xué)者伊萬·阿尼先科表示:
“任何時(shí)候,我們都沒有引導(dǎo)AI得出特定結(jié)果,這些新的蛋白質(zhì)結(jié)構(gòu)完全是計(jì)算機(jī)‘構(gòu)想’出來的。”
研究人員表示,AI深度學(xué)習(xí)網(wǎng)絡(luò)極大簡化了蛋白質(zhì)的設(shè)計(jì)。未來,希望利用AI設(shè)計(jì)具有功能的新蛋白質(zhì),包括基于蛋白質(zhì)的藥物、酶等。