又是AI?刚刚,2024年诺贝尔化学奖被他们获得
2024-10-14 20:01:13 | 点击:3566
刚刚,2024年诺贝尔化学奖揭晓,一半奖项授予了大卫·贝克(David Baker),表彰其在计算蛋白质设计领域的贡献;另一半则共同授予德米斯·哈萨比斯(Demis Hassabis)和约翰·M·詹珀(John M. Jumper),以表彰他们利用人工智能在蛋白质结构预测方面的卓越成就。
哈萨比斯和詹珀的工作展示了AI在生命科学领域的巨大潜力。AI不仅加快了复杂生物过程的理解速度,还为药物研发提供了新工具。通过精准预测蛋白质结构,AI让科学家可以更加高效地设计新药物,改善人类健康。
另一位获奖者大卫·贝克,则专注于从头设计蛋白质。作为蛋白质设计领域的先驱,他不仅开发了可以预测蛋白质结构的算法,还通过计算设计出自然界中不存在的新型蛋白质。不仅推动了基础生物学的发展,还为生物制药领域带来了前所未有的创新可能性。
该奖项的颁发凸显了AI在推动生命科学前沿突破中的重要作用,特别是在复杂蛋白质结构预测和设计方面。
蛋白质是生命的核心构件,其三维结构决定了功能。然而,传统上研究和预测蛋白质的结构需要依赖于实验方法,如X射线晶体学和冷冻电镜。这些方法不仅费时、昂贵,还不适用于某些无法结晶的蛋白质类型。
德米斯·哈萨比斯和约翰·詹珀领导的DeepMind团队在2020年推出了AlphaFold2系统,该系统借助AI,从蛋白质的氨基酸序列出发,直接预测出蛋白质的三维结构,且精度达到了接近实验的水平。
这一突破解决了困扰科学界数十年的“蛋白质折叠问题”,极大加速了生物学和医药领域的研究进展。到目前为止,AlphaFold2已经成功预测了超过两亿种蛋白质的结构,助力研究人员在疟疾疫苗、癌症治疗、酶设计等领域取得了重要进展。
今年,DeepMind和Isomorphic Labs发布了新一代AlphaFold3,其在精确预测所有生命分子(包括蛋白质、DNA、RNA、配体等)的结构及其相互作用方面取得了更大突破。
这场结合了AI与生物科学的革命,才刚刚开始。(袁宁)
以下内容来自诺贝尔奖官方介绍:(致敬AI学者,本介绍由AI翻译,网易进行校对)
2024年诺贝尔化学奖——科普背景
他们通过计算和人工智能揭示了蛋白质的秘密
化学家们长期以来梦想着能够全面理解并掌握生命的化学工具——蛋白质。如今,这个梦想已经触手可及。德米斯·哈萨比斯(Demis Hassabis)和约翰·杰姆珀(John Jumper)成功利用人工智能预测了几乎所有已知蛋白质的结构。大卫·贝克(David Baker)则掌握了如何创造全新的蛋白质。其发现的潜力巨大。
生命的多彩化学是如何实现的呢?答案是蛋白质,它们可以被描述为巧妙的化学工具。蛋白质通常由20种氨基酸组成,氨基酸可以通过无数种方式组合。在DNA中储存的信息作为蓝图,氨基酸在细胞内连接,形成长链。
接着,蛋白质的神奇之处出现了:氨基酸链扭曲并折叠成独特的三维结构。这一结构赋予了蛋白质功能。有的成为化学构件,形成肌肉、角或羽毛;有的则成为激素或抗体;许多蛋白质形成酶,推动生命的化学反应。位于细胞表面的蛋白质也非常重要,它们作为细胞与周围环境之间的沟通渠道发挥作用。
几乎无法高估这些生命的化学构件——20种氨基酸的潜力。2024年诺贝尔化学奖探讨的是如何在全新的水平上理解并掌握它们。哈萨比斯和杰姆珀通过人工智能解决了化学家们50多年未解的难题:如何根据氨基酸序列预测蛋白质的三维结构。他们成功预测了几乎所有已知的2亿种蛋白质的结构。而贝克则创造了从未存在的全新蛋白质,很多新蛋白质具有全新的功能。
蛋白质的最初模糊图像
化学家从19世纪开始就知道蛋白质对生命过程的重要性,但直到20世纪50年代,化学工具才足够精确,使研究人员能够开始更详细地探索蛋白质。剑桥的研究人员约翰·肯德鲁(John Kendrew)和马克斯·佩鲁茨(Max Perutz)在20世纪50年代末通过使用X射线晶体学方法,成功地展示了首个蛋白质的三维模型。这一突破性的发现为他们赢得了1962年诺贝尔化学奖。
随后,研究人员主要依靠X射线晶体学,并付出了巨大的努力,成功地获得了大约20万种不同蛋白质的图像,这为2024年诺贝尔化学奖奠定了基础。
一个谜题:蛋白质如何找到其独特的结构?
美国科学家克里斯蒂安·安芬森(Christian Anfinsen)做出了另一项早期的发现。他通过各种化学手段使现有的蛋白质展开并重新折叠,结果每次蛋白质都能折叠成完全相同的形状。1961年,他得出结论,蛋白质的三维结构完全由其氨基酸序列决定。因这一发现,安芬森在1972年获得了诺贝尔化学奖。
然而,安芬森的逻辑包含一个悖论,美国另一位科学家赛勒斯·莱文萨尔(Cyrus Levinthal)在1969年指出,即使一个蛋白质仅由100个氨基酸组成,理论上它可以假设至少10^47种不同的三维结构。如果氨基酸链是随机折叠的,它可能需要比宇宙的年龄还长的时间才能找到正确的蛋白质结构。但在细胞中,这个过程只需几毫秒。那么,氨基酸链是如何折叠的呢?
安芬森的发现和莱文萨尔悖论暗示了折叠是一个预定的过程,重要的是,关于蛋白质如何折叠的所有信息都必须存在于氨基酸序列中。
化学的重大挑战:预测问题
这些洞见引发了另一个决定性的认识——如果化学家知道蛋白质的氨基酸序列,他们就应该能够预测蛋白质的三维结构。这是一个令人兴奋的想法。如果成功,他们将不再需要繁琐的X射线晶体学,可以节省大量时间。他们也将能够生成所有X射线晶体学无法应用的蛋白质结构。
这些逻辑结论揭示了成为生物化学领域重大挑战的预测问题。为了促进该领域的快速发展,1994年,研究人员启动了一个名为“蛋白质结构预测关键评估”(CASP)的项目,最终发展成为一项竞赛。每两年,全球研究人员会获得一些新确定结构的蛋白质氨基酸序列,但这些结构对参与者保密。挑战是基于已知的氨基酸序列预测这些蛋白质的结构。