当地时间10月9日,瑞典皇家科学院宣布,将2024年诺贝尔化学奖授予大卫·贝克,以表彰其在计算蛋白质设计方面的贡献,另一半则共同授予德米斯·哈萨比斯和约翰·江珀,以表彰其在蛋白质结构预测方面的贡献。他们分别设计出人工智能软件RoseTTAFold和AlphaFold,都成为引领该领域研究的重要工具。
精美的折纸作品在被巧手折叠前,只不过是一片扁扁的木浆制品;蛋白质也一样,功能要在折叠后才能实现。如何从氨基酸序列预测蛋白质的三维结构,一直是分子生物学中的关键挑战。
在广东,深圳湾实验室系统与物理生物学研究所副所长周耀旗的课题组曾为AlphaFold 2的底层技术框架添砖加瓦。该课题组率先预测蛋白质二面角,发展无片段结构预测方法,成为AlphaFold 2成功实现高精度蛋白质结构预测的重要一环。目前,该课题组专注于解决AlphaFold2的预测精确度严重依赖天然同源序列的这个挑战性问题。
设计出不存在于自然界中的蛋白质
在诺贝尔奖官网的图片上,大卫·贝克顶着一头标志性的蓬松乱发,笑容可掬。
进入生物领域前,他的专业是哲学。大学期间,大卫·贝克对生物学表现出兴趣,很快成为华盛顿大学生物化学系助理教授,他和学生共同开发了一款名为Rosetta的程序,如果已知一条氨基酸序列,程序就能算出其最后折叠而成的蛋白质的三维结构。
在计算结构之余,大卫·贝克产生了一个想法:如果反过来,已知蛋白质的最终结构,能否用程序倒推出它的氨基酸序列?
沿着这个思路,2003年,大卫·贝克团队设计出了第一个原本并不存在于自然界中的蛋白质——Top7。这个成果有力地支撑他获得诺奖。
不过,Top7只完成了上述从蛋白质结构到氨基酸序列的倒推,却没有实际功能,就像一个可远观但不可上手把玩的折纸娃娃。
蛋白质设计远比蛋白质预测更难,一种蛋白质结构所对应的氨基酸序列可能有成百上千亿种可能。这也可能是大卫·贝克独得“半个”诺奖,而其他两位科学家要分享另外“半个”的原因。
让人工智能更准确地预测蛋白质
今年5月,人工智能工具AlphaFold 3问世,在试图解决蛋白质折叠问题、预测生物分子结构方面再次升级,很多学者认为这是具有里程碑意义的进展。
AlphaFold 3背后的两位主创正是德米斯·哈萨比斯和约翰·江珀。他们是谷歌DeepMind团队的核心成员,此前已获得2023年生命科学突破奖。
如上文所说,更深入地了解蛋白质折叠问题,对人类了解疾病、研发新药和理解生命体的运作方式都有意义。
自1994年起,和大卫·贝克一样想要解开蛋白折叠之谜的生物学家们会定期聚在一起“比赛”,他们会拿到一个蛋白质的序列,然后用最新的蛋白质折叠工具预测出它的结构,并与通过实验方法得到的“正确答案”进行比对。
但预测蛋白质结构很不容易,20多年来大家的成绩进展不大,直到2020年末AlphaFold2的出现。
AlphaFold2的三维蛋白质结构预测模型准确率超过90%,比最接近的竞争对手高出5倍。通过深度学习,人工智能近乎轻松地破解了“人力不可为”的难题,震撼了生物学界。
近几年,AlphaFold2改变了生物学家研究蛋白质的方式,被证明是一个强大的预测工具。但同时,它也没有取代生物实验,而更像一个缩小目标范围的手段。
据《世界科学》杂志消息,周耀旗曾谈到下一步蛋白结构预测系统将如何发展。他认为,最终的蛋白质结构预测系统应该是一个物理原则感知的模型,这样可以在抗体设计、药物开发时提高功能预测的准确度。“AlphaFold3在预测抗体结构的时候,就引进了物理因素来对预测的抗体结构进行排序。”但他同时也表示,现阶段AlphaFold的结构预测是否已经能发现全新药物分子,还存在争议。
这是一个方兴未艾的研究领域。被AlphaFold超越后,大卫·贝克的团队很快完成了追赶,在《科学》杂志上介绍了其开发的RoseTTAFold算法,同样能预测和解析蛋白质三维结构。
此番分享诺奖并不是终点,3位诺奖科学家在这条赛道上的切磋比拼显然还会持续下去。
南方+记者 钟哲