DeepMind AI实验室预测出大多数蛋白质结构 - 《华尔街日报》
Steven Rosenbush
DeepMind科技人工智能实验室的研究人员周四表示,他们已经预测出几乎所有已知蛋白质的结构,这是生物学领域的重大突破,将加速药物发现进程,并有助于解决可持续发展和粮食安全等问题。
这家总部位于伦敦的实验室是谷歌母公司Alphabet旗下的子公司,开发了一种名为AlphaFold的算法,可预测蛋白质的三维结构。蛋白质存在于所有生物体中,在细胞功能中发挥关键作用。该项目始于2016年。
去年7月,DeepMind发布了包含35万种蛋白质预测结构的AlphaFold数据库,其中包括人体内所有蛋白质结构,供全球研究人员和实验室自由使用。到2021年12月,数据库已扩展至100万种蛋白质。
周四DeepMind宣布,该数据库现已涵盖2.14亿种预测蛋白质结构,几乎包含科学界已知的所有蛋白质,涉及动物、植物、细菌等多种生物体中的蛋白质。
疟疾蛋白Pfs48/45的三维图像。图片来源:DeepMind科技DeepMind联合创始人兼首席执行官德米斯·哈萨比斯表示,了解蛋白质结构对理解其功能至关重要。此前,这类建模需要依赖耗时且昂贵的X射线等实验方法。
“去年七月我们推出这个数据库时,它被公认为生物学领域的重大突破,我认为这也完美展示了如何利用人工智能推动科学发现。现在查询蛋白质三维结构几乎像用谷歌搜索一样简单。”哈萨比斯博士表示。
欧洲分子生物学实验室副主任兼欧洲生物信息学研究所所长尤安·伯尼指出,在AlphaFold的推动下,这项持续数十年的蛋白质建模研究取得了巨大进展。该研究所参与了该项目合作。
“这个难题困扰了我们太久太久。”伯尼博士感慨道。
牛津大学分子寄生虫学教授马修·希金斯透露,过去一年间,科研人员运用AlphaFold加速了疟疾疫苗研发。这种每年导致全球数十万人死亡的传染病,其关键蛋白Pfs48/45的研究曾长期受阻。
“尽管投入多年心血,传统方法始终无法清晰呈现这个分子的结构细节,我们只能获得非常模糊的影像。”希金斯博士解释道。
据他介绍,一位博士后研究员将AlphaFold预测的蛋白质结构与实验获得的模糊影像进行比对,两种模型完美契合,最终清晰揭示了该分子的结构特征、作用机制及抗体结合方式。
“AlphaFold的应用具有革命性意义,让我们首次看清了这种疟疾表面蛋白的真实面貌。”希金斯博士强调道。
AlphaFold是一种神经网络系统,它基于已知蛋白质模型进行训练,并学会了自主预测蛋白质结构。
“这是科学与人工智能领域的非凡里程碑,展示了AI作为科学发现工具的作用,其规模前所未有,“南加州大学工程系教授兼Nikias讲席教授Shrikanth Narayanan表示。Narayanan博士称共享AlphaFold精选数据集有望推动全球科研与临床转化。
DeepMind以开发多款突破性AI模型闻名,例如掌握复杂围棋游戏的AlphaGo,该程序在2016年击败了顶尖棋手李世石。
Angus Loten对本文亦有贡献。
联系记者Steven Rosenbush,邮箱:[email protected]
更正与补充说明
谷歌母公司Alphabet旗下DeepMind Technologies的AlphaFold数据库最初于2021年7月发布时包含35万种预测蛋白质结构,至2021年12月扩展至100万种。本文早期版本错误称初始数据库包含100万种预测蛋白质。(已于7月29日更正)
本文发表于2022年7月29日印刷版,标题为《AI实验室预测绝大多数蛋白质结构》。