《华尔街日报》:驱动聊天机器人与搜索查询的人工智能如何助力新药研发
Karen Hao
插图:弗吉尼亚·加布里埃利在寻找新型抗病药物的过程中,制药公司长期采用费时费力的试错法来筛选合适化合物。但如果人工智能能像谷歌预测你的搜索内容,或像邮件程序预判你的回复(比如"收到,谢谢")那样,预测出新药物分子的构成呢?
这正是新型研究方法的目标——利用名为自然语言处理的AI技术(与OpenAI的ChatGPT生成类人回复的技术相同)来分析与合成蛋白质。作为生命及众多药物的基础单元,蛋白质的生物密码与搜索查询、邮件文本存在共性:均由字母序列构成。
蛋白质由数十至数千个称为氨基酸的化学亚基组成,科学家使用特殊符号记录其序列。每个氨基酸对应一个字母,使得蛋白质呈现为类似长句的组合形式。
自然语言算法能快速解析语言并预测对话走向,同样可应用于这类生物数据以构建蛋白质语言模型。这些模型通过编码所谓的"蛋白质语法"——即决定何种氨基酸组合产生特定治疗特性的规则,来预测可能成为新药分子基础的字母序列。如此一来,药物发现初期所需时间可从数年缩短至数月。
“大自然为我们提供了大量蛋白质的绝妙设计范例,它们拥有多种多样的功能,”总部位于加州伯克利的初创公司ProFluent Bio创始人阿里·马达尼表示,该公司专注于基于语言的蛋白质设计,“我们正在向大自然学习设计蓝图。”
蛋白质药物被用于治疗心脏病、某些癌症和艾滋病等多种疾病。过去两年间,包括默克公司、罗氏控股旗下基因泰克以及Helixon Ltd.和Ainnocence等多家初创企业在内的公司,已开始利用自然语言处理技术研发新药。他们希望这种方法不仅能提升现有药物和候选药物的疗效,还能为发现前所未见的分子的可能性打开大门,这些分子或可治疗胰腺癌或肌萎缩侧索硬化症(ALS)等目前仍缺乏更有效疗法的疾病。
“这类技术将开始攻克生物学中那些‘不可成药’的领域,”位于华盛顿州温哥华市的药物研发公司Absci Corp.创始人兼首席执行官肖恩·麦克莱恩表示。
Absci Corp.的实验室,该公司正与默克合作探索药物设计新方法。图片来源:Absci据计算生物学家称,用于药物发现的自然语言处理技术仍面临重大障碍。他们表示,对现有蛋白质药物进行过多调整可能会引发意外副作用,而全合成分子需要进行严格测试以确保其对人体安全。
但如果自然语言算法能如采用者所愿发挥作用,它们将为人工智能变革药物研发的承诺注入新动力。以往的人工智能应用受限于技术瓶颈或数据匮乏。支持者指出,自然语言处理技术的最新进展与蛋白质测序成本的大幅下降(由此产生了海量氨基酸序列数据库)已基本解决了这两大难题。
鉴于该技术仍处早期阶段,目前企业主要利用蛋白质语言模型优化已知分子,例如提升候选药物的疗效。以天然单克隆抗体为起点,模型可对其氨基酸序列提出调整建议以增强治疗效果。
在8月发布的预印本论文中,Absci公司研究人员运用此方法强化了基于抗体的抗癌药曲妥珠单抗,使其与癌细胞表面靶点结合更紧密。更强的结合力意味着患者可用更低剂量获得疗效,从而缩短疗程并减少副作用。
在3月发表于《美国国家科学院院刊》的另一篇论文中,来自麻省理工学院、清华大学及北京初创企业Helixon的研究人员,利用蛋白质语言模型将仅对α、β和γ变种有效的新冠候选药物改造为可同时应对δ变种的版本。
横跨中美两国的初创公司Ainnocence,据其创始人兼CEO潘璐荣介绍,正协助客户运用此类模型将兔源抗体等动物蛋白质(药物研发的常见起点)改造为符合人体生理的形态。
但即便是现在,制药公司已将目光投向超越已知蛋白质修饰的领域,转向所谓的从头设计——即从零开始合成分子的过程。
基因泰克表示,最近一项实验表明,可以设计出一种抗体,使其与市场上乳腺癌药物帕妥珠单抗(基因泰克以Perjeta品牌销售)相同的细胞靶点结合,但采用全新的氨基酸序列。基因泰克执行董事理查德·博诺(去年公司收购其初创企业Prescient Design时加入)表示,公司科学家仅向蛋白质语言模型提供了靶点和抗体所需的三维结构——这是蛋白质功能的主要决定因素。
Absci和Helixon也正与制药公司合作,利用从头设计方法开发针对癌症和自身免疫性疾病的药物。据麦克莱恩先生透露,Absci今年1月宣布与默克公司合作开发三个药物靶点。默克发言人表示,公司已建立多项合作以探索人工智能在药物开发中的潜力。Helixon首席执行官兼创始人彭健表示,上月与两家大型制药公司签约,致力于攻克此前无法成药的疾病。
“药物研发中所有难题已停滞多年,正等待新一轮技术突破来解决,“爱诺华思的潘博士表示,“这确实是范式变革的方法论。”
最终,许多计算生物学家预期蛋白质语言模型将带来超越加速药物开发的效益。生物学家指出,该技术还可用于生产更高效的塑料降解酶、废水处理剂和原油泄漏清理剂等环保应用。
“蛋白质是生命的劳动力,”ProFluent Bio公司的马丹尼博士说,“它们让我们能够呼吸和看见,维持环境运转,关乎人类健康与疾病。如果我们能共同设计出更优秀或全新的‘工作者’,这将带来极其广泛的应用。”
联系凯伦·郝,邮箱:[email protected]
刊登于2022年12月8日印刷版,标题为《AI对话技术或助力药物研发》。