电脑或很快能发现新药 - 《华尔街日报》
David Kita
小分子化合物构成了一个庞大的化学宇宙——据估计有10的33次方(即百万亿万亿)种分子可通过有机化学方法合成。其中数万亿分子可能带来治疗突破。但由于这个化学宇宙的规模过于庞大,暴力穷举其内容注定失败,因为合成过程既耗时又耗费资源。我们需要另辟蹊径。
现代药物研发的目标是开发出既能与人体内疾病相关蛋白强效结合,又能安全使用且副作用最小的药物。然而尽管人类基因组计划催生了大量已验证的靶点蛋白,过去15年间FDA批准的全新小分子药物数量却增长停滞。
造成这种停滞的原因中,最突出的是:对化学宇宙的探索不足。这严重限制了药企化合物库的规模和多样性,目前化学结构独特且可合成测试的化合物估计不足1000万种——仅是化学宇宙的微小片段。
药物研发正遭遇瓶颈。要在实验室测试化合物,必须先合成再物理检测。要开发未知化学宇宙的唯一途径,就是在评估化合物时采用能绕过初始物理合成的方法。
这时计算科学登场了。现代计算药物研发的核心思想是精准预测类药分子与致病靶蛋白的结合能力。通过计算技术,我们无需预先合成就能深入探索化学宇宙。但小分子药物与蛋白质的结合是极其复杂的建模问题,涉及蛋白质众多原子与被水分子包围的类药小分子间的多重相互作用。若不解决这个问题,就无法发现可能带来突破性疗法的未知化合物。
在计算药物发现领域,基于人工智能的方法面临数据不足的困境。现有的实验数据远不足以训练AI,因为这些数据仅来自少量已合成的化合物,无法代表我们当前局部化学知识库之外大量未知化合物的多样性。这导致AI倾向于预测与已探索分子相似的药物分子,从而阻碍了新发现。
与此同时,基于物理的分子建模面临着复杂度难题。对蛋白质-小分子结合的完整描述实际上无法实现,因为随着原子数量增加,复杂度呈指数级增长。近似计算可以提高基于物理的分子建模效率,但代价是精度降低——这一直是困扰制药行业多年的问题。
值得庆幸的是,近期计算能力的提升和分子建模的创新突破带来了希望。然而,要实现新突破,基于物理的分子建模和AI方法都亟需进步。越来越多共识认为,将两者优势互补的融合方案才是解决之道。
我们必须找到计算解决方案,才能开发出未来的小分子疗法。否则,我们将永远被困在已知化学物质的狭小范围内,无法探索充满可能性的浩瀚化学宇宙中其他未知领域。
北田先生是Verseon的首席科学官。
照片:盖蒂图片社/iStockphoto