历时4年,超6000次测试,厦门企业打破国际算法垄断_风闻
经济道理-04-28 18:50
厦门日报记者 李晓平
著名影星安吉丽娜·朱莉通过检测,发现携有BRCA1(乳腺癌1号基因)突变基因,为降低患癌风险,做了双乳切除手术。该领域相关检测背后的核心是算法,此前,该算法一直被美国企业所垄断,但目前,这一算法被来自厦门一家“精而美”的企业,国内肿瘤精准诊断龙头——艾德生物彻底打破 ,且新算法更精准,覆盖面更广。
日前,艾德生物的研发团队,将该算法——GSS(Genomic Scar Score)基因组瘢痕算法(以下简称GSS算法)形成论文,在SCI(即《科学引文索引》)发表,在国际上引起广泛关注。其实,早在2021年欧洲妇女肿瘤学会上,该算法的“1.0版本”一经崭露,就“惊艳”了与会的大部分专家学者,其彻底打破了美国Myriad genetics公司专利算法的全球垄断。
经过这两年的持续优化和精进,GSS算法被公认为目前该细分领域,最精准、涉及面最广的算法,实现我国HRD(同源重组修复缺陷)检测算法从0到1的突破,为艾德生物通过该算法研制出的PARP(一种DNA修复酶)抑制剂伴随诊断产品的全面“出海”,扫清了障碍。
目前,艾德生物已经和阿斯利康签署了全球合作协议,首批项目便是以PARP抑制剂伴随诊断产品为主,合作范围遍及中国、日本、欧盟等全球市场。国内产品正进入国家医疗器械创新审批过程中。
这一突破性算法的背后,是艾德生物历时4年,经过超6000次的测试,以及对海量数据的看不见的深度学习。
01
受海外专利制约,产品“出海”受阻
这一算法,得从基因和肿瘤的关系说起。
其实,每个人体内都有BRCA基因,其相当于基因组内的“修道工”,修补DNA在新陈代谢中产生的错误。如果该基因缺失或者突变,可能导致其无法及时修复错误,导致错误积累得越来越多,就产生了肿瘤。
早在2014年,美国Myriad公司发现,可以通过三个基因组的不稳定,联合评估出BRCA的非正常“工作状态”,并为此是申请全球专利算法,成为HRD评估的金标准算法。安吉丽娜·朱莉就是通过BRCA检测,预测到患癌风险。
为什么要突破这一算法呢?为产品“出海”! 中国企业要在海外市场站稳脚跟,且越走越远,核心技术专利是关键!
目前,国内精准医疗企业的HRD检测方法,除了艾德生物,基本都基于这一算法,但产品如果要走向国际市场,就会受制于该专利的制约。艾德生物是基于自主专利的算法及建库技术,开发自己的HRD产品,从检测性能到临床价值,都得到国内外同行专家的验证。
02
底层逻辑入手,引入机器学习,进行自主创新
那么,这一算法的突破点在哪?
原来,早期科学界发现,带有BRCA基因突变的患者,对PARP抑制剂有响应,但在实际用药过程中发现,除了BRCA突变,其他患者对PARP抑制剂也有响应。可是,这其间的关联,并没有完全研究出来。
“人体内像BRCA这样的‘修道工’还有很多,每一个‘修道工’的‘罢工’,都会引发肿瘤风险。”艾德生物董事长郑立谋说,由于我们没办法检测每个“修复通道”,因此我们换了一个角度,从结果导入。我们发现,这些对PARP抑制剂有响应的患者,有个共同特点,就是他们肿瘤细胞的基因组呈现出不稳定的特征。BRCA基因突变,只是导致基因组不稳定的众多原因之一。
郑立谋说,人体内有SNP(SNP:单核苷酸多态性,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。通过检测全基因组上特定位点SNP可以替代全基因组测序,评估基因组不稳定状态)位点有超过3000万个,我们通过检测特定的位点,来评估基因组不稳定状态。因此,这个评估关键就是选择合适位点进行检测,并寻找基因组的不稳定特征。
于是, 艾德生物从生物学的底层逻辑入手,引入机器学习、神经深度学习网络、人工智能算法等,深入海量的基因组测序数据。位于上海研发中心的艾德生物高级生信总监杨爽在连线中为记者解读道,他们从大约3000万个人类SNP中,筛选出9万个代表性SNP位点(同时兼顾东西方人群),设计出第一代HRD检测试剂盒,并通过检测400例临床标本,对他们基因组不稳定性进行了初步测算;然后通过计算机模拟,从上述9万个SNP位点中,二次筛选了2.4万个,开发了第二代更优化的检测试剂盒,及基因组不稳定评估算法,并做了超过4000例样本,对该方法进行全方位验证。
“我们完全没有用美国企业的专利算法,通过另外的维度、更巨量的数据,不间断模拟和测试。”杨爽说,将得出的各种不稳定权重参数,进行反复验证,形成最终的算法体系——GSS算法。
03
算法覆盖面更广,性能更优异,得到国际专家及同行认可
“因为基于更广泛的底层架构,更海量的数据,艾德这一算法的不仅覆盖人群更广,针对的癌种更多,包括卵巢癌、前列腺、胰腺癌、乳腺癌。”郑立谋告诉记者,目前,阿斯利康、默克等多家药企合作伙伴及全球多个国家的中心实验室,对艾德生物的GSS算法进行了独立性能评估,获得了国际专家及同行的高度认可,并在2021年欧洲妇科肿瘤学会(ESGO)上向全球展示。
德国慕尼黑工业大学、日内瓦大学、法兰克福大学附属医院、海德堡大学附属医院等测评显示,基于艾德生物GSS算法的HRD检测结果,不仅与美国企业专利算法的相关系数高达0.86,并且与全基因组测序具有相同水准。优异的性能数据,奠定了艾德生物在HRD检测领域的国际地位。
高端对话
杨爽:要正确认识创新的价值
记者:这个项目的团队有多少人,涉及哪些领域?
杨爽:团队共20多人,涉及到生物信息、医学、生物技术、统计等跨学科专业。
记者:和美国企业的专利算法相比,艾德生物的GSS算法优势在哪?
杨爽:具有两大优势,其一,在考虑多个人种间差异的同时,补充了中国人群杂合度较高的SNP位点,贴合我国临床实际使用需求;其二,识别出美国Myriad公司算法中特征重复、简单累加的不足,通过算法创新,将基因组分成更加精细的特征去评估基因组不稳定性,提高计算结果的准确性。
记者:这个算法的突破,你对创新有没有更深刻的认识和收获?
杨爽:作为一位长期扎根在生物信息领域的科研人员,这个项目给我最大的感触就是,应该正确认识创新的价值。其实这个算法并不是难到只有艾德能做出来,但是国内扎根这一算法,并最终取得突破的只有艾德。这其中的原因可能很多,但不乏有些企业可能更倾向于“短平快”项目,坐不住“冷板凳”。还有一个重要因素,就是海量的投入。为了突破这一算法,艾德不仅付出了看不见的时间成本,还有近亿元的资金投入。这些成本,都是单纯的产品价值体现不出来的,都体现在创新上。只有正确创新的价值,才能形成激励,进入良性循环。