你能想象,有着“十年、十亿美元”定律的制药行业,有朝一日,会将这两个数字缩短到“18个月”和“260万美元”吗?
这件事情,在AI技术的帮助下,真的实现了。
近日,AI制药公司英矽智能宣布,利用人工智能技术发现新机制特发性肺纤维化药物,这在全球范围内是一个标志性的里程碑事件。
英矽智能首席科学官任锋博士表示,我们通过人工智能发现了治疗具有广泛适应症的创新靶点;同时,通过人工智能产生了全新的小分子化合物,并且一直把这个化合物推到临床侯选化合物。
据雷锋网了解,目前,
该化合物已经通过了体外测试、体内测试,即将进入临床研究阶段,目标是今年年底将临床候选化合物推向临床。
3月2日,启明创投、创新工场以及英矽智能联合举办了一场线上高端对话 从 “AI+医疗” 到数字医疗:机遇与挑战。
启明创投主管合伙人梁宇女士、创新工场董事长兼CEO李开复博士、英矽智能创始人兼首席执行官 Alex Zhavoronkov博士、首席科学官任锋博士共同围绕英矽智能以及制药行业的前景进行了讨论。
制药行业的通用性难点
新药研发,是人类发展中最复杂、最具风险和耗时最漫长的技术研究领域之一。
要想发现一种药物,需要许多生物、化学和医学方面的高智商和高技能的专家。整个过程需要耗费数十年,数十亿美元,且失败率达90%以上。
2020年,FDA共批准53款新药上市,其中35种是小分子药物,这是史上新药获批数量最高的一年。
而且这些药物中的许多都是针对已知分子靶点,发现能够作用于广泛适应症新靶点的新分子是极其罕见的。
英矽智能首席科学官任锋博士表示,制药行业面临几个共同的痛点:
第一,如何找到合适的靶点或者全新的靶点来治疗某种疾病
第二,找到靶点之后如何发现或者发明全新的化合物,去针对靶点推向临床
第三,如何设计好的临床方案去减少临床上的不可预测性
药物研究的低效率问题,主要是由于生物系统的巨大复杂性和人类对自然运作方式的有限理解,这些客观因素决定了,药物研发本就是一个壁垒极高的行业。
然而,药物研发“烧钱”的另一个重要因素,是次优的研发(R&D)流程。
大型制药公司复杂而繁琐的工作流程,以及不同药物发现过程阶段之间的显著脱节。
在传统的流程中,生物学研究是由一家公司完成的,而化学研究则是由另一个部门甚至是另一家公司主导进行的,随后的临床研究又是由另一个部门或机构进行的。
英矽智能表示,这些阶段的过渡,例如靶点验证到苗头化合物发现两个阶段的过渡,很多好的想法、投入的巨额资金可能就会付诸东流。
AI为什么能在制药行业有所作为?
这是因为,现阶段的人工智能发展依赖于数据,尤其是高质量的大数据集。而药物发现过程的每一步都会产生大量数据,这些数据为现代人工智能技术的发展奠定了基矗
特别是在疾病假设和靶点识别阶段。
深度学习模型和自然语言处理技术在建模大型复杂多维数据集,如基因组学、蛋白质组学、临床数据、靶点结构数据和非结构化文本(研究论文、专利、科研经费等)方面的作用已经被多数的研究者证明是有用武之地的。
去年12月,DeepMind旗下AlphaFold2破解“蛋白质折叠预测”问题,可以算得上是“AI+新药”最大的新闻。
这个困扰生物学界50多年的重大难题正被AI破解,AlphaFold 的突破 “将改变一切”。
因此,从去年开始,多家AI制药公司相继获得规模不小的融资,其技术也被很多制药和生物技术公司广泛采用,用于虚拟筛选或数据分析等特定任务。
然而,在线上对话环节中,李开复也表示,“AlphaFold在非常难的蛋白折叠问题上做出超越人的能力。但是,坦诚地说,那是在单点上超越人。新药研发的总体过程仍然是一系列连接不佳的各个阶段,没有一个整体有效的从错误中学习的反向传播元素。”
他提及的正是此前提到的研发流程“脱节”问题。
李开复补充到,“只有将人工智能用于药物发现各个阶段,并搭建一个从假说到临床前和临床阶段的一体化的系统,才能实现真正的颠覆性转变。”
英矽智能的AI故事
回到这次英矽智能的成果。
在病种的选择上,英矽智能的切入点比较好:特发性肺纤维化(IPF)。这是一种广泛的疾病,仅限于肺部,好发于中老年人群。随着病情的发展,患者的健康逐渐恶化,可能危及生命。
目前来讲,针对特发性肺纤维化的治疗手段非常有限,目前的药物有吡非尼酮和尼达尼布。
在用药第一年,这两个化合物可以减缓用力肺活量的降低,但是对于血氧饱和度没有明显的改善,药物有明显的缺陷。
尽管如此,这两个药物在2019年的销售额也达到了30多亿美元。
从2016年开始,英矽智能在药物设计方面研究出生成式对抗网络(GAN)技术。
从实现的过程来看,英矽智能利用深度神经网络基于年龄和不同类型的纤维化进行训练,发现了一个新的生物靶点,并生成了能够作用于特发性肺纤维化 (IPF)这一非常难治疾病的一个新的小分子。
据雷锋网了解,英矽智能的人工智能系统,包括生物问题解决引擎PandaOmics和化合物生成引擎Chemistry42。
这两个系统进行相应的配合,集成了数百个人工智能模型,每个模型负责一项特定的任务。
利用PandaOmics发现了一个新的能够作用于广泛适应症的靶点,Chemistry42平台利用这个新发现的靶点作为基础,设计了一类新型的小分子抑制剂。
此外,AI平台上还包括了一个临床试验结果预测引擎 InClinico,用于预测临床研究的成功率、指导正确的临床研究方案。
为了成功获取临床前候选药物,Insilico设计并合成了不超过80个分子,其中有几个分子达到临床前候选化合物的水平,这是迄今为止取得的前所未有的命中率。
并且,整个研发过程仅耗费短短18个月,研发成本相当于类似项目的十分之一。
这样的成果,已经相当惊人。
事实上,早在两年前,英矽智能的AI技术就已经展现出了非常大的潜力。
雷锋网了解到,2018年,英矽智能发表了一项研究,公开了首个采用Entangled Conditional Autoencoder (ECAAE) 纠缠条件式自动编码器生成的JAK3抑制剂,并进行了实验验证。
彼时,英矽智能的引擎已经可以为G蛋白偶联受体和其他靶点类别实现合理的命中率。
2019年,英矽智能在短短21天内预测了一个众所周知的纤维化疾病靶点分子,并成功地在体外和体内验证了预测。
研究结果发表在了《自然-生物技术》杂志上,并获得资深新药发现专家和科研人员的反溃
AI制药的中国式创新
2019年,英矽智能完成了3700万美元的B轮融资,由启明创投领投,跟投方包括斯道资本、F-Prime Capital、礼来亚洲基金、创新工尝百度风投、兰亭投资、BOLD Capital Partners等其他投资方(包括A轮投资方)。
自成立以来,Insilico Medicine已经发表了150多篇论文,并在100多场会议上公开分享多项成果。
成立之初,英矽智能也曾遭到过质疑。
例如,早期的模型用来生成的分子不够多样化,或者不容易合成,而且靶点是大众已熟知的,或者容易通过已知的苗头化合物优化得到。
不过,在几年的时间里,随着深度学习模型的丰富,这样的问题正在逐步解决。
在对外合作上,英矽智能也拿下不少大药企的单子,包括默克、辉瑞、勃林格殷格翰、安斯泰来、强生制药子公司杨森制药等。
2020年11月,英矽智能将Chemistry42生成化学AI平台整合到默克集团的高性能计算基础设施上,以实现快速高效的药物设计
启明创投主管合伙人梁宇表示,AI在医疗领域第一个大规模的应用是AI+影像,这也得益于AI图像识别技术发展的成熟。
但是,还有很多AI没有介入的领域,很多问题更复杂,需要更长的时间、更系统化的解决方案。而药物研发领域就是未来的一条黄金赛道。
在梁宇看来,中国将成为全球医药创新的重要力量,中国将在药物的原发性创新上成为引领者和推动者。
这也是为什么,2019年,英矽智能将总部从美国马里兰州约翰霍普金斯大学移到香港。
Zhavoronkov表示,未来5年内,中国创新药企业将迎来一场大爆发,中国会成为世界的医药创新中心。
主要原因之一在于:“中国政府正在创造绝佳的环境,要求国内的制药公司进行创新。”雷锋网