36氪获悉,AI蛋白质设计服务提供商「天鹜科技」近日完成数千万元Pre-A轮融资,由金沙江联合资本领投,本草资本、晓池资本和四川交研资本跟投。本轮融资主要用于加速蛋白质工程通用大模型的行业应用,助力产业升级。
天鹜科技成立于2021年9月,核心团队主要来自于上海交通大学,创始人兼首席科学家洪亮教授在人工智能蛋白质领域深耕多年。2022年初拿到首轮融资后,天鹜科技的AI蛋白质大模型完成从0到1的验证;发展至今,天鹜科技已向下游客户交付多款蛋白质设计项目。当前天鹜科技团队规模近40人,由生物、计算及市场商务等专业人才构成。
据公司介绍:天鹜科技研发的AI蛋白质设计大模型AccelProtein,采用Transformer架构和掩码语言模型。通过在7.8亿条覆盖各种环境下生物体蛋白质序列的复杂数据上进行训练,该模型掌握了蛋白质序列与其功能之间复杂的语义联系,实现了从“序列到功能”的端到端预测,而非遵循蛋白质预测从“序列到结构,再到功能”的常规路径。因此,使用“AI大模型自动设计+少量实验验证”,可对蛋白质序列进行设计和改造,所设计的多款蛋白质在稳定性、活性、亲和力等指标上表现出色。
建立AI大模型,数据集的建立、挖掘和利用十分关键。对此,天鹜科技CTO刘灏认为,核心在于如何理解产业需求,理解待解决的生物学问题需要怎样的数据和AI能力。随着科学界的发展,蛋白质领域的公开数据集愈发丰富,同时天鹜科技创始团队通过多年科研和产业合作,也积累了丰富的私域数据,具备数据基矗
“蛋白质能够应用的领域非常广泛,除了抗体药,在体外诊断、日用品、农业等多个行业也都会用到各类酶。既往蛋白质改造的壁垒很高,需要资深专家的知识与经验,并进行大量的实验试错。训练后的AI通用大模型与ChatGPT相似,能够解决多行业的专业问题;再加上少量实验,有望取代传统的蛋白质改造模式,提高蛋白质设计的效率,降低成本。”刘灏对36氪表示。
正因为产业界关注核心是蛋白质的功能,而非处于中间位置的蛋白质结构,且当前高精度的蛋白质结构数据较为稀缺,因此天鹜科技团队选择开发能够实现从“序列到功能”精准预测的蛋白质设计AI大模型。“当前,对蛋白质功能的验证,生物湿实验仍是验证金标准。通过AccelProtein大模型自动设计加实验验证,天鹜已经推出了数十个成功的蛋白质设计服务案例,得到了客户的认可。”据了解,正是因为上述交付,天鹜科技2023年已经实现盈亏平衡。
举例而言,天鹜科技曾为客户交付一款耐碱蛋白质,经过AI设计和实验验证,在6个月间,将蛋白质的耐碱性提高了4倍,进而提高了蛋白原料的使用寿命,将以往每年数千万的蛋白原料成本节省约50%。
在研发和交付的过程中,计算与生物两个环节的干湿实验配合,颇为关键。为了让不同专业背景和风格的人才高效协同,天鹜科技做了多种尝试,首先尽可能招募有交叉学科背景的人才加入,同时对不同学科人员进行定期的培训和考核,以加速团队对AI蛋白质设计这一跨学科领域的理解。
据了解,天鹜科技可服务的领域,包括创新药、体外诊断、药物中间体、营养保舰食品饮料、美容护肤、洗涤纺织、生物能源、生物农业以及环境工程等;其中创新药、体外诊断、中间体等将是接下来客户拓展的重点方向。