“人形机器人是一个载体,当大模型和人形机器人相结合时,机器人可以帮助AI大模型感知物理世界,可以操作环境上下文;机器人利用多模态感知控制自己的身体,完成复杂的任务。”
“人工智能真正赋能到各行各业,智能机器人走进千家万户的时代正在到来。”日前,在由璞跃中国主办的Global Tech Network活动现场上,来自深圳市优必选科技股份有限公司(以下简称“优必选”)的语音技术科学家(Principal Scientist)黄东延表示。
优必选首席科学家黄东延 来源:璞跃中国
2023年是生成式AI的爆发之年,也被业内人士称为“机器人觉醒之年”。ChatGPT等生成式AI与人形机器人行业结合,开启了具身智能(Embodied Intelligence)的时代。
根据中国计算机学会专家的定义,具身智能是指一种基于物理身体进行感知和行动的人工智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。
黄东延认为,人形机器人的具身智能渗透率有望加速提升。
当机器人遇上大模型
近年来,包括优必选在内的多家国内企业发布了自主研发的人形机器人。人形机器人是所有机器人里最复杂的一类,“具身智能”对机器人来说意味着什么?当大模型和机器人相结合,会发生哪些变化?
黄东延说,在“具身智能”的状态下,机器人具备自主学习和计划能力,遇到障碍和困难可以自主反应、快速解决。目前国内已有200多个大模型,实际上人形机器人是一个载体,当大模型和人形机器人相结合时,机器人可以帮助AI大模型感知物理世界,操作环境上下文;机器人利用多模态感知控制自己的身体,完成复杂的任务。
黄东延认为,2023年至2025年期间,可以结合通用大模型,让机器人能够在工业和商业方面实现服务;到2025至2030年,机器人将更智能化,会涉及更多领域的场景应用,如知识陪伴和家庭陪护,机器人能够实现自主感知、认知和决策。
黄东延称,人工智能真正赋能到各行各业、智能机器人走进千家万户的时代正在到来,今后希望结合通用大模型,让机器人拥有手眼协调、灵巧手技术。伴随着技术的突破带来性价比提高,在未来,具身智能渗透率将有望加速提升。
作为投资人,中金资本执行总经理毛琛在活动现场的圆桌论坛环节表示,人形机器人行业是巨大的挑战也是巨大的机遇。国内本身在人形机器人软硬件一体上有独特的优势,供应链有优势、迭代速度很快,此外,国内还有巨大的场景优势,对于数据的宽容度较高,“我认为具身智能行业对于国内创业者会有非常大的机会,创业者如果有志于此,可以持续投入。”
“人形机器人的新时代正在到来”
2023年11月2日工信部印发《人形机器人创新发展指导意见》(以下简称《意见》)为人形机器人发展指明方向。《意见》中指出,到2025年,人形机器人创新体系初步建立,“大脑、小脑、肢体”等一批关键技术取得突破,确保核心部组件安全有效供给。整机产品达到国际先进水平,并实现批量生产。
有观点认为,距离人形机器人实现量产走进家庭的时间并不遥远,2024年或许是人形机器人实现量产的一年,我们与人形机器人走进家庭的距离还有多远?
对此,黄东延告诉澎湃科技,人形机器人走进千家万户的时间取决于人形机器人制造成本、人工智能、芯片技术和材料科学突破。随着人形机器人制造成本持续下降,应用场景的拓展,人形机器人的“大脑”、“小脑” 和 “本体”关键技术突破, 人形机器人走进千家万户渐行渐近。
黄东延称,以优必选Walker系列为例, 2018 年开发的第一代 Walker 可以踢球跳舞、上下楼梯,当时主要集中在运动交互功能上;第二代于2019年增加的双臂感知功能;第三代和如今刚亮相的 Walker S,让众人看到了机器人的认知和决策。
黄东延补充说,2024年1月17日,AI研究实验室Midjourney创始人大卫霍尔茨(David Holz)在社交媒体X中一篇帖子写道:“我们有理由期待,到2040年,地球上将有10亿个人形机器人。到2060年,世界上将会有1000亿人形机器人。” 在黄东延看来,这预示着人形机器人的新时代正在到来。
毛琛表示,人形机器人是一个“长跑项目”,中金资本团队也在摸索。现阶段,人形机器人走进千家万户还需要一定时间,但可能会随着技术的发展,不断解锁新的技能,机器人在硬件上或其他软件上的成本也会下降,这个时候在某些领域投资可能会得到收益。