图片来源:图虫创意
2月22日,国内智能机器人公司宇树科技完成10亿元B2轮融资。2月24日彭博社消息,获得OpenAI注资的机器人公司Figure又获得6.75亿美元投资,投资者包括杰夫贝佐斯、英伟达、英特尔、三星和亚马逊。
在这两起融资消息推动之下,2月25日的A股交易日,机器人概念股集体飙涨,坤博精工、中亚股份、中威电子、迈赫股份等多股涨停。
同时,马斯克也越来越强调特斯拉是一个AI+机器人公司。2023年12月,特斯拉发布了新一代人形机器人擎天柱2代Optimus Gen 2,能够手捏鸡蛋、深蹲、跳舞。
特斯拉人形机器人Optimus。图片来源:视觉中国
AI大模型的热潮,也给人形机器人的赛道加了一把火如果把大模型比作能像人一样理解世界的大脑,那么给它匹配上人形身体,会发生什么?目前全球人形机器人的重要创业公司有哪些?马斯克所预测的20年内将会有10亿人形机器人的未来,会那么快地到来吗?
波士顿动力的Atlas:被仰望的与买不到的
从驱动系统上看,机器人分为液压驱动和电驱动。
液压驱动是通过液体压缩泵产生高压液体,高压液体对输出机构做工产生力,由于液体的不易被压缩的性质,系统对液体做工会使液体产生很高的压强,因此优点是力气超大,续航长。但液压驱动也有缺点:首先会有噪音,可以把液压动力类比成燃油汽车的发动机;其次容易漏油;第三是制造成本高昂,难以商业化。
明星机器人公司波士顿动力(Boston Dynamics)的Atlas机器人,就是液压驱动。从展示视频中看,Atlas的运动非常丝滑,可以跟随音乐的律动跳舞,关节运动灵活,路线与角度多样。今年2月6日,在一系列机器人竞赛消息之中,波士顿动力也发布了Atlas操控汽车减震器的视频。这展示了人形机器人在现实世界中最合理的应用之一:在工厂和仓库环境中工作。视频下方赞数最高的评论是“下一步: 重新装填反坦克导弹”。
Atlas在仓库搬东西。图片来源:Boston Dynamics Youtube频道
去年,波士顿动力发布了一个Atlas使用抓手抓取物体并将其交给人类同伴的视频,其中Atlas在高架平台上奔跑和跳跃,甚至炫耀式地进行了后空翻。
波士顿动力是人形机器人领域的先驱和明星公司。该公司创始人Marc Raibert表示,是自家的Atlas激发了马斯克对人形机器人的野心。Marc还开玩笑说:“很乐意举办一场Atlas与特斯拉Optimus之间的机器人聚会。”
波士顿动力最早于1992年从麻省理工学院底下独立出来,其著名产品四足机械狗(Big Dog)是在美国国防高等研究计划署(DARPA)出资下替美国军方开发, 目标是作为驮载机器人,在地形崎岖、车辆无法行驶的情况下陪伴士兵,但BigDog被认为噪声太大而无法使用,该项目被搁置。
液压驱动也造成波士顿动力的机器人成本高昂。据报道,Atlas这样的人形机器人成本至少在15万美元左右(相比之下,马斯克宣称Optimus的定价将在2万美元以内)。
波士顿动力在商业化方面步伐停滞,其产品只在美国销售。国内一位机器人行业从业者向蓝鲸财经表示,以前会有国外公司在美国买波士顿动力的四足机器人BigDog,然后转手到国内,“之前我们在国内已经看到很多了,但这一两年没什么消息,他们家的人形机器人就更是(在国内)看不见,因为售价高到离谱了。”
波士顿动力本身也几经易手。2013年,波士顿动力被谷歌收购。2017年,软银集团以不公开的条款收购波士顿动力。2020年,韩国现代汽车集团宣布以11亿美元收购波士顿动力。
波士顿动力的机器人,仿佛成了神坛上被仰望却难以走进大众生活的角色。
高调的特斯拉擎天柱Optimus
相较而言,电驱动则是价格更低、更容易商业落地的技术路线。除波士顿动力之外的其他人形机器人厂商,大多采取电驱动,包括特斯拉。
特斯拉创始人马斯克支持这种大胆的预测二十年后地球上将有大约十亿个人形机器人。
马斯克对机器人的雄心壮志源自对人口的悲观他相信世界人口在迅速减少,我们在人口崩溃的边缘,全球经济和国内生产总值将从衰退走向萧条,由AI驱动的人形机器人将代替大部分人类成为劳动力。马斯克越来越强调特斯拉是一家人工智能和机器人公司,他在2023年9 月在 X 上发帖称:“从长远来看,特斯拉的几乎所有长期价值都将来自人工智能和机器人,包括汽车和人形机器人。”
2022 年 9 月,特斯拉发布了第一代人形机器人擎天柱Optimus,它能在舞台上走动。
马斯克希望将人形机器人批量量产,他在 2022 年10 月的一次活动中表示,希望最终制造数百万个 Optimus 机器人,每台的售价估计为2万美元,相比之下,苹果的头显设备Vision Pro在实现量产后定价为3万美元左右。
Optimus拿取鸡蛋。图片来源:The Tesla Space Youtube频道
2023年12月,特斯拉发布了擎天柱2代Optimus Gen 2,能够手捏鸡蛋、深蹲、跳舞。在展示视频中,Optimus的十指可以独立运动,且精细到可以双指轻轻捏起鸡蛋,并放到蛋托的孔洞中,这得益于在所有手指上部署的精细触觉感受器。
关键的是,相比于波士顿动力的Atlas依靠编程和机器学习,需要人类工程师预先编程制定可供机器人选择的多条运动路线,特斯拉宣称人形机器人将完全由AI驱动,机器人通过视觉系统看到周围环境并学习,来生成行为决策。
特斯拉作为车企在自动驾驶技术上有多年的积累,又能促进机器人所需的人工智能训练。特斯拉FSD自动驾驶汽车V12版没有直接通过程序编程写入交通规则,而是从数千小时的交通事故视频记录中学习交通规则。应用到人形机器人上,机器人可以通过观察人类行为的视频来学习。
但前述的国内机器人从业者告诉蓝鲸财经记者,目前来说,“像拿鸡蛋的这种展示视频是怎么拍出来的?也是给机器人提前写好一个程序,程序命令机器人伸出手拿起鸡蛋、放到另一个地方,并不是机器人的自主行为。这跟现在汽车工厂里面机械臂做的工作,本质上没有区别,只不过是给这个机械臂加了两条可以移动的腿。如果在家庭场景里,机器人拿起鸡蛋、磕碎到碗里、拿起筷子搅拌均匀、放锅里炒个鸡蛋等着一系列流程下来,就不是预设定程序,可以视为机器人具备了一定自主意识,它理解了人类生活的流程并为人类服务,但这一步还很难达到。”
结合大语言模型的Digit机器人
位于美国俄勒冈州的Agility Robotics公司在2017年生产的Cassie机器人,是世界上百米赛跑中跑得最快的双足机器人,它有一对形似鸵鸟腿的足。由此衍生的Digit双足人形机器人,则是为Cassie机型添加了上半身与手臂。Agility公司于2018年开始向客户运送其Digit机器人,用于帮助公司搬运包裹、卸载拖车。Agility在2020年与福特签署了协议。
在席卷全世界的大语言模型浪潮中,如果把大模型比作能像人一样理解世界的大脑,那么给它匹配上人形身体,会发生什么?
Digit人形机器人。图片来源:Agility Robotics Youtube频道
在2023年12月,Agility Robotics发布了结合大语言模型的Digit机器人搬箱子的视频:没有给出任务的具体信息给Digit机器人,只是用自然语言向其讲出任务(拿起有着“Darth Vader”光剑颜色的盒子,移动到高度最高的塔前)。这时机器人内的大语言模型理解到“Darth Vader”光剑颜色的盒子是指周围环境中的红色盒子,并识别出来,再通过激光雷达识别出周围环境中最高的塔是哪一个,再执行任务。
“这个结合了大模型的机器人就相当于,拿汽车工厂里面的机械臂举例,给这个机械臂集成了AI大模型之后,让机械臂从一堆零部件(包含了车门、车玻璃、轮胎)中挑选出来车门,安装到流水线上另一端的一堆汽车(包含了卡车、轿车、SUV)中的轿车车身上。”前述机器人从业者表示。
在融资方面,DCVC(Data Collective,位于硅谷的风投公司)和 Playground Global风投公司于2022 年向Agility Robotics 领投了 B 轮融资,亚马逊工业创新基金也跟投,共筹集了 1.5 亿美元的资金。Agility是获得亚马逊工业创新基金资助的五家初创公司之一。
Agility Robotics 在2023年10月宣布,亚马逊将在实际运营中开始测试使用Digit机器人,Agility将建成占地 70,000 平方英尺的机器人制造工厂,预计第一年的生产能力为数百台 Digit 机器人,并有能力扩展到每年 10,000 多台机器人。
踢不倒的宇树H1机器人
据36氪2月22日报道,中国智能机器人公司“宇树科技 Unitree”完成了近10亿元B2轮融资,本轮投资方包括美团、金石投资、源码,老股东深创投、中网投、容亿、敦鸿和米达钧石跟投。
2023年8月,宇树科技发布旗下首款通用人形机器人H1。据机器人大讲堂报道,H1人形机器人采用轻量化材料设计,整体重量只有47kg,整身拥有19个自由度,行走姿态轻盈稳健,尤为突出的H1腿部关节电机部分,峰值扭矩达到了360Nm,并且配合中空轴线和双编码器,全面对标特斯拉Optimus人形机器人。从展示视频看,H1行走非常稳健,即使被人用手推拉、用脚踢,也不会摔倒。
H1机器人在被人用脚踢后仍能平稳行走。图片来源:Unitree Youtube频道
H1机器人定价在9万美金左右。据36氪报道,H1(可选配灵巧手)产品已经进入全球市场,已在2023年下半年实现了小批量量产和发货。
据了解,H1人形机器人目前的客户以To-B端为主,如高校院所、科技公司等,用于进行科研展示和技术试验,但目标是在未来让人形机器人可以走入千家万户。
此外,宇树科技的工业级四足机器人已应用到工厂巡检、园区安防、勘探救援等场景,主要客户比包括变电站、化工厂等,可以让四足机器人代替人类去一些危险场景,比如有毒气或有辐射的环境,去执行任务。
宇树科技创始人王兴兴在采访中称,其四足机器人产品占全球出货量的60%以上。其四足机器人在全球的客户包括亚马逊、谷歌、英伟达、Meta等。
不止宇树科技,人形机器人领域的投资还在继续兴起。据彭博社2月24日消息,曾经由OpenAI 和微软注资的人形机器人初创公司 Figure AI在新一轮融资中筹集了约 6.75 亿美元,投资者包括贝索斯、微软、英伟达、亚马逊、三星等,融资前估值约为 20 亿美元。OpenAI 此前曾考虑收购Figure,已向Figure投资 500 万美元。
我们为什么需要人形的机器人?一种说法是,我们人类生活的物理世界(桌椅高度、电脑操作方式、汽车驾驶方式等)都是按照人类的尺寸和运动方式来设计的。在AI大模型的突破发展中,如果把大模型比作大脑,那么如果它能有人类形态的身体,那么具身智能或将在不远的时代到来。