科技新闻讯 7月7日在世界人工智能大会上,优必选联合创始人兼CTO熊友军,在《生成式AI:变革与创新论坛》上,进行了《人形机器人的发展与未来》的主题演讲,就人形机器人的发展阶段,ChatGPT对人形机器人的赋能,人形机器人未来发展需要的核心技术进行了探讨。
以下为精华内容:
为什么要做人形机器人?
环境都是为人类打造的,人形机器人更适合人类的环境,它可以更好地在环境中移动,并且去操作我们的工具。并且环形机器人更像人,所以它们和我们的交互,也更能满足我们情感的诉求。
人形机器人的发展历程
人形机器人的发展历程可以追溯到很早的故事,最早是1969年的日本早稻田大学的人形机器人,后面人形机器人经过了三个阶段的发展,基本都是围绕着“如何让机器人更好的在我们的环境中运动”而展开。
第一个阶段是2000年之前,这时候机器人的运动都是静态的运动,速度比较慢,并且只能在比较结构化和固定的环境里去运动。
第二个阶段是2000年到2015年这段时间内,这个阶段的机器人适应能力更强了,可以在一些动态的环境里快速直立的行走,也可以完成一些我们指定的工作。
第三个阶段是2015年之后,人工智能和算力帮助机器人获得了高动态的能力,让机器人的运动能力得到了极大的提升。
人工智能技术演进和发展,是推进人形机器人智能化关键
人形机器和人的交互,对环境的感知以及决策能力是随着人工智能的发展而快速发展的。人工智能技术的研究,是推进人形机器人智能化非常关键的因素,尤其是这几年随着深度学习和AIGC的发展,人形机器人也到了一个非常关键的时刻。人形机器人和CHATGPT结合,是可以将人形机器人推向一个新的高度具身智能。
(1)人形机器人 VS ChatGPT:具身智能
ChatGPT赋能人形机器人,告别四肢发达头脑简单,让人形机器人超越了文本处理和信息空间,具备和物理世界进行交互的能力,除了有劳动价值还有情感价值。
人形机器人帮助ChatGPT感知、理解物理定律、操作环境的上下文。ChatGPT实现自然语言交互,人形机器人为载体更符合人类心智,交互更自然。
(2)人形机器人 VS ChatGPT:操控
在技术领域,我们认为ChatGPT能给人形机器人带来更好的操控能力,尤其是定好一组机器人的API函数之后,我们可以通过更高层次的交互,让机器人能够申城一些底层操作代码,让我们操作起来更加方便。
(3)人形机器人 VS ChatGPT:训练
在训练的过程中也是这样的,现在机器人的开发模式,需要产品经理,高级研发工程师去写代码完成一个一个的执行,有了ChatGPT之后,我们可以站在用户的角度去和机器交互,这样开发的速度更快,成本也更低。
(4)人形机器人 VS ChatGPT:运动规划与控制
在运动规划与控制层面,它可以生成更多的底层代码,可以辅助我们决策,这样很多底层的代码就不需要写了,这也是人形机器人和ChatGPT结合之后带来的一些好处。
人形机器人行业竞争格局
现在很多公司都在做人形机器人的研发,比如特斯拉、OPENAI还有Google,国内也有很多公司在进场,这是一个非常好的现象,因为生态逐渐繁荣起来了。
人形机器人需要的核心技术
不过,人形机器人想要发展起来,还需要大家共同推荐一些核心的技术。
(1)高性能的伺服驱动器是机器人本体各个关节的刚需
可能从小扭矩的手上关节,到大扭矩的踝关节膝关节,这些都是非常核心的技术,需要具有控制力,高爆发的输出,较高的能力密度比。
(2)人性机器人运动规划与控制步态规划
这类包括机器人的步态算法,适应环境比如楼梯斜坡草地十字路等。
(3)人形机器人运动规划与控制跑跳及不平整地面。
现在对机器人的行走速度、运动速度要求都非常高,我们希望它能更快一点,这里就还涉及到一些跑跳,并且还涉及到力控和位控,面向不同更多场景有不同的侧重。
(4)人性机器人运动规划与开工至柔顺控制
有了运动能力之后,我们还要关注人形机器人和人的交互安全性。
(5)人形机器人运动规划与控制手服协调
我们还希望人形机器人具备工作的能力,包括目标物体位要估计,机械臂的碰撞,灵巧手抓取策略,力位混合控制,这些都是非常重要的
(6)人形机器人视觉相关技术U-VISION,机器人3D视觉导航技术
机器人需要在我们的环境中进行大范围的移动,需要对我们的环境进行重构,对不同的障碍物的路径进行规划,所以要基于视觉导航做很多的算法研究。
(7)人形机器人视觉相关技术U-VISIONAI视觉生物特征识别技术。
和人交互的过程中,需要对不同的生物进行识别。
(8)多模态交互
因为和不同的对象交互的模式不一样,所以就涉及到一个多模态交互,我们要关注语音、视觉、触觉,还有一些表情的交互。
(9)机器人操作系统
现在我们很多操作行为都是基于linux或者是Anroid系统,在上面进行应用的开发,实际上在智能产业发展起来之后,各家公司一定会有自己的这个操作系统。
机器人的未来发展
工业革命进入以人形机器人为标志的智能化时代。每一个智能化的时代,都有其标志性的产品,我们认为第四次工业革命的标志性产品就是人形机器人。
目标应用场景多任务通用性机器人
(1)工业生产的劳动力:一单人形机器人大规模应用,劳动力短缺问题将会一劳永逸的及解决;
(2)救援救灾的先锋队:人形机器人可以直接使用多种设备开展救援救灾任务;
(3)社会服务的承担者:人形机器人适应以人为中心的办公室和居家环境,将在办公辅助,商业服务,家务作业,照顾老人等领域发挥重要作用;
(4)国家重大工程的坚守者:人形机器人可以在艰苦的换件中长期部署,比如空间站、探月工程等。
工业领域为什么用到人形机器人?
人形机器人理论上几乎可以完成人类进行的非标任务。
(1)运动能力:仿生步态下运动能力较传统履带/四轮/双轮机器人大幅提升;
(2)抓取能力:灵巧手可实现双手配合和工具替换;
(3)决策能力:依靠算法能力实现复杂环境识别并实施决策;
(4)通用性:一款成熟的产品即可适用于广泛的需求场景。
人形机器人被誉为全球机器人行业皇冠上的明珠,是全找式AI技术的最佳载体,赋能各行各业,未来最终将进入干家万户。