展会信息港展会大全

清华赵明国:智能人形机器人≠智能+人形 | 智者访谈
来源:互联网   发布日期:2024-11-04 19:53:59   浏览:110次  

导读:划重点01人形机器人领域的发展面临诸多挑战,包括运动控制、人工智能融合、数据获取等。02专家赵明国认为,未来机器人应结合人工智能发展,将其作为一种新的模式,提高自身技术水平。03另一方面,赵明国强调仿生学在人形机器人领域的应用,建议工程师把握最基本的机理,实现更接近生物系统的控制。04除此之外,赵明国指出,人形机器人应用场景包括工厂、养老、家庭服务等,但当 ......

划重点

01人形机器人领域的发展面临诸多挑战,包括运动控制、人工智能融合、数据获取等。

02专家赵明国认为,未来机器人应结合人工智能发展,将其作为一种新的模式,提高自身技术水平。

03另一方面,赵明国强调仿生学在人形机器人领域的应用,建议工程师把握最基本的机理,实现更接近生物系统的控制。

04除此之外,赵明国指出,人形机器人应用场景包括工厂、养老、家庭服务等,但当前尚无明确的应用场景。

05最后,赵明国建议大型企业和国家队攻克技术难题,组建合适的团队,逐步实现工业应用场景。

以上内容由大模型生成,仅供参考

人工智能的卓越发展

源于对技术与产业本质的洞察

机器之心视频栏目「智者访谈」

邀请领域专家,洞悉核心趋势

深化行业认知,激发创新思考

与智者同行,共创 AI 未来

清华赵明国:智能人形机器人≠智能+人形 | 智者访谈

2024 年,人形机器人领域迎来爆发式增长。特斯拉 Optimus 的持续迭代、OpenAI 对 1X 的战略投资,众多初创公司异军突起,以及包括 Mobile ALOHA 在内学术界的不断创新,共同描绘出一幅激动人心的未来图景。

技术进步的浪潮固然令人振奋,但保持清醒和冷静,在开放探索的基础上,审慎选择最符合时代需求和技术发展规律的路径,才是引领人形机器人走向成熟的关键。

本期机器之心《智者访谈》邀请到清华大学自动化系研究员、机器人控制实验室主任赵明国教授,从运动控制的视角看人形机器人发展。赵明国教授在机器人控制领域有二十多年的研究与实践,他认为当前人形机器人领域呈现出如春秋战国般多元化的发展态势,这既是蓬勃发展的象征,也潜藏着方向迷失的风险。

赵明国教授强调,「智能人形机器人」不能只是「智能」和「人形机器人」的简单叠加,而应当是一个全新的研究主题和技术范畴,需要机器人学和人工智能两个领域更深层次的融合,制造能够在复杂环境中自主适应和学习的智能体。

对大模型技术在机器人控制领域的应用,赵教授认为单纯依赖「大脑」解决运动控制问题并不合理。人类的运动控制是一个复杂的多层次系统,涉及本体反射、中枢控制和大脑控制等多个层面。我们需要更深入地研究生物系统的运动控制机理,重新思考机器人控制系统的架构,并探索更有效的学习和优化方法。

赵教授主张技术的先进性并不等同于实用性,只有与时代需求和经济发展相匹配的技术,才能真正落地生根,开花结果。例如,维纳控制论中的很多思想因为过于超前而未能对早期的计算机和人工智能起到重大的推动作用。

那么,究竟什么样的技术路线才能最终胜出?人形机器人的未来又将如何演变?点击观看视频,让我们一同探索。

访谈链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650941398&idx=1&sn=df7c01e0ecac1cca3dcca11df7166a48&chksm=84e7e3a8b3906abeb08e93ae9eec4c1aacae8c0a5b82d508c2c85668ab6aac561440a634e47f&token=1043832113&lang=zh_CN#rd

访谈文字整理

机器之心:赵明国教授好,非常高兴您做客机器之心的《智者访谈》。近年来,随着具身智能和大语言模型的迅速发展,公众对于如何实现智能机器人的讨论热度空前。今天我们很高兴能与您从运动控制的视角探讨人形机器人的发展前景。

谈及人形机器人,人们往往会联想到几家著名企业,比如专注于机器人运动控制和硬件设计的波士顿动力,以及凭借在人工智能和大数据方面的优势进军人形机器人领域的特斯拉。

赵明国:事实上,在波士顿动力之前,日本本田公司就已经在人形机器人领域做出了开创性的贡献。波士顿动力主要专注于提升机器人的运动控制能力,而特斯拉则依托其在自动驾驶技术和先进器件方面的优势,更多从制造业和供应链的角度切入,为人形机器人的发展带来了全新的思路。这种方法让许多人认为,如果未来机器人要实现大规模应用,特斯拉的路线可能更符合当前技术发展的趋势,因此也有不少企业选择追随特斯拉的发展路径。

然而,这并不意味着波士顿动力或本田的技术路线就失去了重要性。我认为这些不同路线都有其价值,因为技术的进步是一个渐进的过程,需要一代又一代的积累和发展。除了企业的努力,学术界也在不断提出新的理论和方法。目前,许多公司,包括一些创业团队,正在尝试将学术界的研究成果与本田、波士顿动力和特斯拉等公司的技术应用相结合,探索新的发展方向。

当前人形机器人领域的发展状况,可以比作春秋战国时期,虽然存在几个主流的技术路线,但更多呈现出百花齐放的局面。

01、白马非马:智能人形机器人不只是

智能与人形机器人的简单叠加

机器之心:众所周知,运动控制是建立在明确的运动学和力学原理基础之上,在数学和工程方面具有严谨性。相比之下,人工智能具备自适应和自学习能力,尤其在处理复杂问题时,AI 常能发现人类难以想到的解决方案。然而,这种特性也带来了可解释性的挑战。

波士顿动力的机器人在运动控制方面表现卓越,同时也展现了高度的智能。例如,配备机械臂的 Spot 机器人在物体识别和抓取方面表现出色。另一方面,以 AI 技术见长的特斯拉在硬件领域也投入了大量资源。您一直强调将运动控制与人工智能相结合的重要性,在发展人形机器人方面,我们可以从这些公司的实践中获得哪些启示?

赵明国:人形机器人与人工智能的结合可以采取多种方式。其中一种是两个领域各自发展,然后将各自的优势整合。但除此之外,还存在其他途径。以波士顿动力为例,他们曾强调专注于运动控制而不涉足人工智能,但实际上他们也运用了一些智能的方法。不过,他们的核心在于解决运动控制问题,如行走、奔跑和跳跃等,只不过在解决这些问题时,他们采用的方法可以是传统的运动控制技术,也可以是智能的方法。

同样,专注于人工智能的公司在解决智能问题时,也会使用机器人作为载体。例如,进行对话交互时,可以选择人形机器人,也可以选择智能音箱,这对智能本身的影响并不显著,核心问题在于能否实现顺畅的人机交互。

然而,要将人工智能与人形机器人真正深度融合,就像「白马非马」这个哲学命题一样,需要创造出一个全新的事物。智能人形机器人必然不同于传统意义上的智能系统,也不同于常规的人形机器人,而是一个更深层次融合后的独立存在。

我认为「具身智能」这个概念较为贴合这种场景。在这种情况下,我们期望机器人能展现出行为层面的智能,不仅能够在各种复杂地形上行走,还能在面对干扰时完成任务,表现出智能化的行为。例如,机器人应该能够避开障碍物,在动态环境中规划路径,比如开门这个典型案例,包括应对不同形状、不同类型的门,同时能制定策略绕过中间的障碍物,或者在有其他人同时开门时做出规避或让步等行为。在手部操作方面,这样的例子更为丰富,因为人类大部分操作都是通过手来完成的。

这是一个全新的研究主题如何让机器人展现智能。这需要机器人学和人工智能两个领域进行更深层次的融合,而不仅仅是一个领域借用另一个领域的技术来提升自身。我们需要将两者有机结合,创造出一个全新的技术范畴。

机器之心:您的观点非常具有启发性,但似乎目前很少有人从这个角度来探讨这个问题。

赵明国:这实际上取决于不同的视角,我只是试图将问题阐述得更加清晰。无论采用何种方法,要开发出这种新型机器人,我们需要考虑几个关键。

首先是腿部的智能;其次是手部的智能,包括手指和手臂的智能,手臂负责运动,手指负责实际的抓取和操作。在进行手部操作时,腿部通常也在运动,这需要手足协调。除此之外,还有一些全身性的智能,如骑自行车、攀岩,以及前面提到的开门,这些活动强调全身的协调。从运动能力的角度来看,有些智能机器人可能更侧重于腿部功能,有些更注重手部功能,还有一些可能侧重全身运动,也可能是这三个领域的不同组合。

在早期阶段,我认为可以为这三个领域分别选取一些典型案例作为代表,用它们来推动技术发展,并作为标准测试平台。如果一个机器人能够完成特定任务,就意味着相关技术已经取得突破,能够实现某些功能了。我们可以从一个领域开始,逐步扩展到两个,最终实现三个领域的突破,然后再考虑实际应用。

当然,也有团队选择直接从应用需求出发,通过反向推导来进行开发。目前业界还没有形成共识,各种方法都有人在尝试。但从最基本的逻辑看,无非就是这三个领域的不同组合。

02、双足运动控制难点:

学习与优化的结合

机器之心:您在仿人机器人双足步态控制领域拥有 20 余年的研究实践和经验,见证了技术的几代变迁。双足控制一直是机器人研究中的一个难点,您认为目前该领域面临的主要技术瓶颈是什么?

赵明国:这个领域确实经历了一个漫长的发展过程。传统上,研究者倾向于从仿生角度来解决这个问题,但由于仿生机理尚未完全掌握,最初出现的是一些简化模型。这些模型虽与人体某些运动相关,但并不完全相同,它们借鉴了人体生理学的某些特征,如倒立摆模型。这些简化模型虽然维度较低,但在当时的计算机水平下能够实时完成计算,因此在那个时期是较为有效的选择。

我们现在使用的许多方法,如模型预测控制(Model-Predictive Control,MPC)和全身控制(Whole-Body Control,WBC),都源自上世纪。我认为真正的突破在于 MPC,它引入了对未来进行预测这一非常重要的概念。这一点在人工智能领域也很重要,即基于某些知识对未来进行预测,两个领域在这一点上是共通的。

近期,由于强化学习的突破,我们能够在仿真环境中进行强化学习,然后将获得的策略迁移到实体机器人上。这一路径已被证明是可行的,我认为这是一个相当重要的贡献。现在通过强化学习方法,大多数初创团队能在几个月内让机器人完成多种复杂任务,比如运动恢复和粗糙地面行走,这些任务在过去需要大量时间和资源才能攻克。

目前的仿真技术能够支持大部分运动学和动力学的仿真。然而,对于视觉和其他多种传感器的仿真,还无法达到与人类感知相媲美的真实程度。对环境的仿真,尤其是弹性物体的仿真,仍有待改进。如果这些方面能够得到显著提升,这些工具将大大加速整个研发过程。

就人形机器人而言,如果仅关注运动能力,数据获取可能不是特别困难,或者说运动类数据具有其特殊性。我个人认为,小规模数据集可能已经足够。但现在面临的挑战是,究竟需要什么样的小规模数据集?这个问题每个研究者的看法都不尽相同,我认为这在很大程度上取决于具体的任务需求。

2024 年初引发广泛关注的 Mobile ALOHA 项目,没有使用仿真,而是通过遥操作来获取真实场景数据,直接解决了对齐和许多中间环节的技术问题。在这个方向上,研究者会开发出多种方法来快速有效地获取数据,这是一个非常明确的发展趋势。

另一种可能的方向是利用积累的大量视频资源。如果能直接从视频中获得机器人运动控制所需的数据,将会是非常有价值的。举例来说,中学生学习打篮球时,很多人会模仿乔丹或科比,他们通过观看视频来学习,尽管乔丹和科比并未亲自指导他们,他们也没有这些球星的任何详细数据。然而,由于机器的能力水平还无法像人类那样从视频中学习,我们不得不通过仿真或遥操作来获取数据。不过,对于完成人形机器人的某些复杂运动来说,遥操作方法可能与完成简单任务(如刷盘子)还有所不同,需要综合考虑视觉等多个方面。

机器之心:您提到机器的能力还无法像人类那样从视频中学习,具体是指哪些能力呢?

赵明国:我主要指的是处理数据的能力。目前,机器的视觉分析能力还不足以从单目相机拍摄的普通视频中直接分析出人的准确三维坐标,或者将其转换为所需的数据格式。

在人形机器人领域,目前的重点依然是从仿真中获取数据。在仿真的潜力没有被完全挖掘或达到瓶颈之前,研究者肯定会集中精力在仿真方面深入探索。但是,当任务发生变化时,仿真的局限性就会显现出来,而目前又无法直接从视频中获取所需的数据。在这种情况下,像 Mobile ALOHA 使用的方法就非常巧妙,因为它解决了数据获取的难题。然而,如果要让机器人完成诸如踢足球、打篮球或攀岩等复杂运动,遥操作的方法可能就不太适用了。随着研究的不断深入,我相信还会出现许多新的技术手段,最终很可能会发展到能够直接利用视频数据。

体育院校积累了大量运动数据,如何有效利用这些数据也是一个值得探讨的问题。我认为这在很大程度上受到数据采集和分析手段以及算法的影响。但最终的核心问题仍然是如何获得高质量的数据,以及如何有效利用这些数据。这两个问题都在不断发展,但核心逻辑仍然是进行学习和训练,获取数据,然后利用数据进行训练,这两个基本步骤没有改变,但在具体实施细节上会发生许多技术上的变革。目前,技术发展速度非常快,甚至在一周之内就可能产生一些新的突破性结果。

赞助本站

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港