展会信息港展会大全

具身智能机器人加速“进厂” 数据瓶颈亟待突破
来源:互联网   发布日期:2025-04-01 07:57:34   浏览:156次  

导读:“具身智能”被写入今年的政府工作报告,具身智能机器人“进厂”、“营业”也被寄予厚望。在刚刚闭幕的2025中关村论坛年会上,忙碌的具身智能机器人也是备受瞩目的焦点。过去几天,一些具身智能机器人“忙得很”。刚刚闭幕的2025中关村论坛年会上,随处可见机器人的身影,近百台机器人在这里上演了“十八般武艺”,主持、泡茶、下棋、打太极……最为忙碌的要数以人形机器人为代 ......

“具身智能”被写入今年的政府工作报告,具身智能机器人“进厂”、“营业”也被寄予厚望。在刚刚闭幕的2025中关村论坛年会上,忙碌的具身智能机器人也是备受瞩目的焦点。

过去几天,一些具身智能机器人“忙得很”。

刚刚闭幕的2025中关村论坛年会上,随处可见机器人的身影,近百台机器人在这里上演了“十八般武艺”,主持、泡茶、下棋、打太极……

最为忙碌的要数以人形机器人为代表的具身智能机器人,其中,北京清飞科技有限公司研发的仿生交互型机器人“妮娅”以逼真的形象稳居“C位”,它面前总有人排队问询论坛的信息。它在通过语音为观众答疑解惑的同时,脸上还不忘“挤”出微笑,并且模仿人类,向观众摆手、比耶、点赞等。

这几天,作为具身智能领域的代表,北京大学助理教授、银河通用创始人、智源具身智能研究中心主任王鹤接连参加了几场论坛,谈论的话题都离不开人形机器人和具身智能。3月27日,他在2025中关村论坛年会开幕式上表示,接下来,人形机器人将迈入生产力时代。

多家人形机器人宣布了产业化交付目标,这也意味着人形机器人将加速“进厂”,开始“营业”。这也将让人形机器人拥有更多珍贵的真机数据,为具身智能迈向新征程奠定基础。

  进入“AI教AI”时代

人工智能(AI)、人形机器人、具身智能是2025中关村论坛年会热门关键词,在本届论坛的“人工智能主题日”核心论坛未来人工智能先锋论坛上,更是如此。

“AI-First应用(以AI为核心优先考虑的应用)将会迎来爆发。”零一万物CEO、创新工场董事长李开复带来了关于AI的最新观察。在他看来,今年AI领域一个焦点问题应该是:“Make AI Work,让大模型真正赋能千行百业。”

李开复也指出,当前,大模型性能的提升正在加速,而不是在放缓。值得关注的是,AI借由“慢思考”具备了反思的能力,能够自我迭代、自我进步,也就是“AI教AI”,AI进入到自我演进范式。

“算法通用性越来越好,模型通用性越来越好,让我们逐渐看到了通用人工智能(AGI)的曙光。”百度首席技术官王海峰表示,从技术角度而言,AGI的技术通用性和能力全面性很重要。一个大模型可以适用于很多不同的领域,在不同的语言、不同的模态以及不同的应用场景,可以处理不同的任务。他也在期待,AI赋能千行百业,造福千家万户。

当前,AI Agent(智能体)热度居高不下,不少企业都加入了发展“AI Agent 大军”。

在面壁智能联合创始人兼CEO李大海看来,大模型即Agent,这是未来智能体发展的方向,“把大模型送去‘上班’就是Agent”。

他介绍,目前,面壁的大模型“小钢炮”MiniCPM系列端侧模型已在汽车、手机、具身智能、智能可穿戴设备等多个主流方向推进“就业”,将大模型的功能和终端结合在一起,与更多场景相结合。

李大海也在期待,“以大模型为代表的智能革命到来的关键性时刻必然是:大模型越来越强、越来越小,奔腾于每个终端。人人都能享受到智能的便捷,真正实现智能普惠”。

  数据瓶颈亟待突破

数据是驱动具身智能行业发展的一个关键要素。智源研究院院长王仲远表示,世界是多模态的,目前,具身智能机器人大部分使用的是视觉、文本等模态,具身智能机器人行业对VLA模型(Vision-Language-Action Model,即视觉-语言-动作模型)并不陌生。实际上,对于具身智能来说,不少模态的信息还没有被有效利用,例如触觉模态等,对温度、时间、空间等的感知,也需要未来具身智能行业逐步去突破。

“数据其实是现在具身智能发展的一大瓶颈。”王鹤指出,当前,数据不足限制了人形机器人的灵活性和智能化水平。他解释,人们感觉日常生活中的人形机器人好像并没有那么聪慧、灵动,这背后一个制约因素就是数据不够。

具身机器人需要多模态数据,其中包括现有的图文数据、视频数据、真机数据以及合成数据。其中,如何在真机数据和仿真合成数据之间取舍,也是从业者面临的一个重要课题。

上海交通大学教授、穹彻智能创始人卢策吾表示,每种数据都有它的价值,提供相应的信息量,但每种数据也会有相应的“噪声”。例如,互联网的图、文、视频数据量大面广,缺乏人形机器人的操作支持数据;仿真数据对于具身智能发展也很重要,但面临复杂的情景,尤其是高精度的任务,可能出现仿真到现实的鸿沟;真机数据面临最关键的问题是成本高昂。

当前,国内外一些大型企业采用了遥控操作的方式采集真机数据,但这种方法成本高昂且难以获得大规模数据。要获取足够支撑人形机器人“干活”的真机数据,需要全球一起努力,而且时间太长了。王鹤说:“大家等不及。”

为破解这一难题,银河通用尝试通过大规模生产和使用合成数据来训练人形机器人,不仅成本低廉,还明显提升了数据获取效率。

王鹤提出,从现阶段来看,结合合成数据与真实数据是一种可行的方法,要用大量的合成数据让机器人做预训练,用真机数据做后训练,用真机数据完成人形机器人训练的“最后一公里”。他认为,在人形机器人的存量还未达到百万台级别的时候,合成数据是最宝贵的数据资产。银河通用正在利用合成数据提升机器人泛化能力,让具身大模型的数据成本真正可用、可控,客户用得起。

对于业界对真机数据和仿真合成数据的争论,卢策吾认为,更为关键的是不同数据的比例。他也相信,随着实践的发展,各类数据能够收敛到一个比较合适的比例。

  能力泛化与“进厂”

“今天我们需要的其实是一个什么活都能干,在日常生活中成为我们真正的帮手,让人们不再受困于劳累体力劳动的机器人。本质是实现通用,而不是像过去在一些工业场景里只能干一件事的专用机器人。”3月28日下午,王鹤在“AI青年创领新质生产力发展大会”上表示,人形机器人除了外形上与人相像,更需要考虑的是怎么发展人形机器人“干活”的能力。

具身机器人的泛化能力是具身智能未来发展关键,也是真正让人形机器人更好地为人服务的关键。王鹤说:“在人形机器人的生产力时代,一项核心技术就是基于视觉输入的端到端具身大模型,能实现任务的通用和能力泛化。”

“具身机器人的泛化问题,恰恰是现在具身机器人和具身智能所面临最大的一个挑战。”王仲远表示,当前,网络上不乏酷炫的机器人视频,但在实际场景中是否表现如此好有待考证。

王仲远举例道,在没人教的情况下,一个不到两岁的孩子通过手机看短视频就学会了拆糖果,用牙签穿着蓝莓吃。从这个意义上来讲,人类大脑的学习能力,远超现在的具身智能、具身模型,而这正是科研机构和企业努力的方向。他也特别期待,有一天机器人可以通过自主学习,学会这些技能。

具身智能泛化的路径不会一蹴而就。王鹤谈到,物理世界的智能有一个循序渐进的过程,可以分步提升具身智能的泛化能力。

在他看来,可以先沿着有生产力价值的维度去探索具身智能的泛化,无论是在商超还是工厂,抓取、放置与行走是具身机器人最需要的功能,这些机器人通过“拿、放、走”的组合,满足这些场景所需的基本“就业”技能。如果能够通过合成大数据和少量的真机数据,让这些技能实现泛化,人形机器人就有了生产力的价值和量产的空间,大量“进厂”;在各个应用场景落地后,产生大量真机数据,人形机器人就有了跨维度的可能,从而开拓更多技能,到更多场景做更多更复杂的任务,甚至是进入百姓家里。

“我们的核心观点是找到场景先用起来。”乐聚机器人创始人兼董事长冷晓琨介绍,今年元旦,公司刚刚完成了100台机器人的产业化交付,这些机器人的应用场景包括科研机构、展厅、工厂等。他指出,在与各个应用场景“磨合”的过程中,去解决这些机器人暴露出来的问题,也是不断提升机器人智能性的一个过程。只有在真实的工业和家庭环境中不断测试和优化,才能让机器人在面临干扰和不确定性时,保持其性能和功能稳定。

机器人“进厂”,产业界普遍关注其无故障工作时间。冷晓琨表示,无故障工作时间是衡量机器人可靠性的关键指标之一。冷晓琨的目标是连续工作1500小时,即每天十几个小时,无故障运行100天左右。

此外,冷晓琨还谈到,建立丰富的场景测试库对于确保机器人在复杂环境中的表现至关重要,通过大量的仿真测试,以及真机测试,逐步完善人形机器人的性能。

他认为,人形机器人要胜任更精细化的任务,还得先进“训练场”。与人进职业技能学校一样,人形机器人先进“人形机器人职业技能学校”进行训练,至少在“训练场”达到标准,才能放心地让人形机器人去更多的场景完成更复杂的任务,以及真正走进千家万户。

来源:中国青年报客户端

赞助本站

相关内容
AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港