灵初智能发布首个基于强化学习的端到端具身模型 Psi R0-机器学习-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

灵初智能发布首个基于强化学习的端到端具身模型 Psi R0

来源：互联网发布日期：2024-12-30 15:26:48 浏览：381次

导读：IT之家 12 月 30 日消息，灵初智能发布首个基于强化学习（RL）的端到端具身模型 PsiR0。IT之家获悉，该模型支持双灵巧手协同进行复杂操作，将多个技能串联混训，生成具有推理能力的智能体，从而完成并闭环长程灵巧操作任务。并且，Psi R0 还可以实现跨物品、跨场景级别的泛化。以电商场景为例，商品打包是典型的长程任务作业，需对上万件商品进行抓取，扫码，放置，塑料袋打结 ......

IT之家 12 月 30 日消息，灵初智能发布首个基于强化学习（RL）的端到端具身模型 PsiR0。

IT之家获悉，该模型支持双灵巧手协同进行复杂操作，将多个技能串联混训，生成具有推理能力的智能体，从而完成并闭环长程灵巧操作任务。并且，Psi R0 还可以实现跨物品、跨场景级别的泛化。

灵初智能发布首个基于强化学习的端到端具身模型 Psi R0

以电商场景为例，商品打包是典型的长程任务作业，需对上万件商品进行抓取，扫码，放置，塑料袋打结等多个操作。Psi R0 能够使用双灵巧手流畅地完成这一系列动作（官方称此系列动作在客户现场可以取代一个完整工位），成为首个基于强化学习训练完成长程灵巧操作任务的具身机器人。

灵初智能发布首个基于强化学习的端到端具身模型 Psi R0

官方表示，基于 RL 的 PsiR0模型，使用海量仿真数据训练出双手操作的智能体，并通过双向训练框架串联多技能，在业界率先完成开放环境中的长程任务，具备较强的泛化能力与较高的鲁棒性（robustness）。

这一技能训练框架从物体时空轨迹抽象出关键信息以构建通用目标函数，从而解决奖励函数难设计的问题。在后训练阶段，通过少量高质量真机数据对齐，进一步提升长程任务的成功率。

灵初智能发布首个基于强化学习的端到端具身模型 Psi R0

除此之外，双向训练框架中的转移可行性函数发挥着重要作用，它能够微调技能以提高串联的成功率与泛化性，同时赋予模型自主切换技能的能力，使其在遭遇操作失败时能够迅速调整策略，确保高成功率。

灵初智能发布首个基于强化学习的端到端具身模型 Psi R0

相关热词： 灵初智能强化学习智能基本传染数端到端

灵初智能发布首个基于强化学习的端到端具身模型 Psi R0
来源：互联网发布日期：2024-12-30 15:26:48 浏览：381次

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

推荐内容

在线客服

热门栏目HotCates

关于我们

版权声明

灵初智能发布首个基于强化学习的端到端具身模型 Psi R0 来源：互联网 发布日期：2024-12-30 15:26:48 浏览：381次

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

推荐内容

在线客服

热门栏目HotCates

关于我们

版权声明

灵初智能发布首个基于强化学习的端到端具身模型 Psi R0
来源：互联网发布日期：2024-12-30 15:26:48 浏览：381次