展会信息港展会大全

军事机器人终于找到最实用的训练模型
来源:互联网   发布日期:2021-01-01 12:40:17   浏览:8916次  

导读:美国陆军希望将多域作战理念引入下一代作战车辆。 多域作战(MDO)是美国陆军未来重要的作战理念,它要求装备学习组件的自动化代理(如陆地机器人)能够与作战人员协同作战。techxplore.com网站当地时间12月29日报道,美国陆军研究人员在新项目中降低了现行...

美国陆军希望将多域作战理念引入下一代作战车辆。

多域作战(MDO)是美国陆军未来重要的作战理念,它要求装备学习组件的自动化“代理”(如陆地机器人)能够与作战人员协同作战。techxplore.com网站当地时间12月29日报道,美国陆军研究人员在新项目中降低了现行训练强化学习(reinforcement learning)策略的不可预测性,使它们更适用于陆地机器人。美国陆军作战能力发展司令部(DEVCOM)的研究人员Alec Koppel博士说:“这些学习组件将让机器人具备推理能力,可以适应不断变化的战场条件。新机制由以强化学习为基础的策略构成。有效获取这些策略对实现MDO的运行理念至关重要。强化学习中的策略梯度方法是连续空间可扩展算法的基矗然而,现有技术无法整合更广泛的决策目标,如风险敏感性、安全约束等。”

强化学习对传统模型产生了极大冲击,因为它可以完成很多复杂任务,例如下围棋、下国际象棋等。然而,普遍性实践对应的样本数是一个天文数字。这样复杂的样本集合,使很多常见的训练机制不适用于下一代作战车辆(NGCV)的MDO。为了促进MDO和NGCV的强化学习,训练机制必须在连续空间中提高样本可靠性。

Koppel团队设计的新方案减少了奖励积累的波动性,产生了对未知领域的有效探索,并形成了整合历史经验的机制。“该研究扩展了强化学习中的经典梯度定理。”Koppel解释,“这种创新对美国陆军有深远影响,因为它使强化学习目标超越了标准积累回报。值得注意的是,对于地面机器人而言,数据获取的成本很高。减少波动性积累、确保对未知领域的有效探索以及经验整合,都对规则优化有重要意义。”

Koppel表示,这项研究的未来非常光明。他说:“我乐观地认为,具有强化学习功能的机器人未来能够在战场上协助士兵完成勘探、侦察和风险评估任务。”

科界原创

编译:雷鑫宇

审稿:西莫

责编:陈之涵

来源:美国陆军研究实验室

原文链接:

https://techxplore.com/news/2020-12-army-effective-robots.html

版权声明:本文由科界平台原创编译,中文内容仅供参考,一切内容以英文原版为准。转载请注明来源科技工作者之家科界App。

赞助本站

人工智能实验室
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港