机器人被誉为“制造业皇冠顶端的明珠”,是衡量一个国家创新能力和产业竞争力的重要标志,已经成为全球新一轮科技和产业革命的重要切入点。随着工业4.0和智能制造业的智能化和柔性化发展,机器人在智能化发展过程中也面临较大的挑战。一方面,产品生产方式呈现多样化、小批量和定制化特征,需要更短的制造系统迭代周期,迫使机器人具备快速编程与对不同场景的高效适应能力。另一方面,机器人正逐渐从工业环境的独立操作转化为与人类进行人机协作,这就要求机器人具备类人的灵巧操作能力。
现有依赖于人为干预与反复调试的机器人编程方式只适用于特定任务,当遇到相近任务或不同环境时,需要重新进行编程,从而无法汲取过往的操作经验,存在效率低、适应性差、灵巧性不足等问题。当前,新一代人工智能技术研发取得了重大进步,产品应用也日益广泛,随着机器人应用广度与深度的不断提升,探索如何利用人工智能技术让机器人系统具备一定的自主决策和学习能力,进而使机器人能够学习到适应于不同任务和环境的操作技能,避免对每个任务的繁琐编程,是未来机器人研究和发展的重要趋势。
随着人工智能与互联网、大数据、云平台等深度融合,在跨媒体感知、自主协同控制和优化决策、机器学习、类脑智能计算等技术的支撑下,机器人的智能化与自主化水平将进一步提升,未来的机器人将具有更多的感知与决策认知能力,变得更加灵活、灵巧与通用,能够高效适用于复杂多变的应用场景。
如今,人们提出了借助人工智能技术让机器人进行自主决策与学习的方法,从而使机器人适应于灵活多样化的应用需求。其中,机器人操作技能学习被认为是最为有效的解决方案,主要是通过机器人与人类和环境交互的方式获得操作技能。具体包括两方面的内容:一是使机器人从与人类交互的经验数据中进行高效率模仿学习,充分利用人类的操作经验,实现人-机器人操作技能传授,目的是赋予机器人具备“举一反三”的能力;二是使机器人从与环境交互的经验数据中进行可持续增强学习,并根据实际环境的变化构建出自主操作策略模型,目的是赋予机器人具备“熟能生巧”的能力。特别是,模仿学习是增强学习初始化和提高技能学习效率的重要方式。
通过结合模仿学习与增强学习的优势,将人类的操作经验进行知识化表达后再进行学习,具有较好的样本利用率和学习效率,这也是近年来机器人操作技能学习的主要研究方向。由此可见,机器人操作技能的增强学习方法是通过构建“感知+控制”一体的机器人操作技能增强学习机制,不断从与环境交互中进行操作策略学习与持续优化,赋予机器人“熟能生巧”的操作能力。
目前,国内外学者通过效仿人类进行操作技能学习的内在机制,将机器人操作技能学习系统划分为四个功能模块:机器人本体、感知与控制、技能模型与技能学习。其中,感知与控制是机器人本体与技能模型之间的中介层,通过视觉、触觉、听觉等传感器实现对操作对象和环境的状态感知,并由控制模块实现机器人本体的运动控制与执行。技能模型用于对经验数据进行封装,且不依赖于具体的机器人平台,可以由一定的参数配置实例化为具体的技能,其参数通常由技能学习实现。下面将针对技能模型与技能学习方法的不同,对目前机器人操作技能学习的相关研究进行阐述。
新一代智能制造技术机理是人-信息-物理系统,其典型特征是人将部分认知转移给信息系统,使系统具有认知与学习能力。在人-信息-物理系统中将人的操作经验与灵巧性迁移到机器人系统,使其获得高度类人化操作能力,是机器人操作技能学习的一种重要方式,其实现过程有着不同的称谓,我们在此表述为机器人操作技能的高效率模仿学习。在实际应用中,一般让熟练的工人根据自身操作经验通过拖动示教、远程示教或虚拟示教等方式对机器人系统进行示教,进而通过人工智能技术,从经验数据中获得机器人运动策略,最终实现机器人操作技能学习,当面临相近的操作任务应用需求时,机器人可以高效地对所习得的操作技能进行泛化处理,以生成新的操作技能来完成新的任务,从而极大增加了机器人系统编程的效率及灵活性。
综上所述,机器人操作技能模仿学习是通过构建“感知-动作”的学习机制,赋予机器人“举一反三”的操作能力,显著提升机器人操作的编程效率与灵巧性,实现复杂任务下多样化技能的高效习得。为了应对增强学习在机器人操作技能学习方面面临的挑战,目前机器人操作技能增强学习方法主要有两类:一是将机器人感知与控制模块融合进策略模型中,形成端到端的机器人操作技能策略模型,进而可以直接将传感器原始观察作为输入,并将底层执行器的驱动指令作为输出。由于这一学习过程是对机器人完成任务的每一步动作进行优化,也被称为基于步骤的机器人操作技能增强学习方法。