新京报贝壳财经讯(记者韦英姿)8月21日至25日,2024世界机器人大会在京举行。大会期间,中国科学院沈阳自动化研究所副所长刘连庆接受了新京报贝壳财经采访并表示,大语言模型对人形机器人的对话功能提升较大,但还没有解决行为动作等动作方面的问题。
“语言有token,存在逻辑关系,但机器人在三维空间里运动,有空间位置和实时环境交互关系。这些关系没有现成的大量的语料数据来训练,并且想从真实世界获取这些数据也挺难的。”刘连庆说。
他同时表示,目前也有人在研究如何让机器人的电压、电流等测量数据像大语言模型一样变为基本术语(即token),再接入模型中。他相信未来这方面技术也会有比较大的进展。
大语言模型在哪类机器人领域更有潜力?刘连庆表示看好服务机器人“给人聊个天对个话”的应用场景。
根据刘连庆观察,目前在人形机器人控制方面,端到端的控制方法表现出色,“能够让编程量、程序代码减少60%以上,性能还非常好”。他认为,这也是本届世界机器人大会展出的27款人形机器人中最具创新的点。他提出,随着无人驾驶等技术发展,端到端的控制将有更大突破,也将会影响机器人赛道,“科技发展是协同推进的”。
“人形机器人发展的最大问题是刚需究竟在哪。”刘连庆说。他以汽车产业为例说明,这一产业能否产生第二增长曲线,人形机器人是一个很重要的点。
在他看来,汽车组装完成后还需要进行很多软线、软管的插拔动作,“这些现在只有人用手配合眼睛才能完成”,而行业里的人希望把这些“必须由人完成的动作”交给人形机器人来完成。他还认为,汽车的检测检验不一定非人不可,“人形机器人一旦能够完成专业动作,也将能够完成通用动作,可能会出现新的场景。”
刘连庆预测,三年之后,在有关部门重点研发计划的支持下,应该能看到人形机器人落地的第一个应用场景。“不一定是汽车,可能是家电行业这一稍微简单一点的场景。”
目前,机器人还是一个烧钱的行业,刘连庆认为行业成本最终会下降。他还提出未来机器人盈利的一种可能模式:类似手机,把具有基础功能的手机卖给用户,但如果用户想开通炒菜、打扫房间等其他功能需要额外付费。另外,机器人厂商还可以推出定制化服务。
在本届世界机器人大会开幕式上,乔红院士发布《人形机器人十大趋势展望》并呼吁关注人形机器人的道德伦理与安全性,对此,刘连庆提出可以通过技术来实现这一愿景,例如模仿大模型通过小的监督模型来训练如何与人类价值观对齐。
编辑 陈莉
校对 柳宝庆