四年前,亚历克斯肯德尔(Alex Kendall)坐在一辆行驶在英国乡村路上的车里,他的手没有放在方向盘上。这是一辆配备了几个便宜的摄像头和一个巨大的神经网络的车。当它发生偏转时,肯德尔抓住了方向盘,花上几秒钟来纠正它。他说,如此循环往复不到 20 分钟,这辆车就学会了自己沿着路行驶。
这是强化学习一种通过试错来训练神经网络执行任务的人工智能技术首次被用于教汽车在真正的道路上从零学习驾驶。这是朝着新方向迈出的一小步新一代初创公司认为,这可能是使无人驾驶汽车成为日常现实的突破口。
强化学习取得了巨大的成功:它驱动了可以玩电子游戏和下围棋的计算机程序,甚至还被用来控制一个核聚变反应堆。但驾驶被认为太复杂了。“我们是被嘲笑的对象,”英国无人驾驶汽车公司 Wayve 的创始人兼 CEO 肯德尔说。
该公司现在在伦敦的高峰时段训练汽车。2021 年,它展示了如何让一辆仅在伦敦街道上学习过的汽车,在五个不同的城市行驶剑桥(英国)、考文垂、利兹、利物浦和曼彻斯特。
这是像 Cruise 和 Waymo 这样的行业领导者一直在努力做到的事情。2022 年 5 月,Wayve 宣布将与微软合作,在科技巨头基于 Azure 云计算的超级计算机上训练其神经网络。
投资者已经投入了 1000 多亿美元来制造无人驾驶汽车。这是美国宇航局登月计划所花费的三分之一。然而,尽管经过了 15 年的开发和无数次的道路测试,无人驾驶技术仍处于试点阶段。肯德尔说:“我们看到了大量的支出,成果却非常有限。”
这就是为什么 Wayve 和其他自动驾驶汽车初创公司,如美国的 Waabi 和 Ghost,以及总部位于以色列的 Autopains,都在转向人工智能。他们标榜自己为 AV2.0,押注更智能、更便宜的技术将让他们超越目前的市场领导者。
炒作机器
Wayve 表示,它希望成为第一家在 100 个城市部署无人驾驶汽车的公司。但这看起来就像是多年来一直过度宣传的行业的另一次炒作。
“这个领域有太多的过度宣传,”拉克尔乌尔塔森(Raquel Urtasun)说。她曾领导优步自动驾驶团队四年,直到 2021 年离职并成立 Waabi。“人们也没有认识到,这项任务最初有多困难。但我不认为自动驾驶的主流方法会让我们满足安全部署该技术所需要的。”
所谓的主流方法至少可以追溯到 2007 年和美国国防部高级研究计划局的“城市挑战”,当时六组研究人员成功地让他们的机器人车辆在一个废弃的美国空军基地的一个小镇模型上导航。
主流方法也是建立在此次成功的基础上的。这种方法将感知、决策和车辆控制视为不同的问题,每个问题都有不同的应对模块。
但乌尔塔森说,这可能会使整个系统难以构建和维护,其中一个模块中的错误会溢出到其他模块中。“我们需要一种人工智能思维,而不是机器人思维,”她说。
于是现在有了一个新的想法。Wayve 和 Waabi 等公司不是构建一个包含多个神经网络的系统并拼接在一起,而是建立一个大型神经网络,自己计算细节。向人工智能输入足够的数据,它就会学会将输入(关于前方道路的摄像头或激光雷达数据)转换为输出(转动方向盘或踩刹车),就像儿童学习骑自行车一样。
像这样直接从输入到输出被称为端到端学习,这是 GPT-3 如何处理自然语言,也是 AlphaZero 如何应对围棋和国际象棋。肯德尔说:“在过去的 10 年里,它解决了许多看似无法解决的问题。端到端学习推动了我们走向超人的能力。开车也不例外。”
和 Wayve 一样,Waabi 也在使用端到端学习,但它(还没有)使用真正的车辆。该公司几乎完全在一个超真实的驾驶模拟中开发人工智能,它本身由一名人工智能驾驶教练控制。类似的还有 Ghost 公司,他们采用人工智能优先的方法,建立无人驾驶技术,不仅能在道路上导航,还学会对其他司机做出反应。
20 万个小问题
Autopains 也押注于端到端方法,但用它做了一些不同的事情。它不是训练一个大型神经网络来处理汽车可能遇到的一切,而是训练许多较小的网络实际上是数十万个来处理一个非常具体的场景。
该公司 CEO 伊加尔雷切尔高兹(Igal Raichelgauz)表示:“我们正在将困难的自动驾驶问题,转化为数十万个较小的人工智能问题。”使用一个大型模型会使问题比实际情况更复杂,他说:“当我开车时,我并没有试图理解路上的每一个像素。这是关于提取环境线索的问题。”
Autopains 从一辆汽车中获取传感器数据,然后用人工智能将数据与场景匹配:下雨、人行横道、红绿灯、自行车右转、后面有车等等。Autopains 表示,通过观看 100 万英里的驾驶数据,其人工智能已经识别出了大约 20 万种独特场景,该公司正在训练单个神经网络来处理每个场景。
该公司一直在与汽车制造商合作并测试其技术,最近刚刚拥有了自己的小车队。
肯德尔认为,Autopains 所做的事情可能对高级驾驶辅助系统很有效,但他不认为这比自己的方法更好。他说:“在解决整个自动驾驶问题时,我希望他们也会受到现实世界中所面临的复杂性的挑战。”
巡航控制
不管怎样,我们可以指望这股新势力来施压领跑者吗?不出所料,Cruise 公司的工程部执行副总裁莫埃尔谢纳伊(Mo ElShenawy)并不信服。他说:“现有的(AI)技术水平还不足以对 Cruise 构成挑战。”
Cruise 公司是世界上领先的无人驾驶汽车公司之一。自 2021 年 11 月以来,它一直在旧金山运营机器人出租车服务。它的车辆在有限的区域内运行,但现在任何人都可以用 Cruise 应用程序叫车,让车停到路边,里面没有司机。“我们从客户那里看到了一系列真实的反应。这是非常令人兴奋的。”
Cruise 已经建立了一个巨大的虚拟工厂来支持其软件,有数百名工程师在不同的部分工作。埃尔谢纳伊认为,主流模块化方法是一个优势,因为它允许公司在新技术出现时做出快速反应。
他还否认了 Cruise 的方法无法推广到其他城市的观点。他说:“我们几年前就可以在别的城市的郊区运行,但那样反而会限制我们。我们之所以选择一个复杂的城市环境,比如旧金山在那有成千上万的骑行者、行人、紧急车辆和汽车是慎重且有意为之的。这驱使我们建造一些容易扩展的东西。”
但在 Cruise 进军一个新城市之前,它首先要以厘米级的细节绘制街道地图。大多数无人驾驶汽车公司都会使用类似的高清 3D 地图。它们为车辆提供额外的信息,通常包括车道边界和交通灯的位置,或者在某条街道上是否有限制。
这些所谓的高清地图,是通过将照相机和激光雷达收集的道路数据与卫星图像相结合而成的。在美国、欧洲和亚洲,有数亿英里的道路已经以这种方式被绘制出来。但是道路布局每天都在变化,这意味着地图制作是一个无休止的过程。
许多无人驾驶汽车公司使用由专业公司创建和维护的高清地图,但 Cruise 有自己的地图。“我们可以重建城市所有的驾驶条件、街道布局和所有的东西,” 埃尔谢纳伊说。
这让 Cruise 在与主流竞争对手相比获得了优势,但像 Wayve 和 Autopains 这样的新玩家已经完全抛弃了高清地图。Wayve 的汽车配有 GPS,但它们学会了仅使用传感器数据来读取道路。这可能更难,但这意味着它们不受限于某个特定城市或地区。
对肯德尔来说,这是无人驾驶汽车普及的关键。他说:“我们进入第一个城市的速度会比较慢,但一旦我们涉足了一个城市,我们就可以快速扩张了。”
尽管如此,我们还有很长的路要走。当 Cruise 机器人出租车正在旧金山各地运送付费乘客时,WayveAV2.0 新势力中最先进的一员还未曾在没有安全司机的情况下测试其汽车。Waabi 甚至都没有使用真正的汽车。
尽管如此,这些新的 AV2.0 公司还是信心满满:端到端学习重写了计算机视觉和自然语言处理中可能实现的规则。所以他们的目标并非是空想。
乌尔塔森说:“如果每个人都朝着同一个方向前进,而这是一个错误的方向,我们就不会解决这个问题。我们需要多种多样的方法,因为我们还没有看到一个终极解决方案。”
支持:Ren
原文:
https://www.technologyreview.com/2022/05/27/1052826/ai-reinforcement-learning-self-driving-cars-autonomous-vehicles-wayve-waabi-cruise/