8月20日亿欧汽车讯,今日特斯拉在美国举办AI Day活动。
在活动上,人工智能部门总监Andrej Karpathy表示,特斯拉坚持视觉感知,用AI神经网络技术提升辅助驾驶能力,并开发了“矢量空间”(Vector Space)技术,同时兼具了非凸优化算法(Non-convex)、高维度两大优势。该技术可以通过8个摄像头输入的数据为基础绘制3D鸟瞰视图,形成4D的空间和时间标签的“路网”以呈现道路等信息,帮助车辆把握驾驶环境,更精准的寻找最优驾驶路径。
Andrej表示:“我们希望能够打造一个类似动物视觉皮层的神经网络连接,模拟大脑信息输入和输出的过程。就像光线进入到视网膜当中,我们想通过摄像头来模拟这个过程。”
有了海量、精准的视频数据,特斯拉还需要创造一个强大的神经网络,并对网络进行特殊的布局,使这些数据能在一个总的主干网络上进行整合和重新分析。因此,特斯拉“高楼平地起”,自主研发了基于神经网络的训练方式。
特斯拉拥有一支由世界各地人才组成的数据标注团队,规模在1000人左右。团队每天对视频数据中的物体在“矢量空间”中进行标注,在善于把握细节的人工标注和效率更高的自动标注配合下,只需要标注一次,“矢量空间”就能自动标注所有摄像头的多帧画面。这为特斯拉带来了上百亿级的有效且多样化的原生数据,而这些数据都会用于神经网络培训。
同时,特斯拉还开发了“仿真场景技术”,可以模拟现实中不太常见的“边缘场景”用于自动驾驶培训。在仿真场景中,特斯拉工程师可以提供不同的环境以及其他参数(障碍物、碰撞、舒适度等),极大提升了训练效率。目前,特斯拉FSD系统已可以实现每1.5毫秒2500次搜索的超高效率。
由于特斯拉所需处理的数据开始指数级增长,特斯拉注重提高训练神经网络的算力,特斯拉Dojo超级计算机应运而生。
组成Dojo超级计算机的关键单元,是特斯拉自主研发的神经网络训练芯片D1芯片。D1芯片采用分布式结构和7纳米工艺,搭载500亿个晶体管、354个训练节点,仅内部的电路就长达17.7公里,实现了超强算力和超高带宽。
1500个D1芯片共53万余训练节点,组成了Dojo超级计算机的训练模块。由于每个D1芯片之间都是无缝连接在一起,相邻芯片之间的延迟极低,训练模块最大程度上实现了带宽的保留,配合特斯拉自创的高带宽、低延迟的连接器,算力高达9PFLOPs(9千万亿次)。
在实际应用中,特斯拉将以120个训练模块组装成ExaPOD,它是世界上首屈一指的人工智能训练计算机。与业内其他产品相比,同成本下它的性能提升4倍,同能耗下性能提高1.3倍,占用空间节省5倍。
与硬件相匹配的,是特斯拉针对性开发的分布式系统DPU(Dojo Processing Unit)。DPU是一个可视化交互软件,可以随时根据要求调整规模,高效地处理和计算,进行数据建模、存储分配、优化布局、分区拓展等任务。
不久后,特斯拉即将开始Dojo超级计算机的首批组装,并从整个超级计算机到芯片、系统,进行更进一步的完善。
在活动的尾声,马斯克抛出了“Tesla Bot”。Tesla Bot高1.72米,重56.6千克,脸上的屏幕可显示信息,拥有人类水平的双手,并有力反馈感应,以实现平衡和敏捷的动作。
马斯克表示,Tesla Bot将利用Dojo超级计算机的训练机制来改进功能,他说道:“未来劳动力不会短缺,但体力劳动只是一种选择。Tesla Bot可以执行一些危险性、重复性、枯燥的任务。”
Tesla Bot或将在明年推出首个原型机。