算力,曾经是评判智能驾驶芯片性能的不二指标。但是,也正是因为其相对直观的缘故,各大芯片厂商开始在TOPS数值上暗暗较劲,直至演变成以算力高低论成败的“军备竞赛”。
《吕氏春秋博志》有云,“全则必缺,物极必反”。
由此,不得不思考一个问题,这场“军备竞赛”的重点在哪?是跟着继续内卷、狂堆算力,还是开辟一条全新的道路,中国企业渐渐给出了自己的答案。
近日,车规级AI芯片公司地平线宣布与一汽红旗达成合作,双方将基于地平线征程5芯片共同打造智能驾驶域控制器,预计将于2023年在红旗的全新车型上实现量产。
(地平线征程系列芯片)
作为地平线推出的第三代智能驾驶芯片,征程5自2021年7月份正式发布以来,先后斩获了多家车企的合作订单。
今年4月份,比亚迪宣布将依托征程5 打造智能驾驶行泊一体方案,以期能够实现更高等级的智能驾驶功能;自由家也于近期公布了其首款新车自由家NV的智能驾驶配置,搭载的芯片正是来自于地平线的征程5。
除了主机厂的订单以外,觉非科技、轻舟智航等自动驾驶解决方案供应商,也先后官宣了将基于征程5芯片完成其软件算法的适配和部署。
至此,国产智能驾驶芯片的大规模商业化落地正式到来。
是什么造成了算力内卷?
除了地平线以外,黑芝麻智能、华为等企业的智能驾驶芯片业务,目前各自也都有了明确的商业化落地项目。不过,由于起步较晚的缘故,在相当一段时间内,我国在大算力AI芯片领域一直处于被海外企业牵着鼻子走的状态。
最早深耕于智能驾驶芯片领域的企业,是一家来自于以色列的计算机视觉公司Mobileye。
(采用Mobileye视觉方案的车辆)
Mobileye诞生于1999年,凭借其先发优势,以及“算法+EyeQ系列芯片”这种软硬一体的打包方式,Mobileye一度占据着辅助驾驶解决方案超过70%的市场份额,芯片累计销量达到1亿颗,特斯拉、奥迪、宝马等车企都曾经是其重要的合作伙伴。
不过,伴随着市场逐渐将辅助驾驶系统视为刚性需求,Mobileye这套纯视觉方案以及“黑盒”模式的弊端便很快暴露出来:车企无法参与到算法的设计中来,也无法接触到用户反馈的真实数据,导致车企很难就系统产生的各种问题进行快速地修正和更新迭代。
接过权杖的是英伟达。
和英特尔相比,有关GPU的设计研发一直都是英伟达的拿手好戏,而GPU在图像处理方面的优势也正是智能驾驶芯片所需要的。因此,在抛弃了Mobileye之后,包括“蔚小理”在内的一众车企纷纷转投到了英伟达的旗下。
在今年3月份举行的GTC AI开发者大会上,英伟达宣布已经有超过25家车企选择和其建立了合作关系。
(英伟达发布的下一代芯片架构和计算平台)
总的来讲,英伟达之所以能够获得如此广泛的“朋友圈”,一方面是在于其能够为车企提供全套的开发平台和工具链,能够帮助客户快速地搭建起自己的系统模型,还能够实现软件算法跨越平台的快速迁移。
而另一方面,英伟达在芯片算力上优势明显,远超Mobileye等其他竞争对手。英伟达单颗Orin芯片的算力就已经达到了200TOPS。而在今年的GTC AI开发者大会上,英伟达发布的下一代智能驾驶芯片Altan,其算力更是达到了恐怖的1000TOPS。
在很多时候,英伟达单颗芯片的算力水平,甚至比同一时期,其他企业集成了数颗芯片的智能驾驶计算平台还要高。
(主流智能驾驶芯片关键参数对比)
龙头企业的算力水平,自然是各大厂商竞相追赶的对象。再加上新车发布时,突显芯片在算力上的优越性,往往是车企最为简单有效的宣传手段,长此以往就给市场营造了一种“得算力者得天下”的既视感,让成倍数增长的芯片算力俨然已经成为了一种流行趋势。
算力之外,还有什么?
不可否认的是,随着车企着手研发更高级别的辅助驾驶系统,对于环境感知的精度要求愈加严苛,如激光雷达、毫米波雷达等传感器的数量也呈现出增长的趋势,因此难免会导致数据量的成倍增加,也的确需要算力更加强大的芯片去完成计算工作。
然而,需要指出的是,纸面算力越大,真的意味着芯片的性能会更好吗?其实不然。
这里需要明确一个概念。一般来说,出现在新车发布会或者参数表中,以TOPS为单位的算力数据,其实是指智能驾驶芯片在理论上的峰值算力(物力乘法器数目乘以最高频率)。但是,在实际场景下,理论峰值算力基本不大可能会被完全释放。
国内某自动驾驶公司算法工程师曾经表示,“高TOPS都是运算单元的理论值,而非整个硬件系统的真实值。真实值和理论值差异极大,最糟糕的情况下,真实值是理论值的1/10,甚至更低。”
华为智能汽车解决方案BU CEO余承东,也在极狐阿尔法S全新HI版正式上市时表示,理论上芯片的峰值算力并不是衡量智能驾驶体验的主要指标。
可以说,峰值算力只反映智能驾驶芯片在理论上的最大计算能力,而并非在实际场景中的处理能力。如果仅以算力这个单一维度来评判芯片的性能,其实是有着非常大的局限性。
事实上,能够决定芯片真实性能的,还和内存的带宽(及能够在单位时间内向芯片输送多大的数据量,而这往往由芯片的架构决定),以及算法的计算效率(及能够利用相对较少的数据量达到对于场景所需的精度需求)密切相关。
(地平线联合创始人黄畅博士)
为了能够衡量芯片的真实性能,2020年,地平线联合创始人黄畅博士在全球人工智能和机器人峰会上,首次提出了MAPS(Mean Accuracy-guranteed Processing Speed)的概念,即针对应用场景的特点,在精度有保障的前提下,评估芯片对数据的平均处理速度。
MAPS的度量单位是FPS全称是Frame Per Second,即“每秒钟可准确识别多少针”,这样的方式极大地降低了理论峰值算力在评价体系中的权重,相对而言更多关注的是芯片处理数据的速度和准确率。
“多块”+“多准”,显然比单论峰值算力更能评估出芯片的真实性能。
(地平线征程5和英伟达Orin的MAPS值对比)
地平线也曾就全新的评估手段,对征程5和英伟达Orin做过测试。测试结果显示,在相同的场景和算法下,征程5的MAPS数值高达1283FPS,而英伟达Orin则为1001FPS。要知道,Orin的峰值算力几乎是征程5的两倍,并且被各大车企广泛地应用在下一代车型当中。
地平线创始人余凯曾经在2021年6月份的一场演讲中,针对芯片厂商在峰值算力上的“军备竞赛”发表过自己的看法:
“顶级的芯片公司一定不能只用算力的多少,来简单地讲这个故事。1000TOPS意味着什么?它不是你的效用、性能,也不是用户价值,而是施加给车企的成本。”
在国产芯片大规模商业化落地的前景下,不远的未来,中国企业或将率领智能驾驶芯片走出算力黑洞。