如今,由于物联网的兴起造成了数据冲击,对重要物联网传感器数据的处理越来越接近数据最初所在的位置,便有了对基于边缘计算的机器学习技术的需求。这两年,人工智能发展的主题已经非常明确,就是落地应用。在众多的AI技术当中,无论是上层的算法应用,还是产品,最终都依赖于底层算力的保障,也就是AI芯片。
边缘AI市场落地风向
从去年起,边缘AI市场已经进入爆发期,AIoT终端数量已经超越智能手机。从AI落地的场景来看,AI芯片的两大工作负载主要是数据训练和推理计算。其中,推理计算市场份额的增速正在赶超数据训练市常
现在一个算法模型能做到仅仅2KB,性能表现却超过4MB的神经网络算法。深度学习算法的微型化改变表明以GPT-3为代表的超大型模型并不适用于企业级市常
在新的物联网框架中,数据在设备本地就可以得到处理。这需要在底层芯片设计上就考虑好算法模型在不同场景中有限的部署条件,包括算力、功耗和硅片面积的分配。从单位算力的成本效用上看,推理计算更能代表企业级市场所需要的落地方向。
边缘AI芯片落地挑战
首先就是边缘AI的场景呈多元化,不同场景对芯片的功耗和性能要求都有差异。而另一方面,碎片化场景的市场容量具有不确定性,需要在芯片研发的工程成本和收益之间取得平衡,这是所有芯片厂商都需要面对的考验。
高质量数据的获取同样是一大难点,即如何从大数据中筛选可靠的数据。大数据不意味着高质量的数据,在AI芯片上执行深度学习任务需要硬件传感器的持续优化。
另外对于传统客户而言,除了智能产品的采购成本外,还有使用成本。芯片的功耗,产品是否易于部署,都影响着AI的落地和推广。芯片厂商如何根据不同的场景定制不同算力的芯片也是落地环节上的痛点。
目前边缘AI芯片缺乏高可用的开发平台,软件编译工具设计复杂,用户的开发和使用门槛偏高,但这些可预见都会在落地过程中不断完善和迭代。
商用边缘AI芯片
旭日系列
面向AIoT,地平线推出了旭日系列边缘AI芯片。通过IC设计和软件的共同努力,实现了性能、功耗、灵活性和成本之间的平衡。旭日2边缘AI芯片采用BPU伯努利1.0 架构,可提供 4TOPS等效算力,对多类目标进行实时检测和精准识别。旭日2集成了Dual-Cortex A53,能高效支持多种主流AI任务。同时还支持EMCC、SPI Flash。
旭日3则是地平线推出的,主打低功耗和高性能的全新一代AIoT边缘AI芯片。其集成了地平线最先进的伯努利2.0架构AI引擎( BPU),可提供5TOPS的等效算力。
新的BPU架构极大提升了对先进CNN网络架构的支持效果,以及极大降低了AI运算对DDR带宽的占用率。辅以地平线天工开物AI开发平台,极大简化算法开发与部署过程,降低AI产品的落地成本。
伯努利2.0 BPU结构下,DDR Utilization 呈5倍提升。先进的ISP处理算法,使得在宽动态、低照度场景下,也能得到1200 w pixel高质量的图像。旭日3可同时处理不同分辨率4 ~ 8个Camera Sensor的输入,并支持多种图像后处理,同时支持 H.264 / H.265 编解码,性能达到4K@60fps 。
(旭日3)
勘智K210 /K510
第一代芯片勘智K210专门针对机器视觉任务设计,浮点计算能力可以达到1.28TFLOPS,可以媲美嵌入式领域主流的开发选择。同时,它的功耗只有0.3W,典型工作场景的功耗小于1W,单位算力功耗低,是一款非常经济的选择。第二代勘智K510根据实际的落地情况和客户反馈进行升级。这款IP内核重新进行架构设计,实现神经网络中不同层级对计算资源、存储和带宽的需求,并且提升数据的复用率,降低芯片功耗。
其次,针对数据获取的速度和质量,勘智K510配置了全新的视觉模组。与第一代芯片相比,K510在帧率和外设方面都有大幅优化。每T算力帧率达到业内领先水平。此外,K510还支持浮点 BF16 计算,在不适合进行模型量化的场景相比同类产品更具优势。
(Video subsystem示意图)
小结