金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
旷视科技,现在是一家创办10年的公司。
它是最早在中国打响名气的AI视觉明星,是一个全新ID时代的开启者,也是同时代独角兽中最快实现规模化营收的公司。
谈到这一波AI浪潮,往往标签就是谷歌和AlphaGo,而谈到中国AI创业,似乎开口就会是旷视和Face++……
但即便如此,对于旷视的不同认知也相差甚远。
有人依然停留在天才云集、清华姚班、AI独角兽的通识印象。
也有人看到旷视“AI+IoT”的战略选择后,认定这可能不再是一家掌握“魔法”的酷公司。
更少有人能清晰表达旷视一路的“归去来兮”,理解背后运转的关键逻辑,划定关乎本质的边界与核心。
只是现在,10年一梦,连点成线。
宏观透视当前的旷视,不断升级打怪和求解的现实挑战,可以极简到3个自然数:
1、2,3……就是旷视。
1:一套核心算法
旷视是一家靠算法起家的公司。
更准确来说,可以细分为两类。
一类是以深度学习(DL)和计算机视觉(CV)为基础的核心算法。
十年前,深度学习露出了快速发展的苗头,旷视抓住了这个契机,立即决定将DL和CV进行结合;于是乎,便形成了现在特征鲜明的算法能力,包括面部识别、视频结构化、图像分类、物体检测、语义分割、动作识别等。
这类算法是旷视之始,是旷视算法演进的基矗
而除了将DL与CV结合之外,旷视在它们各自能力上,也进行了相应拓展,包括更底层的DL模型,以及计算摄影、屏下指纹识别、机器人导航CV能力。
基于核心算法的突破,旷视在全球AI顶级竞赛中揽获40个世界冠军,创下了前无古人的MS COCO三连冠纪录,获誉AI领域的“中国乒乓球队”。
另一类则是行业算法 (或者叫AIoT算法)。
这类算法的最大特点,就是碎片化和个性化,这点非常好理解,毕竟“千行千面”。而旷视的DL+CV,更多的是解决数据的输入问题,但如若要形成行业数据的闭环,还需要具备数据挖掘和优化的算法能力。
旷视认为,未来十年算法将无处不在,并且成为每个行业“降本增效”最核心的引擎。因此,在明确“AI+IoT”战略方向后,旷视利用自身能力和优势,推动了行业算法的创新,以实现价值闭环。
这其中包括在多设备调度优化、数据挖掘和分析等方面,实现了多设备之间的高效协同、数据挖掘分析和形成决策。
例如,旷视推出的河图智慧物流操作系统,就是通过同构仿真和AI调度优化的能力,实现了项目规划、仿真、实施、运营等全流程的数字化和智能化。
不过,在旷视的这个1中,算法之强,本质还不在于单个模型,而是旷视规模化、批量化生产算法的能力。
即算法生产引擎Brain++。
形象化理解,如果旷视的算法是蛋,那么Brain++就是背后的鸡。
作为一个生产力工具,Brain++的形成有旷视业务需求的内因,也有当时缺乏可用开源平台的外因。
但内外因综合之下,最终使得Brain++成为了旷视工程实践和算法创新的有力支撑。
而且相比于TensorFlow等算法框架,Brain++包含了算法、数据和计算的统一。
成为了旷视数次在全球AI竞赛中击败谷歌、微软等巨头的“秘密武器”,是旷视研发不断逢山开路的保障。
所以归结起来,旷视的算法之路,经历了从核心算法突破,到行业算法落地和创新,再到算法生产平台的拓展过程。
而所谓道生一,一生二,二生三,三生万物。
在旷视的定义里,AI是不断演进的算法能力。AI是旷视的核心能力,其后场景化落地中形成的边界感,也始终围绕这个核心。
算法就是旷视的1,有这个1才有后续落地的一切。
2:有“脑”有“躯干”,软硬结合的路径
AI浪潮,被视为智能化浪潮,是一场替代简单重复脑力劳动的革命。
而这种脑力驱动,来自算法。
但产业化落地,光有“脑”不行,必须还要有“躯干”合体。这个躯干,旷视认定是IoT。
在旷视看来,IoT是一种网络,所具备的特点就是“基于场景空间”、“以人为核心”、“软硬结合”。它是旷视AI技术落地的载体。
而所谓AI+IoT,就是将AI的能力加进IoT场景中,实现从应用、数据中台、边缘设备和终端的全面智能化。
深度学习驱动的AI复兴,本质就是对数据的物尽其用。
但在现实生产中,用数据就得先有可用的数据,用石油就得先开采和部署石油管道。
所以物联网终端执行器、传感器,最核心的价值就是数据的在线化,部署AI算法后,数据就能发挥第一层作用。
智能手机有了刷脸模组,学习了用户面部数据,接下来就能展开刷脸解锁的应用。
但是,在物联网的执行器、传感器等组网之后,还需要在这些设备与应用之间增加一个智能的“大脑”,使其具备连接、分析和协同能力,这就是旷视着力打造的“AIoT操作系统”。
此外,AI落地必须要讲场景,明确限定区域。
而不同场景有不同的IoT设备,需要配备不同的AI算法,软硬结合的落地方式,也就成了题中之义。
比如城市公共空间、建筑楼宇,以及面向工业的物流仓储空间和工厂空间等等,场景不同,需要的AI软硬件也不同,而且交付的对象也千差万别……
只有把算法、软件和硬件的各要素能力,集成固化成终端可交付产品,才能定价交付,才能实现商业化、规模化落地。
所以旷视被外界所熟知的是战略选择AI+IoT,在消费物联网、城市物联网和供应链物联网三大场景展开落地,但易于忽略的是,这种战略选择,其路径决定于软硬结合,以及由此带来的客户价值积累。
实际上,软硬结合也是AI业内的大共识。
特斯拉自研AI算法后进一步自研打造AI硬件,依图、地平线等进军芯片也都是基于AI算法和需求的重新定义。
上一个时代的软硬结合,是基于现有硬件,打造与之匹配的算法和软件。
而在IoT时代,软件和硬件是天然结合的,需要协同设计和联合优化,其本身就是软硬一体的。
3:三大场景的“边界”
边界不是终点,边界只是意味着技术到商业是否实现了闭环,这是企业阶段性有所为有所不为的选择结果。
而旷视,在算法为核心、AI+IoT的软硬结合为落地方式之下,现阶段选择了三大场景,也暗合其商业价值增长的短期、中期和长期。
第一大场景,消费物联网。最典型如智能手机为主的消费电子上的面部识别、屏下指纹及计算摄影相关的解决方案。
AI能力应用的终端(手机)已经非常成熟,规模化起量也很快,毛利率不高但边际效应明显,对于AI能力供应商而言,被认为是十亿美元市常
从2012年开始,旷视就开始给OEM手机厂商和App,提供解决方案。
除了最知名的刷脸、屏下指纹模组,还包括在AI降噪、多摄虚化、夜景超画质以及视频虚化等方面的计算摄影供应。
除了手机终端的应用之外,旷视还在基于Face++人工智能开放平台,为互联网金融、网约车、线上租赁平台等企业和开发者,提供数十种AI能力及SaaS产品服务。
第二大场景,城市物联网。
比如面向城市区域内的公共安全、交通管理、城市管理、楼宇园区等场景,提供智慧城市解决方案。作为城市智能化和新兴基础设施的核心组成,这被认为是百亿美元的市常
旷视在该领域于2015年入局,推出过洞灵慧+边缘盒子、盘古九霄+新型交互设备等AIoT设备。
而2020年来,大众对于城市物联网最具感知的,可能莫过于商尝地铁站和机场等公共场景的AI识别和测温了。
第三大场景,供应链物联网。
集中体现在物流领域,相比消费和城市两大场景,旷视在这个场景入局最晚2017年,但软硬件一体化能力也展现得最充分。
有AI算法,有软件操作系统河图,还进一步基于AI定义硬件打造了AMR机器人、SLAM导航智能无人叉车、智能圆盘播种机、人工智能堆垛机……
在供应链物流场景中,一方面客户可以是衣食住行用全领域,另一方面之前的“大小脑”智能化程度不高,可以全方位升级改造。这也是该场景被认为有千亿美元潜力的原因。
目前,旷视在供应链物联网领域,据称已经累计向鞋服、医药、智能制造、零售电商等不同行业提供了仓库、工厂及零售店的升级改造,客户数已近百位。
所以整体纵览之后,旷视在这三大场景的发展,有些正处于成熟期,有些尚处于发展期。三大业务板块市场成熟度、商业前景和规模,都有先后之分。
而万佛朝宗,虽然场景领域有不同,构建的闭环边界有不同,但三大业务板块的AI产业化落地的思路一以贯之:从软件到软硬结合,从AI走向AIoT。
而从AI算法软件平台软硬结合,也被旷视认为是AI产业落地的最小路径。
更是旷视十年摸石头过河探索出的核心经验。
如何评价?
如今,站在现在来总结梳理,自然可以把旷视以1、2,3来审视。
不过极简如斯,过程却可能并非一蹴而就,背后都是旷视从算法到硬件,从代码空间到现实场景的10年探索和求解。
而从旷视出发,作为中国AI创业的头雁代表,其发展和演进路径,也是中国原创AI一派的缩影,是前所未有的技术创新到商业模式落地的缩影。
在AI浪潮之前,中国的创业者都是基于硅谷成熟的技术创新之上的商业模式创新,于是产生规模化商业价值的时间也就更快。
但AI浪潮不同,算法的创新天然需要与行业和数据结合,而行业错综复杂,需求高度不确定,这造成AI商业价值的落地的周期相对较长。
旷视用了10年,可能就是最具代表性的说明。
此外,软硬件一体的AI时代落地趋势,一次次被强化和证明。
无论是因为自动驾驶能力而自研芯片的特斯拉,还是旷视的算法天才们下工厂、走进仓库,在物流供应链一线打造机器人……都是这个趋势的明确注脚。
向重而生、落地为王,也在成为AI价值兑现和交付的风向,也只有朝着这个方向,才能构建从技术到商业的价值闭环。
如果说,AI落地是一道摆在所有人面前的时代级应用题。
那旷视解题的过程和答案,就是这份1、2,3…数列。