新智元报道
编辑:yaxin
【新智元导读】从深度学习算法、计算机视觉算法到AIoT算法,从开源框架旷视天元到AI生产力平台Brain++,旷视十年故事,旷视首席科学家、旷视研究院院长孙剑讲给你听。
万万没想到,我和小伙伴们被旷厂拿去「炼丹」了。
没错,就是这个炼丹炉!
站在炉子中央,各种算法代码眼前飞闪,让我体验了一把时空穿梭的快乐。
OMG!真颅内高潮...
业界认为「炼丹」过程正如算法研究过程。
众所周知,AI的三大支柱分别是数据、算法、算力。
那么在炼丹过程中,数据便是金木水火土等自然元素,算法框架是用来炼丹的炉子,算力就是炼丹炉下的三昧真火。
元素全不全,炉子好不好,火旺不旺决定了AI开发者能不能练出一颗AI的「灵丹妙药」。
从2014年至今,中国新一代炼丹宗师旷视经过多年的磨练打磨,打造了「炼丹房」 Brain++。
MegEngine(深度学习框架天元)是丹炉,MegData(数据管理平台)是元素,MegCompute(深度学习云计算平台)便是那三昧真火。
这次,「炼丹房」 Brain++ 迎来了全新升级!
升级后的炼丹房,「自动」成为最大特色,炼丹师们不再需要经过九九八十一天这么漫长的时间来炼制丹药。
这个平台提供了怎样的最新功能,让AI开发者们更轻便地生产算法?
Brain++「神助攻」:一个「旗帜检测」算法诞生
熟悉旷视的人都应该知道,Brain++ 是旷视在AI领域创业多年的致胜法宝。
它将算法、算力和数据能力集为一体,核心能力包括:
数据的处理、清洗和管理能力,算力的共享、调度和分布式能力,算法的训练、推理及部署能力。
全面覆盖了从 AI 生产(输出算法模型)到应用(实现算法工程化封装)各环节。
因此,Brain++被内部定义为「AI生产力平台」。
但时局变了,数据满溢,算力飞升,算法无处不在。许多开发者们真正面临的挑战是:如何让算法生产更加高效?
要知道,算法生产能力决定算法价值上限。
当前的算法生产不仅仅是模型的训练,还包括需求分析、数据处理、上线部署、落地应用4个环节。
过程标准化是影响算法生产的关键要素,只有过程标准化才能实现算法生产的自动化。
让算法生产迈向自动化时代,便是Brain++迎接这一挑战的底气!
自动化的数据管理和质检自动推荐合适的训练算法和模型自动检查算法准确率并给出优化建议便是升级后Brain++的最新功能。
举个真实场景中的例子,
在钢铁冶炼厂中,存在一些比较危险的设备。根据生产安全的要求,这些设备周围需要插小红旗来做警示和标志。
如何能够检测出小红旗是否还插着?
这就需要做一个红旗检测的模型,通过安装的摄像头来进行自动化检查。
需求明确后就需要进行算法生产了。
首先,Brain++提供自动化的数据管理和质检,包含十余种质检策略,这个过程中可以排除无意义的数据。
下面这2个红旗就是通过自动化平台所发现,图片的画风其实和我们真实场景中的差别非常大,就属于一些无效数据,或者说噪音数据。
平台自动检测出后,就会在训练模型前帮你剔除。
然后便开始模型自动化训练,平台会根据部署资源的要求,为开发者自动推荐最合适的训练算法和策略。
这一环节中,就不需要开发者自己去学习到底应该怎样去选择算法或者调优模型。
接下来便是算法调优分析,Brain++集成十余大类不同的结果分析和对应的调优策略,比如漏检/误检结果呈现。
当红旗检测模型训练完成后,将其放到实际应用场景中测试,黄色框就是一次训练后的算法检测出来红旗的位置。
说明这一算法存在明显误检问题,特别可能在这样的一个场景误检率比较高,AI生产力平台便可帮助开发者自动发现问题,并给出针对性优化建议。
总的来看,当我们分析完想要做一个旗帜的检测需求之后,首先需要2个小时来做一个图像的质检和旗帜的标注,之后选择一个GPU的训练环境,模型训练的时间大概花费一个小时左右的时间。
在上线部署后,根据刚刚提到的分析和调优策略,研究人员进行了2轮左右的迭代,一个「旗帜检测」算法就诞生了!
你所感受到的便捷,是旷视通过总结过去10年算法生产落地的海量经验,探索出一套「快速、低成本生产算法」的模式,并将其沉淀在Brain++。
这十年,旷视AI创新走过怎样一个历程?
7月16日,由旷视首席科学家、研究院院长孙剑领衔的技术团队在2021旷视技术开放日(MegTech 2021)上分享了旷视十年来在AI技术上的实践和思考。
十年实践,首席科学家孙剑发AI「灵魂」三问
今年,是旷视成立的第十年。
我们来聊一聊旷视这十年的进阶之路。
首席科学家孙剑以旷视为例,总结了过去十年中国AI技术价值的发展历程。
2011年前后,AI发展的重点是基础科研。基础科研的关键点是突破单点算法,让AI率先在互联网等数字化程度高等领域应用落地,变得真正可用。
2015年起,AI需求越来越多,AI商业化落地也越来越多。这个过程中,算法在不断拓展应用的边界,从算法到软硬结合,AI创造的价值越来越大。
从2020年开始,AI成为新基建的重要部分,持续降低算法门槛,让AI生产变得更加容易,基础设施需要AI普惠化。
AI有没有用?AI在哪里用?AI易不易用?
这是AI行业的「灵魂」三问,是所有AI企业需要回答的问题。
孙剑认为,AI有没有用归根到底是看AI基础科研有没有突破。
基础科研是AI创新突破的基石,需要长期主义的坚持。
对旷视来说,要构建科学价值和产业价值统一的基础科研体系。
十年来,旷视不断突破创新:
在学术上发表85篇顶级会议论文,在竞赛上斩获40项冠军,在实用上研发了包括ShuffleNets系列在内的众多基础模型,已经广泛应用在手机等智能设备上,推动软硬协同发展。
基础科研有了,落地才是科研的价值,这就需要解决「AI在哪里用」的问题。
对于旷视,一直瞄准的是消费物联网、城市物联网和供应链物联网三大场景。
AI是核心能力,IoT是落地场景,在数字世界与物理世界融合的智能化时代,AI算法正在为产品带来更多的价值提升。
旷视认为,「算法不只让很多产品从好变更好,更能让产品从不可能变可能。」
在旷视十年的AI实践落地中发现,算法已不再仅仅是「软件物料」,而是成为「核心组件」。
从科研到落地,算法正在创造越来越大的价值,也在开始重新定义软硬件。
旷视研究员范浩强在MegTech 2021上的分享
AI落地是我们所有人都在讲的问题,但是当前,大量算法生产过程还是非标准化。因为非标准化所以算法生产过程充满不确定性。
旷视认为,落地实用是检验算法的最高标准之一,而生产落地实用算法的过程「只有先标准化才能自动化」,才能更进一步实现规模化的普惠易用。
从2014年至今,持续打磨升级的AI生产力平台Brain++,就是旷视推动算法生产迈向自动化时代的AI基础设施。
为什么是旷视?
不是炼丹「上瘾」,是AI进化
旷视是一家靠算法起家的公司。
准确来说,可以细分为两类:
一类是以深度学习(DL)和计算机视觉(CV)为基础的核心算法。
另一类则是行业算法 (或者称AIoT算法)。
旷视的算法之路,经历了从核心算法突破,到行业算法落地和创新,再到算法生产平台的拓展过程。
MegTech 2021上,旷视展示了其算法量产星空图。
算法量产不是一个单一产品,更不是「上瘾」,而是一种生产模式的理念革新和生产力进化。
旷视现场通过一系列技术Demo演示,系统展示了其最新的技术成果。
旷视研究院推出了面向服务器和下一代AI芯片的通用模型RepVGG,其在开源后Github star已超过1800。
还推出全景视频实时拼接算法。
全景视频拼接的实现,需要多个摄像头在同一场景下采集不同方向视频,然后逐帧地将各个方向的视频帧拼接起来,最终得到360度全景视频,甚至360度*180度的球面全景视频。
其核心是运用基于光流的多摄AI拼接算法,同时依靠实时动态无缝拼接网络模型,解决了多摄拼接计算量大、拼缝明显,以及拼接无法动态更新的技术难题。
还有单目3D车路感知:仅用单目可见光相机,就可以实现车路信息的3D感知。
旷视MegTech 2021上还展示了,目前性能最强的端到端实时全卷积全景分割算法,以及挑战经典,目标检测架构创新的YOLOF。
从基础科研,到行业落地,再到基础设施,这是人工智能技术价值跃迁的三个关键。
旷视正是沿着这样的路线在不断创新,务实落地。预研一代、孵化一代、交付一代,这是旷视技术创新研发模式。
在技术开放日现场,旷视将这一套创新研发模式首次对外完整的呈现出来。
孙剑总结道,「聚焦最优秀的人才,一起做最好的科研,通过产品让科研成果创造价值,不断探索新领域,这是旷视的秘诀,也是AI技术价值跃迁的秘诀。」
对了,忘了告诉你,这是一个北京新晋AI网红打卡圣地。
不要太燃~