展会信息港展会大全

专访戴文渊:AI应该像Windows一样 让大众也能用
来源:互联网   发布日期:2017-12-05 09:18:30   浏览:46165次  

导读:第四届世界互联网大会昨日在乌镇开幕。会议期间,国内AI初创企业第四范式发布了企业AI核心系统先知3.0版本,大幅降低了人工智能应用的开发门槛。不同于先前版本的全流程学习平台,先知3.0包括数据、算法、生产三个核心,能够帮助AI技术进入企业决策层的核心...

专访戴文渊:AI应该像Windows一样 让大众也能用

第四届世界互联网大会昨日在乌镇开幕。会议期间,国内AI初创企业第四范式发布了企业AI核心系统"先知"3.0版本,大幅降低了人工智能应用的开发门槛。不同于先前版本的全流程学习平台,先知3.0包括数据、算法、生产三个核心,能够帮助AI技术进入企业决策层的核心系统,也就是帮助企业建立自己的AI应用技术。发布会后,第四范式CEO戴文渊接受了媒体智能的专访,谈及他如何打造了AI时代的Windows系统。

以下戴文渊专访实录:

记者:先知3.0系统相比之前的版本最大的改变是什么?

戴文渊:先知产品是去年7月20号第一次对外发布,但其实当时的版本已经是2.0版,因为之前1.0版已经在某全国性股份制银行适用。

今年3.0版先知最大的一个定位改变,是把先知定位成“企业AI核心系统”,为什么要这样子改变?是因为我们越来越发现企业需要不仅仅是一个算法或者一个系统。一直以来,第四范式在做的事情都是要降低企业使用人工智能的门槛。在早期,我们把先知的目标设计为降低算法门槛和系统的门槛,所以一直到先知2.0,先知的定位都是低门槛的机器学习开发平台、低门槛的人工智能应用开发平台。

但是我们发现这样仍然不够,一个企业如果想要很好地应用AI能力,除了要降低机器学习的门槛外,外围还有很多的工作要做,所以先知又扩展了自己的外延,我们打通了从数据到业务的闭环,将机器学习产生智能的能力,与业务环节连接,形成了一个“机器学习圈”。围绕着“机器学习圈”,我们重构了整个先知的使用方式,让企业能够更清晰、更便捷地产生智能应用场景,这就是先知3.0想要达到一个效果。

记者:我们是如何选择客户的?目前为什么选择金融和医疗这两个领域?

戴文渊:我们的目标一直都是要帮助全行业惠享人工智能的福利,我们的愿景是AI for everyone,我们并没有说主攻哪个行业,当然现在来看有些重点的方向,比如说像金融、互联网、医疗,这些是我们更重点来关注的企业,但是我们并没有说只是做某一个行业。

其实从行业来说,金融是个很特殊的行业,金融并不是一个具体的行业,金融和科技一样,都是能够去服务其它每一个行业的,一个企业既需要金融的支持,也需要科技的支持,我们先服务好金融,也是我们服务好其他行业的一个基础,当我们服务好金融以后,我们其实可以切入到其他的行业,再切入到其他行业的时候,我们会使用科技和金融结合的方式去服务这些企业。

记者:先知3.0是要打造像TensorFlow这样的系统吗?这个理解准确不准确?我们跟他们差异是什么?

戴文渊:实际上我们比TensorFlow要宽得多。今天我们把先知定位成企业的AI核心系统,这个核心系统其实会有三个核心——数据核心,算法核心,还有生产核心。我们算法核心里面会分这么几个层面,一个是低门槛的算法,其核心算法是由我们自研,第二部分是我们也会充分地去集成各种各样开源系统,TensorFlow相当于是其中一部分。所以我们的产品并不仅仅是一个TensorFlow,而是帮助企业构建一个完整的智能能力的闭环,这个智能能力的闭环当中,可能会有一个环节,如果企业想用TensorFlow,就可以把它接入。企业可能在这个环节需要使用的不是TensorFlow,所以我们还配会有更低门槛的算法,会更适用一些业务人员去开发机器学习。

记者:我们给企业提供AI的时候,我们为什么想把这个门槛降低呢?因为在我看来好像人说专业的人做专业的事情,我们其实降低了门槛,也不可能真的让行政每天过来做开发?

戴文渊:其实真的未见得,我跟你说一个夸张的事,我们公司的行政都能开发AI,当然前提是在我们这个平台上。假设您有个APP,我能把它变成千人千面,这个门槛已经低到今天不需要一个科学家来做,在先知上面,哪怕是我们公司的HR、行政的同事都能够做。

记者:你们最终目标是什么?

戴文渊:为什么干这件事?因为未来AI应用应该是遍地开花,但科学家是少的,科学家一定是小众人群,从来没有说世界上有一大批人都是科学家,所以如果要依赖科学家去做应用,AI一定不能发展起来。所以未来我们希望这些应用背后都是由AI驱动,就必须要让大众能够去掌握人工智能的能力,这个时候就不叫专业的人做专业的事了,或者说未来在这个专业应该有更多的人。就好像现在的民航的飞机,经过培训的飞行员都可以飞,而最早莱特兄弟的飞机只有他们自己能往上飞,这就是很大的差别,所有科技都是需要慢慢朝大众化方向发展。就像汽车,现在考个驾照不那么难,仍然有人没有能力去考驾照,但是如果无人车出现了,那就没有驾照也可以了。

记者:不同的行业,它的数据采集标准应该是不一样的?

戴文渊:对,不同的行业标准不一样,我们定义了产生AI能力的数据的采集标准,并且我们提供了工具,然后能够帮助企业正确采集到AI所需要的数据。比方说金融领域反欺诈场景,过程数据我们要采集交易授权,反馈数据我们要采集投诉。

记者:之前我跟您聊的时候,先知还在2.0时代,您说您先知系统要打造AI时代的一个windows,现在做到了3.0版本,距离这个理想到还有多远?

戴文渊:其实更近了一步,在先知2.0就好像没有资源管理器的windows,虽然我们提供了核心的计算能力,核心的数据储存能力,但是在之后和客户磨合的过程当中,我们发现需要更多地关注资源有没有管理到位,数据有没有提供正确?所以为什么我们今天要把整个闭环管理起来,这样我们会更容易能够去提供出一个准确的AI应用。

记者:你们的商业模式是怎样的?

戴文渊:百度可以把语音识别免费,但是百度不能把百度云免费,一个是边际成本为零的事情,一个是边际成本不为零的事情,未来所有的边际成本为零的事情都是免费,但是边际成本不为零的事情不会免费。

记者:很多互联网巨头都在打造自己的AI平台和系统,先知系统在我看来就很特别,但与其他的AI平台有什么不同?

戴文渊:我们的目标是降低企业使用人工智能的门槛,但是我们一直在调整产品,目的是提供更多的服务。我们不是一定要去跟别人去对比说,你也是平台,我也是平台。讲平台是一件很容易的事,我做什么东西都可以说自己是平台,关键不在于是不是平台,关键在于你在解决什么样的问题。因为我长期在帮助企业去构建AI的能力,我会发现其实很多企业,它其实构建AI能力非常困难,这个困难体现在很多地方,包括算法的层面,包括系统的层面,包括认知的层面,今天我们已经解决了很多问题,但是其实我们仍然需要解决更多的问题。

记者:如果比如说有一个企业它想用你们的系统建立AI自己的核心系统,它提供的数据,如果想用语音的模块,还有视觉的模块,这个东西是你们来提供还是他们可以接其他的平台?

戴文渊:语音和视觉是先知3.0可以产生的模型,我们的系统构建一个语音识别的闭环,就可以产出语音识别的能力。在这个语音识别的闭环中,“行动”就是语音识别的一个过程,“反馈”就是说识别结果对还是不对,然后基于这两部分数据,机器学习就可以产生一个语音识别的模型。其实我们已经在帮助企业构建像手写识别的能力,人脸识别的能力。我们不一样的地方,是我们让我们的客户自己拥有产出了机器学习的能力,而现在市面上绝大多数AI公司,你不需要有机器学习的能力,你买我的服务就行,这是完全不一样的产品定位。

记者:假如说我有一个公司,我就觉得现在公司考勤这个环节,就特别地麻烦,因为现在考勤有各种各样的刷指纹,如果我用你这个可以怎么解决?

戴文渊:如果识别人脸就这样,您把您公司内所有人的照片给到我,并且每个照片对应的是什么样的人,输入到我们系统里,就生成了一个您公司的人脸识别模型。不过这个模型非常针对于您公司特定的问题,不是一个通用的人脸识别的问题,不能识别别人公司的人脸。而是只能解决你们公司的问题。

记者:企业利用先知系统自己做,跟我们去买一套方案相比的话,哪一个成本更低?

戴文渊:其实有两种解决方案,一种是咱们买别人的,就是找一拨人来替我做。另外一种我自己做,我自己做的话,其实门槛最大的问题,我能不能招到足够的人才去做这样的事情?如果说我采购一个平台,以后我就自己能做了,那其实是一个非常好的一件事,因为实际上应用会非常非常多,过去可能没有人做。比如在我们与某全国性股份制银行的合作中,银行内部员工就利用这套AI核心系统在其它20多个日常的运营业务场景中提升效率、发挥价值,有很多场景是这在没有这个系统之前是不会想到去优化的。

其实,先知系统的方案成本一定是更低的。不过我认为目前AI最大的问题还不在于成本,或者是怎么降低成本,最大的问题是没有足够多的人去做,AI应用方面其实能想到的方向与场景特别特别多,做都做不过来,但是因为只有一部分人会做,而那些人现在特别抢手,所以有大量的需求被压抑着,跟成本相比,我觉得能做是现在更需要解决的问题。

记者:这样一个企业级的核心系统,最难的地方在什么地方?

戴文渊:首先第一点是你的出发点,做企业级核心系统的出发点是,你必须时时刻刻心里想怎么去帮助这些企业解决问题,这是前提。其实我们在做这个过程当中,我们关注的不是说我们要推一个什么形态的平台,第一点最重要的是要解决企业什么样的问题,之后每天都要思考离解决这个问题还差什么。要解决的问题还差的部分,我们怎么来帮助。

基于这个出发点,我们发现,企业用AI首先要解决算法的问题。在过去的三年,我们投入非常多的精力研发低门槛的机器学习算法。实际上整个学界并不研究这个东西,学界研究的都是说效果更好的机器学习算法,哪怕说这个效果更好的机器学习算法,全世界只有一个人用,只有效果更好就可以了。而第四范式研究的是什么呢?假设我的算法跟你的算法哪怕一样好,但如果我这个算法能有多10倍的人会用,我认为这个事情是值得去做的事情,这就是围绕着我们的目标、我们要做什么。其次,在算法之外,怎么去定义人工智能的数据标准,以及构建这个数据采集的能力也是很重要的。

让团队瞄准企业确实很困难的点,围绕这些困难不管有多少的问题没有去解决,我们都要去把这个问题解决,我觉得这个出发点是很重要的。

其实在解决问题的过程当中,我们当然也组建了世界领先的团队,就像在解决哥德巴赫猜想的过程中会冒出很多世界领先数学家一样,我们现在也很自豪地说,我们在很多领域,包括在算法层面,特别是低门槛的机器学习算法层面我们是走在世界领先的;在系统架构层面,比方说多维的系统架构,这个多维是多达上亿维的系统架构,在这个基础上还要做到实时处理。实时现在其实已经门槛并不是那么高了,但是现在市面上所有的实时,都是低维实时,比如说一万维我做到毫秒级,这并不是很大的问题,但是如果万亿维仍然能做到毫秒级,业界其实也就我们现在能做到。

记者:您如何去维护先知的系统生态,当你们面向一些企业级的用户做开发者平台、开发者社区,怎么去做?

戴文渊:一个开发平台,上面一定是要有生态的,我们在去年推出了一个计划,叫做“范式大学”,范式大学的定位是,我们会用四天的时间(今年年初的时候是一个月,到今年下半年,我们把它优化到了用四天),在先知平台上培养出一个数据科学家,一个合格的数据科学家。当然这还不够,科学家并不是一个零到一的问题,咱们可以从四天时间从零到一,但是未来他还需要从一到十,从十到一百,所以四天以后我们还会有一个计划,是“范式大学”计划的长期版。您通过四天的培训以后,从零到一,您会结识一个导师,这个导师能够长期帮助您不断去提升,这就是在从一到十,从十到一百的过程,永远都会有一个人帮助你提升,遇到什么困难的时候会有人在旁边去提醒你或者点拨你,帮助您最后成为一个一百分的数据科学家。

记者:您怎么去定义“范式大学”这种模式呢?

戴文渊:这个模式其实就是,一开始我们有个种子,我们从两三个人发展到一个三四十人的团队,现在我们开始有信心能把三四十人的团队往外开展,让三四十人成为更多的范式大学学员的导师,把他们培养起来。未来这些学员当他从一到十、到一百的过程中,很多学员也能成为导师,我们又可以吸纳更多的学员,这样就慢慢地,整个的AI科学家的团体就会变大。

记者:请您总结一下今年第四范式成果?明年对于先知系统的期待是什么?

戴文渊:今年其实是一个先知平台大面积落地的一年,你们如果关注我们公司报道的话,我们最近也有些标杆客户不断在落地,基本上来说也都是国内最顶尖的、标杆性的客户,这是今年做到最重要的一件事情。

明年其实我们需要从标杆客户往整个世界去覆盖,所以我们为什么也在紧锣密鼓地去培养我们的生态,因为要覆盖整个市场需要的更多的人才。(完)


赞助本站

相关热词: 戴文渊 windows ai

AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港