前段时间做“关注人工智能系列报道”,有人推荐我采访依图科技的创始人兼CEO朱珑,他的简历很让我感兴趣。一是他的教育背景。加州大学洛杉矶分校统计学博士,师从Alan Yuille教授(艾伦`尤尔,计算机视觉学界奠基人之一,也是霍金教授的得意门生)从事计算机视觉的统计建模和计算的研究,之后在麻省理工学院人工智能实验室担任博士后研究员,2011年获得国际计算机视觉算法竞赛“图像目标检测”项目冠军。无论是师从的导师还是所在的实验室,都在AI领域赫赫有名。
二是他在做AI(人工智能)创业,而且是在2012年AI还没有热的时候就开始创业。所以关于全球AI的发展、关于AI创业,我想朱珑应该有很多值得关注的信息。
因为朱珑在上海,所以第一次约的是电话采访,但效果不理想。在朱珑出差北京的时候,又有了一次面对面的交流采访。采访前30分钟交流的是AI(人工智能)业界话题,朱珑给出的核心信息是这一轮的AI热潮是“深度学习”(deeplearning)带来的,其他的AI方法、技术、流派通通过时,甚至包括现在已经取得很多商业成功的IBM的Watson体系,也没入他的“法眼”。
这与上次对他电话采访时观点一致,我并不完全认同朱珑的观点,目前通用的AI技术没有出现,任何流派都有它善于的领域,考量它得看解决问题的成本和效率。基于此,我想关于业界话题和AI流派之争继续交流下去,恐无其他答案。
于是决定停止AI业界的话题,把采访转向朱珑的创业,因为任何观点最好的证明是要看它解决问题的效果。依图科技刚刚拿了几千万美元的B轮融资,从天使轮的真格基金,A轮的红杉资本、高榕资本,到B轮云峰基金等,也都不是钱多了没事随便乱花的主,投资人不会仅仅看朱珑的教育背景而一投再投,朱珑和依图身上有什么可以复制的AI创业经?
市场的“痛点”在哪?公安局长给三分钟时间
朱珑首先进入公安领域既有必然性也有偶然性。对于创业者,如何把一个看似稍纵即逝,只在眼前闪了一下的偶然性变成必然性,紧紧抓住是关键。
2012年的时候,AI没有现在热。尽管在2010年,IBM的AI系统Watson已经在美国电视《边缘游戏》节目中战胜人类赢得冠军,但还没有像今年谷歌AlphaGo与李世石下棋那样,引来全民关注。在美国Yann lecun(FaceBook人工智能实验室主任)实验室做研究的朱珑还是闻到了“AI要来”的气息。
尽管当时很多同学毕业去了华尔街,朱珑也可以在博士毕业后去做教授,但朱珑还是决定回国,并找到了当时在阿里云平台做技术负责人的同学林晨曦,准备一起创业。因为朱珑觉得做了这么多年的机器视觉研究,要想创造价值还得放到具体的业务应用场景中、以解决实际问题来创造价值。通常把理想变成现实最好的路径就做公司,用产品化的方式解决问题。
问朱珑为什么觉得2012年的时候机器视觉的工业化应用已具备条件,他没按常理给出“数据积累、需求、算法技术成熟”等等的逻辑答案,只是说虽然当时深度学习还没有被产业界广泛采用,但是有一种感觉就是它离产业化非常近、非常近了。“就是那样一种感觉。”
通常“学院派”出身的人更喜欢分享产业话题。但是两次接触下来感觉朱珑则刚好相反,很多事情在他看来就是“一种感觉”,如果大家在一个层级里,你能够懂得这感觉,但如果不在一个层级里,说再多似乎对方也不会懂。“要想有大师一样的视觉,得有大师一样的积累。”而在现实的世界里回答问题,得要拿实际解决问题的效果说话。朱珑说他和中国行业客户打交道,“如果你拿不出特别好解决问题的效果来,他们特别瞧不起你。”
目前看,现在AI创业的机会在2B的行业市场,因为有需求、有购买力。而从机器视觉的创业机会来看,市场机会在行业监控市场,这个市场有巨大的刚需,无论是金融、保险还是城市管理或是安防等都有旺盛需求和很多痛点。在几个可选的行业中,应该说朱珑首先进入公安领域既有必然性也有偶然性。从必然性来看,公安刑侦破案需要大量的视频、图像的比对需求,尤其需要从海量视频监控数据中精准、快速找到要找的犯罪目标,目前国内在这个维度与国外技术相比还是相对落后的。从偶然性来看,这与苏州市公安局副局长所给出的“三分钟”见面机会密切相关。对于创业者,如何把一个看似稍纵即逝,只在眼前闪了一下的偶然性变成必然性,紧紧抓住,是关键。
在各种市场机会的切入中,朱珑透过各个渠道找到了苏州公安局主管技术的副局长。副局长只在课间休息给了朱珑三分钟见面机会。看着朱珑的一大堆“学术”背景,全球三大AI实验室的博士,图像目标测试的冠军,局长说:“好呀,我们现在套牌车的识别率不到30%,如果你能将识别率提升到70%,我就考虑用你们的。”因为很多名牌大学都没把这个课题做下来,局长只认效果。学术背景只能“敲敲门”,能否进来还得看你的“砖”够不够“硬”,副局长给了朱珑几个星期的时间。
找到“魔鬼”和捅开“窗户纸”
如何捅破问题的“窗户纸”?怎么优化、取舍、结合?怎么把“魔鬼”找到?需要物理学家精准描述世界的气质和找到“魔鬼”细节的感觉。
接下苏州公安局长话的活儿,朱珑和林晨曦他们做了几个维度的事情。一是研究实际应用场景,找到解决问题的关键维度。其二把图像识别理论和产业难题和业务结合,变成这个应用场景的算法模型。“AI不是产品,它需要和具体的应用场景结合,解决具体问题。”一个算法模型并不适合所有的应用场景。这两个维度都非常关键。
就像网吧监控和道路行车监控需要捕捉的关键点就不一样,车牌识别之所以识别率不高,事实上选择识别的维度同样是关键。在过去对车牌的识别焦点主要车牌上,光线、车速,都会影响它的识别效果,而且还有很多套牌车,随时换牌。
朱珑他们想到如果能够将“车牌”与“车脸”同时识别,其识别率精准率就大大提高。因为很多套牌车常常会更换车牌,但是“车脸”和“车型”却不能更换,主流车型就那么几十种,“车脸”就那么几十种种,依图是第一个想到把这两个维度结合在一起的。就像人对一个车第一眼的识别和记忆一定是“车脸、颜色、车牌”同时摄入而不只是去盯着车牌的道理一样。
似乎想到“车脸”这事不是难事,但很多事情就这么一层“窗户纸”,当所有的人都把注意力集中在车牌这个“死胡同”出不来的时候,谁能够跳出想到其他关键维度,这个灵感就是那种说不清楚的“感觉”。这个感觉应该来自两个维度,除了朱珑在各AI名师下“耳语目染”的积累,同时也应该与他们每天见5拨警察,和他们几乎是泡在一起,体会他们的现实场景和工作场景的“悟道”有关。
我搜索依图科技的公众号,看过一段朱珑与上海交大学生做讲座的视频,有几个印象很深的信息。一是朱珑说Alan Yuille给了他物理学家精准描述这个世界的“气质”。
他谈及了他的导师Alan Yuille教授,这个霍金的学生,物理学博士毕业,既在UCLA统计系任职,同时又在心理学系、计算机系、精神病学、生物行为学系任客座教授,研究过量子引力、机器视觉、生物视觉、神经建模、认知模型等。朱珑说:“这个导师给了我不一样的物理学家精准描述这个世界的气质,一种不一样的颗粒度。”
很多人应该会觉得朱珑认为导师给了他“物理学家描述这个世界的气质”,这个说法比较有趣,通常很少有人说导师给了自己一个气质。不过应该说朱珑的表述是精准的,百度里关于气质的定义是就是“表现在心理活动的强度、速度、灵活性与指向性等方面的一种稳定的心理特征。”对事物感受的强度、速度、灵活性和指向性不一样,才能做出和别人不一样的东西,这确实是朱珑老挂在嘴边的“那种感觉”。
二是“idea is cheap”,魔鬼藏于细节之处。”朱珑说,不管是在学术界还是行业领域,在全球顶级的学府、实验室和企业中,每个创新的idea都是聪明人都会想到的,而在英雄所见略同之后,决定成功的关键在于执行的每个细节中,这是由数学、物理、工程等基本功体现出来的。
几个星期之后,朱珑何团队是如期做到了超过局长希望的识别率,超过了预期,也敲开了公安领域的门。除了车,后来依图又做了人脸的识别,有一个数据,依图人脸识别系统在武汉公安局的实现证件照首位命中率是97%,盘查照对比首位命中率是94%,识别对比命中率是全球领先水平。四年时间,目前依图的产品进入了公安、银行、保险、海关、电信、地产等,从识别车、识别图、识别人脸,从抓嫌犯到保平安到城市管理以及智能硬件。
为什么朱珑能够把识别率做到更好,仔细体会朱珑讲过的这些话,里面有“秘籍”。现在有很多行业的痛点,如何捅破这些“窗户纸”?怎么优化、如何取舍,怎么结合,怎么把“魔鬼”找到?这其中的“玄机”或许从朱珑的话里你会有启示。
IBM在对未来技术创新趋势分析中这样认为:未来新一代信息技术比较大的创新机会,一是在IT基础学科领域,二是在IT与行业结合点上。正是这个IT与行业的结合点,是难点也有大量的机会。比如要做输变电的创新,IT人就必须爬到电线杆上去。朱珑和他的团队就得“泡”在公安的各种场景里。只有这样才可能找到“藏在细节里的魔鬼”。
记者曾经采访IBM研究院Watson项目的研究院员,IBM一开始做Watson的时候,把业界最好各个细分领域的技术成果放入系统中,机器人回答问题的精准率并没有提高多少,却是通过不同方式的配比和调优和取舍,最后准确率不断提升到99%。
朱珑的下一个“尴尬”
进入医疗领域有几个难题,一是怎么解决医疗资源、数据源的问题,怎么把医疗经验和计算机结合?二是怎么让医生建立对机器判断的信任问题?
朱珑没有透露目前依图的销售收入。从依图官方介绍信息上看,依图目前员工是100多人,人均估值超千万美元,按照这个数字推算,依图的目前的估值超过10亿美元。目前依图还在招兵买马中。下一个领域朱珑最想做的是什么?
朱珑说了一件“自己像傻子一样”的尴尬事。去医院看病,费了很多时间取号排队,见了医生,只是几分钟就把他给打发了,开了几盒药。“什么病?什么原因?怎么得出的结论?为什么开这些药?这些药和其他同类的药有什么区别?疗效怎么样?对于我适用吗?”所有的问题全部没有答案,就领了一堆药回去了。“一个顶级的IA科学家在医疗领域看病的时候完全就是一个傻子。”
“我得解决人在生命面前变成医学‘文盲’的这个脆弱”。朱珑决定进入医疗领域,从识别医疗图像入手,怎么就知道这个片子上有病灶?怎么就知道它是不是癌症?朱珑给学生做讲座的时候说过一句话,人眼不容易分辨出双胞胎的细微差异,但是计算机很容易就分辨出来,机器可以看到人眼看不到的东西。AI应该帮助医生提高诊断质量和盖上患者就诊体验,朱珑接下来想重点做这个事情。
进入医疗领域有几个难题,一是怎么解决医疗资源、数据源的问题,怎么把医疗经验和计算机结合?二是怎么让医生建立对机器判断的信任问题?记者曾经采访过英特尔中国研究院院长宋继强谈及IBMWatson在医疗领域的推进,宋继强认为,目前Watson最大的成果是已经建立起医疗机构、医生对Watson的一定的接受度和信任度。
大公司有大公司的玩法,创业公司有创业公司的路数。朱珑曾经说,目前各大公司在AI上的水平怎么样其实他清楚,因为在这些公司的做AI核心人是他的同学或做研究的前同事,这个人在做什么,水平如何,能做到什么程度,彼此清楚。
所以在不在核心圈子,是不是关键人很重要,对于进入一个新的领域也应该同理,都要找到对的核心人。就像当初朱珑找林晨曦,除了他俩是同学对路子外,林晨曦做云计算,有大规模分布式计算的能力,和朱珑的机器视觉能力互补,计算能力和AI能力是图像识别都需要的两方面。接下来朱珑会找一个有医疗核心资源的人。
“一个人是不是我想找的人,是一种感觉,交谈10分钟能够知道。”朱珑说有了第一步才有可能有第二步,只有解决了第一个问题,把东西做出来,效果显现出来,才有可能建立信任度和接受度的问题。创业公司要做的不就是把一个个的“0”变成“1”吗,有了“1”才有可能“2”有“3”,“3”生万物嘛。什么时候创业都有机会,因为这个世界永远都需要更便宜、更高效的解决之道。