优图实验室是腾讯最为成功的AI 实验室之一。只要涉及人脸识别和图像识别功能的腾讯应用几乎都有它的身影,比如QQ,QQ空间,天天P图,人脸支付,AI医疗等等,你也许并不知道,事实上它已经融入我们的日常生活。
撰稿 陈乐 王晓晶
长久以来,儿童拐卖案一直是公安机关的巨大难题:案件跨度常常超过10年,孩童相貌变化快,又不曾留下任何生物学特征,因此过去许多年里,真正破获的儿童拐卖案非常有限。
但在2018年底,因为一项新技术的应用,四川省的一起重大积案轰动全省的426案在短期内获得突破,当年被拐卖的13名儿童中有10人确认身份。破案中应用的“跨年龄人脸识别技术”,如今的识别精度已经进化到96%,极有可能让带给千万家庭痛苦的人口拐卖成为历史。而创造这项技术的,是一个叫优图实验室的机构。
9月一个下午,在上海漕河泾开发区软件园,我穿过安装了人脸识别的门禁,去探访优图实验室,这个腾讯最为成功的AI 实验室之一只要涉及人脸识别和图像识别功能的腾讯应用几乎都有它的身影,比如QQ,QQ空间,天天P图,人脸支付,AI医疗等等,你也许并不知道,事实上它已经融入我们的日常生活。
与想像中的酷炫风格有所不同,这里显得有点过于朴实了:一片密集的工位,然后是一个个格子间。在其中一个小房间里,我见到了优图的总经理吴运声。他身材清瘦,声音低哑,但言语间流露出一种坚硬。“优图一直是充满危机感的”,他说。
腾讯优图实验室联合负责人吴运声(中)和团队成员。供图:腾讯
这多少令人有些惊讶。人们往往以为,技术的创新只关乎技术人员的智慧与灵感,并没有意识到,它可能还来自于一个团队长达数年的艰苦战斗,危机中自我保存的本能,来自于一种要创造价值的现实主义情怀。
我和优图多名工程师进行了交流,请他们讲述了优图的故事,那是一个典型的腾讯式的故事。这要从2012年,他们濒临解散说起。
成为冗余
回想起那一年,人们也许会记得腾讯历史上第二次架构调整,宣布迈向移动互联网的大潮;却很少有人会记得,在那次大型转场中,一个曾被寄予厚望的技术组织腾讯研究院,宣告解散。研究院本意是发展长期技术,却因业务各有技术团队,研究院的技术无人使用,也便逐步瓦解了。先是蜕变成产品部门,然后产品也难以为继。
直到七年后,黄飞跃还记得每天回宿舍后那种迷茫的心情,“我是清华博士毕业,在学校水平还可以,动手能力也不差,怎么会这么失败?”他带着小团队在研究院做一款叫QQ影像的产品,日活曲线低位走平,员工曲线则不断下降,到最后几乎只剩他自己了。
他的领导吴运声也迷失在产品丛林里。他博士肄业,是那种总会冲到最前线的领导者。他已经意识到,没有配套,做产品的失败是必然的。他想了很久,既然是技术人员,那就应该维持本色。有一天,他们在新闻看到以色列在发展图片压缩技术,突发奇想,如果掌握这项技术,就可以证明自己的价值为公司节省带宽成本。
他们知道这家公司的风格,很多时候,没有命令告诉你必须做什么。很难说有禁区,全靠自己探索。团队在公司四处推销,请别人吃晚饭,恳请他们使用压缩技术不必付出任何成本,只要写一封邮件证明使用过他们的技术就可以了。就这样“求爷爷告奶奶”,他们拿到第一封邮件,然后是第二封,第三封。那种喜悦就像拥有一个真正新生儿,他们给项目起了一个名字,叫优图,黄飞跃想,将来无论散落在哪里,有了名字,它就有自己的生命。
研究院果真在不久后就解散了。因为压缩技术小有名声,优图被腾讯高级执行副总裁汤道生接收了。时隔七年,吴运声仍有一个难以忘怀的场景。那是在部门重组后的第一次答疑会上,老板们坐在对面一排,他则坐在底下,等待一个全新的开始。突然听到汤道生喊,“SIMON(他的英文名)坐到前面来。”就像瞬间接到了信号:请大家安心。
优图实验室专家研究员黄飞跃进行人脸比对研究。供图:腾讯
汤道生是一个敏锐的人,他总是小心翼翼保护着那些尚不明朗的新生事物,为他们腾挪生长空间,等时机成熟,他再去总办争取资源。
在腾讯,headcount(人员编制)是最值钱的东西。优图要来能干什么?暂时不清楚。汤道生把他们放在QQ空间团队里,那里是公司最大的图片聚集地。藏在一个大的团队里,就不那么显眼,他就有空间“腾挪”,优图实验室就成了一个“冗余”。冗余,就是你看不清它具体方向,但默许它的存在,这种有包容度的空间,马化腾称之为管理的灰度。像这样的“冗余”,大大小小分布在公司各处。
使出全力
对优图来讲,这是更好的选择,至少他们现在有了QQ空间的业务场景了。他们思考良久,决定往人脸识别的方向去攻克。当时人脸识别并不像今天那么火热,但从一开始,他们就想得很明白,“做一个技术一定要想它用在什么地方”,这几乎成了优图生存的第一法则。
就像推销压缩技术时那样,他们跑去说服QQ空间的产品经理去开发一个有关人脸的新功能。他们说,他们的技术能把人像识别出来。他们还承诺,所有的需求优图全给做好,策划给做好,接口也给做好,你只管拿去用如果说存在第二法则的话,那就是把合作对象当作你的客户。
在团队成员的印象中,他们每一次合作都使出了全力。不管什么需求,“我们都给做”,甚至为了让对方答应使用自己的技术,一些打杂的事情也可以帮忙做,因为做了之后,就可以跟对方说:“我都帮你把这个事情做了,我们的技术你就用一下吧?”
优图实验室科研人员拆解设备,攻克技术难题。供图:腾讯
在优图团队,会呈现出一种有些神奇的场景。博士也可以像销售一样跑业务,求别人用他们人脸识别技术还是免费的。慢慢的开始有人在内网上赞扬优图,他们跑过去问发帖的人,能不能把那个帖子置顶啊?渐渐地,找他们支持的团队越来越多,他们服务的业务部门超出了QQ空间,QQ音乐,还做了腾讯滨海大厦和微众银行的人脸识别。他们后来自己总结的时候说:那几乎就是“一个技术人员的本能”。
在腾讯,通常一个技术团队是依附产品存在的。一个成功产品背后必然拥有一个成功的技术团队。但作为研究院的遗产,优图既没有办法独立做产品,也没有办法只做研究不去落地。为了活下去,他们把自己变成了服务全公司的技术团队。
尽管优图的技术已经支持越来越多的产品和服务,但很多情况下,对于这些产品来说,优图的技术也只是辅助,而不是一个产品核心路径上的必备需求。这种情况也让优图团队成员感到忧虑,直到做微众银行人脸开户的项目。2014年微众银行做人脸远程开户,接触了几个团队,优图是最积极的。对优图来说,这是令人兴奋的机会,微众银行没有线下门店,只能依靠线上开户,自然人脸识别就成了业务中的核心。然而技术难度很大,也没有可以借鉴的案例,吴运声下令在两个月内攻克出来,为此还和技术人员相互拍了桌子,结果是自然而然的他们必须迎上去。直到验收那一天,一位国家领导人成功试验开户,他们才松了一口气。
到了下半年,他们已经进入腾讯滨海大厦的场景中了。那是一项全新的挑战,过去的场景大多发生在线上,而这次则需要获取海量线下数据;过去传统图像比对是1:1 ,现在则是1比数万。等到他们成功攻关,他们就积累了更多的数据和更好技术,不久后就去研究跨年龄人脸识别了,那是 1比数千万的高难度比对,是人脸识别领域一个公认的难点,特别是青少年阶段,人脸特征变化最大。
当希望利用新技术找到被拐儿童的需求转到优图时,他们其实还没有把握。世界上还没有过成功的案例。但优图实验室的总监李绍欣决心要全力以赴。很多个夜晚,研究员们消耗在这些事情上。他们加了数不清的班,提交了5个版本算法模型,其中大大小小的修改多达上千次。
打硬仗
浓厚的危机感下面,优图始终强调一种“打硬仗”的文化。
如今随着产业互联网战略展开,他们也进军TO B 战场,把技术能力开放给行业合作伙伴,而对手则是所有的人脸识别公司,战争也便升级了。给万达做智慧零售时,自己成员因为一个摄像头的点位,困在40、50度的风道里很长时间。
但他们都默认了要“吃苦”这件事。他们很清楚,打仗不仅仅是技术人员的算法角逐,更是一个团队的协作。每个案子各有困难,让黄飞跃很感慨的一件事是,有一次为客户做智能升级方案时,白天不让采集数据,他们只能晚上和周末去加班采集。那时天气特别热,晚上蚊子也很多,“管理的同事还专门买了一堆西瓜、花露水安抚他们。”
腾讯优图实验室团队合影。供图:腾讯
也在打仗的过程,他们不断充实自己的队伍。2016年AI热潮涌起,在一场汇报后,马化腾和刘炽平给了他们100个headcount,最终优图实验室独立出来,成为腾讯视觉研究中心。如今输出的行业解决方案超过15套,腾讯明星业务线接入超过90条,全球专利数超700项。
腾讯研究院失败了,优图却成了一个意外。我问吴运声,在这个艰难的过程中,始终支持着他的最大的愿望的是什么,他说:我希望有一个团队,它能做研究,能够做先进的东西,又能够带给你实实在在的价值。我希望优图一直能够朝这个方向去发展。
他们记得通过“跨年龄识别”首次比对出4个孩子的那一天,消息传来时,几名研究员正在如常地对着电脑写代码,他们激动地叫出了声,李绍欣一下子从凳子坐起来,“很惊奇,很惊喜”,另一位同事则干脆哭了起来。