区分外形一模一样的机器方法只需要看编号,但是直接从有机特征来区分人,这并不容易。就好像至今仍未完工的大教堂“圣家堂”的设计者高更所说,“直线属于人类,曲线属于上帝。”——人脸不光是由复杂的曲线所构成,还有毛发、痣等特征,而且随着年龄的成长、阅历的变化,人脸也会发生细微的变化。
不过,如果要机器/机器人在未来给特定的、不同的人提供服务,记住并认出一个人的脸是首要的事情,毕竟没有人愿意在和机器人聊天之前,还要输入一长串自己记不住的密码。
今年 5 月成功融资 4700 万美元 Face++ 是人脸识别领域倍受瞩目的新创公司。它所提供的技术服务,被糅合进多款亿级用户量的产品当中,包括支付宝的“刷脸支付”,美图系一系列产品(美图手机、美图秀秀、美颜相机),Camera360,世纪佳缘。
不仅如此,Face++ 还被中信银行、江苏银行、网商银行、积木盒子、拍拍贷、小米金融等金融公司采用,来验证客户的身份。
机器人认出人脸,之后?
2014 年上半年,Face++ 连续在 3 个世界技术比赛获得排名第一的成绩,显示出团队雄厚的技术实力,包括:
人脸检测(在照片中精准定位人脸位置的算法),在世界公开评测集 FDDB 排名第一;
人脸关键点检测(精准定位面部关键部门的位置),在世界公开评测比赛 300-W 排名第一;
在最重要的互联网图片人脸识别(Face recognition)比赛 LFW 中,Face++ 团队更是力压 Facebook 人脸识别团队(前被 Facebook 用 6000 万美元收购的 face.com 团队),获得世界第一。在极难识别的互联网新闻图片上,获得了97.3%的准确率。
印奇对爱范儿说,脸部识别归类可为两个大场景,“一个叫做静态的人脸识别,一个叫动态的人脸识别,静态的意思就说基本上是基于一张照片,和一个数据库来去做人脸这种识别和比对……第二个动态,基本上意思是说,基本上在这种视频这种监控的视频里,然后可能在人这种可能在运动的情况下,对它进行人脸的抓拍和识别。”
第一种静态人脸识别的技术成熟度已经很高,Face++ 的合作伙伴大部分基于这个类型,一个是识别人的脸部特征,从而实现精准的调整。比如在和美图系产品合作的时候,Face++ 就提供人脸检测、人脸追踪、关键点检测技术,让 app 可以精确定位人脸当中需要美化的部分。
二是实现身份的识别。2013 年世纪佳缘使用 Face++ 的技术,推出“最佳伴侣”通过人脸识别技术对网站的人脸数据库进行分析、精准配对,让世纪佳缘的会员可以相互匹配。因为在该方面技术成熟,Face++ 的技术还应用了支付宝的“刷脸支付”,以及各个金融公司的身份验证环节当中。
然而,在动态人脸识别方面,因为技术挑战难度更大,目前只达到相对可商用化的程度。印奇用解释了这方面的挑战,“从视频监控角度来看,有一类叫‘通道式’,比如放在机场安全门上的监控摄像头,它可以抓拍到大部分人的正面,所以它的动态人脸识别难度不高,可以只识别高质量的正面照片。不过,如果是在火车站这种开放式的场景下,动态的人脸识别的难度就很高了,一是分辨率低,二是角度千变万化,识别系统需要一套多张的照片结合 3D 建模和识别的方法来提高人脸识别的精度。”
印奇认为,Face++ 的发展有两个比较重要的里程碑,一是 2012 年将“脸部识别云平台”将这个概念产品化;二是在今年将脸部识别与金融行业的应用结合起来,“相当于将从一个比较泛的平台到一个可以被落地的场景化产品”。他透露,今年 Q4 Face++ 将发布几个新产品,预计也是团队的下一个里程碑。
Face++ 已经和中信银行、江苏银行、网商银行、积木盒子、拍拍贷、小米金融等金融公司达成合作,将脸部识别技术融合进他们的产品当中。印奇解释,金融公司将脸部识别当成高效、安全的验证手段,广泛运用在银行的各个业务里,包括柜面的辅助验证、以及高额放贷等等。
深度学习才是核心
Face++ 联合创始人印奇说,“脸部识别是一件很难的事情。”
人的容貌会随着环境的变化而变化,而且还会自己打扮自己,或者说随着时间而变化,胖子变成瘦子,瘦子变成胖子,这些因素夹杂在一起,会令脸部识别的难度变高。所以,脸部识别的真正兴起和深度学习的发展有深度的关联。这也是团队从成立开始一直着重的发展方向。
“深度学习是一个非常依赖于数据的技术”,印奇说,“在早期我们做人脸识别的时候,数据来源不足,因此内部开发许多数据系统,通过互联网的手段去爬娶标注大量有效的数据。所以我们其实相当于一步一步从前到后推演,开发一个很复杂的工具来解决前置性的问题。现在我们底层基础建设做好了,技术研发就相对顺利。”
“尽管中间遇到一些困难,但在遇到困难的时候,团队的士气反而高昂,大家都是喜欢挑战的聪明人,另外我本人比较好胜,在遇到困难的时候,会更加注意激发团队的潜力。”
——如果说人脸识别是一种“招式”,那么“深度学习”可视为一门“心法”。当 Face++ 团队在深度学习上深耕的同时,他们也可以将这个技术应用在更多的方面。印奇说,“Face++ 是我们团队推出的第一款产品,我们母公司叫旷世科技,专注与计算机视觉、图像识别这个大方向。现在计算机视觉有一个概念叫‘云 + 端’,云端是智能化的识别引擎,而在端的方面,各种新兴的传感器、包括更好的摄像头等等,我觉得有非常大的机会。”
三个创始人的创业理想
实际上,旷世科技的三名创始人都是清华大学姚期智实验班的同学。印奇在大二的时候就在微软亚洲研究院做计算机视觉相关的研究工作。一年之后,印奇准备出国读博士,在那个时候他与另外两名创始人创立了一家公司继续深耕计算机视觉领域。不过,印奇与其他两名创始人讨论,“做未来的机器视觉,就相当于我们为机器打造一双眼睛,那么可能光靠算法和软件部分的技术知识是不够的,同时要懂这个眼睛的这些硬件和光学相关的东西。”
后来印奇到哥伦比亚大学读博士,导师是相机设计领域是一名权威。不过 2 年后因为公司发展到了比较重要的阶段,他辍学回国创业。
如今 Face++ 的公司战略的制定,得益于印奇在哥大培养了对计算机视觉领域整体脉络的把握。另外,在哥大,他也学习到了如何将一个产品说出一个好故事的能力,“在国外来说,其实如果讲好一个故事是相当于,是你能够真能理清这一个技术或者产品它未来其实最核心的特征,它的应用,它的需求,也能把这个东西用一个非常好的形式能表达给大家,所谓创业方面,这样的思考的纬度和加上能力很重要。”
当脸部识别技术发展成熟,未来会有更多的想象空间。印奇对爱范儿说,“互联网之前应用的人脸识别更多是娱乐化的应用,现在特别刚性的需求还没有出现,我在想也许未来可能会有些比较好的这种产品的这种应用的产品,所以我现在看到比较大的机会,在于大的传统领域,金融领域,社保领域,安防领域,从这些领域里面,未来一到两年的时间里存在爆发点。当然在未来,比如说能跟一些像无人机这种出来的智能机器人都结合,大家一定相信这是个未来更大的方向,但是具体的应用场景,我觉得需要我们去和这些新兴的这种设备的厂商去共同的去研发。”
最后,作为一名创业者,印奇有句话希望分享,“创业的过程是很美好的,但是我觉得适合创业的人并没有那么多,所以大家一定要想清楚自己为什么要创业,或者为什么能创业,想清楚了再去做。”