本报记者 倪雨晴 广州报道
Alpha Go的胜利让人工智能的“深度学习”概念迅速普及,而率先打破“机器学习”、过渡到“深度学习”的节点便发生在图像识别领域。
根据平安证券的《通信行业人工智能图像识别专题报告》,图像识别分为生物识别、物体与场景识别和视频识别。据估算,到2020年,生物识别技术市场规模将达到250亿美元,5年内年均增速约14%。其中,人脸识别增速最快,将从2015年的9亿美元增长到2020年的24亿美元。
在各式的场景应用中,当下以人脸识别最为普遍,并且机器已经高于人类的识别能力。在两周前的《最强大脑》中,百度首席科学家吴恩达带着小度机器人和人类选手比拼,在人脸识别项目以3:2取胜。但是,在联想和常识理解的能力上,图像识别远未能和人类比肩,相关公司正在积极切入垂直行业应用中。
图像识别落地
图像识别背后的技术就是新的机器学习方式,即深度学习。具体来说,在数据的基础上,计算机自动生成特征量,而非人为设置特征量,然后计算机根据这些特征量来进行分类。
“相比2012年时的技术,这些年图像识别再次突飞猛进,”数相科技CEO邓立邦告诉21世纪经济报道记者,“从技术角度来说,入门容易,从0做到40、60分相对门槛较低,要提升到90分就需要深厚的模型。”
图像识别技术的迅速落地有多方面原因,一方面,很多大企业已经开源了基本工具,邓立邦谈道:“就人脸识别来说,有很多学术机构已经做了相当长时间的研究,发了很多论文,论文也已经接入到实际的应用中。但是人脸之外,例如情绪仍旧是比较难的话题。”
另一方面,产业链的更新迭代也为图像技术打下基矗平安证券的报告中提到,高性能的AI 计算芯片、深度学习算法都是推动图像识别发展的因素。其中,AI 底层架构从CPU+GPU 到FPGA,再到人工智能专用芯片,运行表现不断刷新,目前英伟达的DGX-1芯片在程序运行速度上比旧版GPU 加速解决方案快12倍。
图普科技方面也告诉记者,近年来,得益于计算机速度的提升、大规模集群技术的兴起、GPU的应用以及众多优化算法的出现,耗时数月的训练过程可缩短为数天甚至数小时,深度学习才逐渐可用于工业化。
应用场景多样化
尽管还未达到真正的人工智能,但日渐成熟的图像识别技术已开始探索各类行业的应用。此前图普科技CEO李明强就告诉记者,现在重要的是将人工智能切入到具体行业中,在垂直行业中获取和管理大数据。
据悉,在农林行业,图像识别技术已经得到应用。中国林产业协会非洲分会秘书长丁磊向21世纪经济报道记者介绍道:“木材的生产包含多个环节,过去这些环节往往牵涉到大量的人力投入。如今,图像识别已在多个环节中得到应用,例如森林调查,通过无人机对图像进行采集,再通过图像分析系统对森林树种的覆盖比例、林木的健康状况进行分析,从而可以做出更科学的开采方案。而原木检验方面,图像识别可以快速对木材的树种、优劣、规格进行判断,省去了大量人工参与的环节。”
平安证券在研究报告中举例道,在金融领域,身份识别和智能支付将提高身份安全性与支付的效率和质量;在安防领域,未来在仍硬件铺设到后端软件管理平台的建设转型中,图像识别系统将成为打造智慧城市的核心环节;在医疗领域,医疗影像基于人工智能的快速匹配可帮助医生更快更准确的读取病人的影像数据;在无人驾驶领域,低成本的摄像头加视频处理软件方案将为无人驾驶商业化打下基矗
此外,智能家居、电商等行业中,图像识别也有不同程度的应用。从目前的应用案例来看,以To B行业居多,当然不乏Face++等To C类产品。在深度学习之下,各公司面向不同行业,培育掌握不同知识的图像识别机器。未来,如何在图像的基础上收集、处理大数据将成为行业内各玩家的另一个比拼点。