微软最近公布了一篇关于图像识别的研究论文,在一项图像识别的基准测试中,电脑系统识别能力已经超越了人类。人类在归类数据库ImageNet中的图像时错误率为5.1%,而微软研究小组的这个深度学习系统可以达到4.94%的错误率。在微软发布论文前一个月,百度也曾发表过自己的研究成果:百度使用了自家的超级计算机系统,识图错误率为5.98%。而在这二者之前,识别ImageNet图像数据库的最好成绩是由谷歌在2014年创下的,当时谷歌深度学习系统的错误率是6.66%。
“据我们所知,这是电脑第一次在图像识别挑战中战胜人类。”论文中说,“但是,我们的算法仍然会在某些地方犯错而不如人类,尤其是那些需要联系背景理解或需要高层次知识的情况。”“这样的成果并不能说明机器视觉已经大体上超越了人类。虽然如此,但是我们相信,在执行许多图像识别任务时,机器算法仍展示了它未来巨大的潜力。”一位名为孙健(音)的微软研究员在微软博客中通俗地解释道:“对于人来说,区别一只羊和一头母牛没有任何问题,但是电脑在处理这种简单任务时并不完美。然而电脑在某些方面却具有优势,科学家们可以训练电脑去观察图像的细节、纹理、形状和背景等无法被人类观察到的细节,比如它能够识别不同羊的品种,这是它超越人类的地方。”