谷歌的人工智能研究人员最近展示了一种新的训练方式,可以让计算机理解为什么有些图像比其他图像更美观。
传统上,机器会使用基本的分类——比如判断一个图像是否有“猫”。新的研究表明,现在人工智能可以对图像质量进行评分,不管类别是什么。这个过程被称为神经图像评估(NIMA),它利用深度学习训练卷积神经网络(CNN)来预测图像的评级。
根据研究人员发表的一份白皮书:“我们的方法与其他方法不同,因为我们通过卷积神经网络来预测人类的意见分数分布。我们的结果网络不仅可以被用来可靠地给图像打分,而且与人类的感知高度相关,并且还可以帮助在摄影通道中对照片编辑/增强算法进行调整和优化。”
NIMA模型避开了传统的方法,采用了10分制的评分标准。机器会检查图像的特定像素和整体美学。然后它会决定某一个评级有多大可能被一个人选择。基本上,人工智能会试图猜测一个人喜欢这张照片的程度。这并不能使机器获得感知或思考的能力,但它可能会让计算机成为更好的艺术家或策展人。这个过程可能会被应用于寻找一批最好的图片。
如果你是那种每次拍20或30张图片的人,为了确保你拥有最好的照片,这可以为你节省很多空间。假设,只要点击一下按钮,AI就可以查看存储中的所有图片,并确定哪些图片是类似的,然后保留最好的,删除剩余的。根据谷歌研究博客最近的一篇文章,NIMA也可以用来优化图像设置,从而产生完美的结果:
“我们观察到,由NIMA评分的对比调整可以改善基准的审美评分。因此,我们的模型能够引导一个深度的CNN过滤器,找到其参数近乎理想的设置,比如亮度、高光和阴影。”
创建一个几乎和人类一样理解图像质量的神经网络似乎并不具有革命性,但对于拥有像人类一样视力的计算机应用程序却有很多。
为了让人工智能在现实世界中执行任务,比如在没有人类帮助的情况下安全地驾驶汽车,它必须能够“看到”并理解它的环境。NIMA,以及像它这样的项目,正在为未来的全功能机器打下基矗