近期搜狐公司旗下搜索引擎搜狗正式推出了以图搜图功能的新产品——搜狗识图,可通过上传图片等方式搜索找到相似其他图片。传统搜索引擎是通过输入文本关键词的形式搜索图片资源,而搜狗识图搜索能实现以图搜图,即通过上传图片、鼠标拖拽、鼠标选图、输入图片URL地址等多种方式搜索,找到互联网上与这张图片相似的其他图片,并且利用图片识别技术,进一步分析图片内容的主题,找到与这张图片同主题的其他图片。
本文作者在第一时间使用搜狗识图,以郭美美为例进行了测试:
1、新的功能是以图识图,所以增加了提交图片的入口。
2、可以输入图片的URL,也可以直接上传图片
3、搜索结果一,不仅能找出图片的来源,甚至对于 知名度高的“明星”能够识别身份
4、搜索结果二,可以搜索到网上相识的图片出处,识别率相当精准
后话,关于隐私
通过多是测试,搜狗识图对网上流传度较高的图片识别率相当精准,对于搜索图片来源,甚至是对热点话题人物进行人肉搜索都不在话下。而据说google早先也开发出了比搜狗识图更精准的图片搜索工具,但因为害怕泄露隐私最终决定暂时不做商业用途。的确,如此精准的搜索功能着实让每一个使用互联网的人有一丝丝凉意,我们不禁要问:我们的隐私怎么办,谁来保护我们的隐私?
对于以后这种功能将怎么发展,是利还是弊现在都不好说,但是作为公民最基本权利的隐私权,是有必要保护的!
作者在大学的时候接触过一定的模式识别相关课题,也亲手编写过如车牌识别、手写字识别、面部识别等应用程序,对这种以图识图的基本概念有一定的了解,在者结合对搜狗识图先有功能的多次测试结果,总结以下防范隐私泄露的注意事项:
1、能不传照片的地方尽量不要传照片,不要重复上传(废话哈)
现在是全民社交的时代围脖、人人、开心、QQ空间、博客……几乎每个互联网用户都有一两个在手,大家都喜欢把自己的照片穿上去分享给网上的朋友。搜狗识图的基本功能就是识别相似或相近图片的来源,现在我们找注意了,如果你不想吧自己的隐私泄露的话,尽量不要传照片,更不用重复上传相同照片!
2、哪些图片难被识别?
搜狗识图毕竟还不是一个成熟的完善的产品,经过测试论证,有很多图片他也束手无策!首先画面结构复杂的图比较难识别,再就是主体少于图片面积1/3的比较难识别,对于个人隐私而言就是人占的面积小于照片面积的1/3,还有就是打过水印的照片会影响识别效果。
3、改变图片信息,蒙骗搜索引擎
我们注意到搜索结果中,找出的相似图片来源大小色彩一致,那么如果我们将这些图片稍微改动一下,也是能达到蒙骗搜索引擎的目的。具体的做法是,可以改变图片的大小如压缩比、长宽数据,也可以改变图片的图片的颜色深度、灰度,当然改变图片的格式也是也个好方法,测试发现搜狗识图对提交的卷铺盖图片搜索结果均为jpg,对提交的gif、png格式搜索结果也是对应的文件格式!
有个朋友说过:只要你接触网络,只要你使用的社交网产品、只要你通过互联网与他人联系,你就没有隐私可言!最后提醒大家,网络有风险,上网需谨慎!