展会信息港展会大全

3.15曝光数据安全问题,你我怎样才能减少“丢脸”?
来源:互联网   发布日期:2021-03-18 08:42:07   浏览:9098次  

导读:3月15日,又到了一年一度的国际消费者权益日! 今年的315晚会围绕提振消费,从心开始的主题,聚焦数据安全、食品安全、建筑安全领域侵犯消费者权益的违法违规行为,曝光了9大案例。 其中和数据安全有关的上榜案例就占据了4个,数量之多令人触目惊心! 阳光下...

3月15日,又到了一年一度的“国际消费者权益日”!

今年的“315”晚会围绕“提振消费,从心开始”的主题,聚焦数据安全、食品安全、建筑安全领域侵犯消费者权益的违法违规行为,曝光了9大案例。

其中和数据安全有关的“上榜”案例就占据了4个,数量之多令人触目惊心!

阳光下的数据“死角”

案例1:科勒卫寓宝马、MaxMara商店安装人脸识别摄像头,海量人脸信息已被搜集!

基于人工智能和大数据的人脸识别技术正在深度融入民生服务、城市治理、安防保障等各个领域,“315”晚会调查发现一些家装企业、汽车4S店、超市等商户在消费者不知情的情况下,违规利用人脸识别技术,通过监控摄像头追踪消费者行程,记录消费者信息。

在全国多地20多家装有人脸识别系统的商户,人脸识别信息均被偷偷获取,没有一个商家明确告知,征得同意更是无从谈起。科勒卫寓宝马、Max Mara均在列。

苏州万店掌网络科技有限公司薛经理称,他们平台目前拥有的人脸数据量已经上亿。

案例2:智联招聘、猎聘平台简历给钱就可随意下载,大量流向黑市!

“315”晚会还关注了智联招聘、猎聘等一些网络求职招聘平台对求职者个人简历管理上存在严重漏洞,通过伪造的营业执照就可以轻易通过平台审核,获得企业账户,大量下载求职者个人简历并转而在其他网络渠道上批量出售。

在一个名叫“58智联粉”的QQ群里,央视记者向一位买家支付7元,便买到了一份智联招聘上求职者简历。警方在其中一个嫌疑人的一块硬盘当中,存储的这种公民简历数量就有700多万条。

案例3:手机越“优化”越卡,还偷你的个人信息

2020年全国60岁及以上的老年人已经占到网民总数的11.2%,互联网向老年人群体的渗透率进一步提升。

可是一些手机软件利用老年人网络安全意识弱、网络知识欠缺的特点,不断“提醒、下载、清理”,这些“安全提示”越清理越多,手机越用越慢。

测试人员发现,“手机管家PRO”表面上看起来是在清理手机垃圾,背地里实则在不断偷偷大量获取手机里的信息,各种带有欺骗套路的广告和内容顺势源源不断地推送到老人的手机上,使得一些老年人上当受骗。

案例4:揭秘360搜索医药广告造假链条,UC浏览器涉及为无资质公司投虚假医药广告

“315”晚会发现,在UC浏览器、360搜索引擎等社会影响大、覆盖面广的互联网平台上,仍然存在着一些涉及医疗药品、保健食品等危害民众身体健康的虚假违法广告。

只提供了一个微信号和产品类型,代理公司很快就制作出一篇内容为减肥、降血糖的自述广告和一篇有问必答、快速问医师的专家答疑广告。

交了钱就能上,专家子虚乌有,疗效神乎其神,评论也是事先写好的,就连点赞数量也可以根据需要任意设定。

数据为王

随着人工智能、移动互联网、大数据、云计算、电商直播、网络支付、线上订单等新技术、新产业、新业态和人们新的工作方式、交往方式、生活方式不断涌现,数据越来越成为各家企业争夺的稀缺“资源”。

无论你是否意识到,每台设备上的每个应用程序都可能在跟踪一些关于你的信息。即便你又是万分的小心,但仍然会低估有多少你的数据被收集和分析。

以本次3.15晚会中曝光的各种“手机清理”app为例,中国电子技术标准化研究院网安中心测评实验室的副主任何延哲介绍,这些App“表面上”是在清理手机垃圾,“背地里”却在不断获取手机内信息并实时上传。

测试的技术人员介绍说:8.75秒内,获取手机已安装应用程序列表890多次,读取移动用户识别码IMSI行为1,300多次,读取移动设备身份识别码IMEI行为900多次,读取GPS(全球定位系统)地理位置信息、定我们的位置达到50多次

而这还是针对消费者手机数据的“窃取”行为,更不要说关系更加重大的“人脸”数据和财务数据。

对于数据的重要性,西雅图创业公司DefinedCrowd首席执行官Daniela Braga有一个形象的类比,“我们在印刷时代花了5个世纪,在软件上花了30年,现在人工智能正走上取代软件的道路。虽然编码和程序员推动了软件的开发,但是数据和数据科学家才是人工智能的缔造者。”

“AI的优势在于只需要用结构化的数据就可以训练,”Braga说。“这些数据让我们可以在一周内训练出一个AI大脑,而不是过去需要的几个月,并且它的功能更加强大。”

Daniela Braga

自然,要做到这一步,就必须给人工智能“喂入”更多的数据,而数据从哪里来?当然是从我们每个消费者的身上来。

但除了隐私安全的问题外,在此过程中的“数据依赖”问题也日渐凸显,使得训练效率无法得到有效提升。

现在,人们越来越担心实验性人工智能研究的新进展,因为其经常需要由适当的计算基础设施支持的强大数据集,可能会因为计算和内存的限制而停止,更不用说更高的计算需求所带来的财务和环境成本。

OpenAI的分析表明,数据科学界在实现已经获得的目标方面效率较高,但证明要达到新的人工智能成就,则需要高几个数量级的计算量。

麻省理工学院的研究人员也估计,“三年的算法改进相当于10倍的计算能力提升。”

如果推动人工智能的发展意味着要以更大的成本消耗更多的专业资源,那么领先的科技巨头会不断付出成本来保持领先,但大多数学术机构会发现很难参与这种“高风险,高回报”的竞争。

另外,即使你假设你已经正确定义和设计了人工智能模型的目标和架构,并且你已经收集、策划和充分准备了足够的相关数据,你也无法保证模型会产生有益的、可操作的结果。

在训练过程中,随着更多数据点的消耗,模型仍可能识别出不同变量之间的误导性虚假关联。这些变量可能以看似统计学上显著的方式进行关联,但并不是因果关系,因此不能作为预测目的的有用指标。

最后,即便以上问题都解决了,大规模的数据需求模型也可能无法通过模仿人类生成内容或超越人类的一些检测和识别能力。

从神经符号人工智能研究的进展来看,人工智能驱动的模型仍然远远没有展示出类似人类的直觉、想象力、自上而下的推理或通用人工智能(AGI)。

用更少的数据,行不行?

行文至此,我们自然而然的就会联想到,既然用数据训练AI的成本又高又会泄露隐私,那么我们可不可以在AI训练中减少数据的使用呢?

目前来看,突破的方法有以下几个方面:

算法效率是重中之重回顾即将走到尽头的摩尔定律,企业和人工智能研究人员正在努力通过测试创新方法和技术来提升算法功效,其中一些方法和技术还处于部署的初级阶段。

这些方法目前只适用于特定的任务,从开关变压器的应用,到Few Shots、One-Shot和Less-Than-One-Shot学习方法的完善。

人类增强优先通过限制人工智能模型只对安防专业人员的工作流程进行增强,让人类和人工智能协同工作,这些模型可以应用于非常狭窄的、定义明确的安防应用,其本质是只需要较少的训练数据。

这些人工智能“护栏”可以体现在人类的干预上,也可以通过加入基于规则的算法,将人类的判断硬编码。

现在已经有越来越多的安防厂商倾向于提供AI驱动的解决方案,这些解决方案只是增强了人类在流程中的作用,而不是完全取代人类的判断。

强化监管机构的作用因为他们寻求人类的责任、监督和故障安全机制,尤其是在涉及自动化、复杂和“黑盒”流程时。

一些厂商正试图通过引入主动学习或强化学习方法来寻找中间地带,这种方法利用人类的输入和专业知识来丰富底层模型本身。

与此同时,研究人员也在努力加强和完善人机交互,教给AI模型什么时候把决策交给人类专家来做。

利用硬件改进目前还不清楚,专用的、高度优化的芯片架构和处理器以及新的编程技术和框架,甚至完全不同的计算机化系统是否能够适应不断增长的人工智能计算需求。

但为人工智能应用量身定做的一些新技术将专业的硬件和软件紧密结合和调整,已经以比以往任何时候都更能完成难以想象的并行计算量、矩阵乘法和图形处理。

此外,为人工智能计算、联合学习方案和前沿技术(神经形态芯片、量子计算等)专门构建的云实例也可能在这项工作中发挥关键作用。

结语

到目前为止,传统数据科学还是认为数据越多越好。但我们现在开始看到,随着时间的推移,“数据饥渴”型的人工智能模型的缺点可能会超过其无可争议的优势。

在“精益数据”和隐私保护的双重夹击下,企业、网络安全厂商和其他数据从业者有充足的动力和压力促使他们在收集、存储和消费数据的方式上更加严谨。

而拥抱这种依赖于数据匮乏而非数据丰富的方法,并进行自我约束的组织,可能会更好地在未来推动更具可操作性和成本效益的人工智能创新。

赞助本站

人工智能实验室
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港