展会信息港展会大全

区块链+大数据:助力数字时代开启新章程
来源:互联网   发布日期:2022-03-29 14:01:35   浏览:3988次  

导读:1.引言 随着数字经济的发展,区块链的价值逐渐凸显,而区块链最大程度发挥效应则需要借助使用场景和其他技术,大数据可能是区块链完美的借力点之一。区块链和大数据是两种正在蓬勃发展的技术,同样也是两种互补的技术。 2.大数据发展现状 随着物联网、电子商...

1.引言

随着数字经济的发展,区块链的价值逐渐凸显,而区块链最大程度发挥效应则需要借助使用场景和其他技术,大数据可能是区块链完美的“借力点”之一。区块链和大数据是两种正在蓬勃发展的技术,同样也是两种互补的技术。

2.大数据发展现状

随着物联网、电子商务、社会化网络的快速发展,全球大数据储量迅猛增长,成为大数据产业发展的基矗2017年全球大数据储量为21.6ZB,2018年全球大数据储量达到33ZB,增速达52.8%。随着信息科技的不断进步,中商产业研究院预计2022年全球大数据储量将达61.2ZB(1ZB=2的70次方KB)。

2.1全球大数据区域分布

最新数据显示,中国的数据产生量约占全球数据产生量的23%,美国的数据产生量占比约为21%,EMEA(欧洲、中东、非洲)的数据产生量占比约为30%,APJxC(日本和亚太)数据产生量占比约为18%,全球其他地区数据产生量占比约为8%。

2.2中国大数据

近年来,我国互联网产业高速发展,带来数据量的迅猛增加。2019年,我国数据产量总规模为3.9ZB,同比增加29.3%,占全球数据总产量的9.3%。人均数据产量方面,2019年我国人均数据产量为3TB,同比增加25%。中商产业研究院预计2022年中国数据产量将达6.6ZB,人均数据产量将达4.8TB。

2.3大数据产业规模

2020年,我国大数据产业迎来新的发展机遇期,产业规模日趋成熟。在互联网快速普及、物联网加速渗透的背景下,PC、手机、传感设备等全面兴起,推动全球数据呈现倍数增长、海量集聚的特点,为大数据产业发展奠定了庞大的数据基矗数据显示,2016-2020年我国大数据产业规模逐渐增长,2020年大数据产业规模超1.1万亿元。中商产业研究院预测,2022年中国大数据产业规模将达14224亿元。

2.4 政策布局覆盖完善

近年来,我国连续出台一系列关于数据安全的法律法规,从立法到执法,监管的步伐日益加速,数据安全的法律体系雏形渐成。《中华人民共和国数据安全法》从2021年9月1日起施行;《中华人民共和国个人信息保护法》也从2021年11月1日起施行。数据安全成为一项事关全局的国之大事。

中央政府和各级地方政府频繁出台与大数据有关的政策,已经形成多层次协同推进的大数据发展政策环境。仅2015年~2018年,中央政府、省级政府及市区级政府出台的大数据相关政策就达到340个。

其中影响力最大的主要包括:

2014年大数据被写入政府工作报告;

2015年国务院正式印发了《促进大数据发展行动纲要》,成为我国发展大数据的首部战略性指导文件;

2016年《十三五规划纲要》的公布标志着国家大数据战略的正式提出,彰显了中央对于大数据战略的重视;

2016年12月,工信部发布《大数据产业发展规划(2016-2020 年)》,为大数据产业发展奠定了重要的基础;

2017年10月,党的十九大报告中提出推动大数据与实体经济深度融合,为大数据产业的未来发展指明方向;

2019 年 3 月,政府工作报告第六次提到“大数据”,并且有多项任务与大数据密切相关。

截止目前,全国除港澳台外的全部31个省级行政区都出台了关于大数据的产业政策,合计347条;16个省级行政区和79个市级行政区成立了大数据管理机构;据不完全统计,18个省级行政区共成立了46个大数据产业园区;国内大数据政策环境已经相当完善。

3.大数据发展弊端显现

但是,在大数据行业发展至今,技术的负面作用也逐渐显现。数字社会的未来愿景越宏大,大数据的作用越关键,这些负面作用也就越危险,愈发亟待解决。这些隐患和痛点主要分为四个部分,而在这四个部分中,也存在着清楚的逻辑关联。接下来我们首先简述这四个部分,再阐述其中的逻辑关系。

3.1 数据泄露

由于平台掌握了大量用户数据,从而因为主观和客观的原因,例如灰产交易、撞库攻击、内部人员泄露等,均可能造成数据泄露。近年来,数据泄露频发,影响力较大的有Facebook的多次隐私泄露事件,最近的一次就在几天前,每次涉及的全球用户都有数亿之多;而在18年底,喜达屋酒店的用户信息泄露,涉及用户也达到5亿。数据泄露的后果并不局限于侵犯用户的隐私权,更可能造成电信诈骗、系统遭受攻击等更加严重的后果。而我们可以想象,被揭露的隐私泄露事件只是冰山一角。根据波耐蒙研究所发布的《2019年数据泄露成本研究报告:全球分析》所示,目前单次数据泄露事件的平均损失为392万美元,客户信任度的丧失、对企业形象的负面影响等无形资产的损失更是数额巨大、难以估量。

3.2 数据滥用

即使数据没有被泄露或者买卖,平台对于数据的使用也存在诸多问题。例如,平台通过大数据分析用户的特征,然后进行不合理的价格歧视,也就是我们常说的“大数据杀熟”;另外,平台还通过大数据分析用户喜好,过度传播强娱乐化的,较为低俗的信息。应该说,平台合理使用大数据对用户进行用户画像,提供用户喜欢的内容,都是正常的商业行为;但过度滥用数据,损害用户的正常权益,或是只顾流量,不顾社会公序良俗和自身社会责任感,都是数据滥用的负面行为。

3.3 数据确权

在大数据行业中,数据量的规模是非常重要的。一般来说,数据规模越大,越有分析价值。然而,数据的产生者是广大的用户,数据所产生的价值却是由平台享受。这是因为,数据虽然由用户的行为产生,但是由于技术原因,数据的掌控权却在平台手上。另一方面,用户自己的数据单独来看并不能产生价值,而只有将大量用户的数据聚合才能产生价值。从这个角度上来看,用户作为数据的生产者,平台作为数据的聚合者,都理应分享数据的价值,但目前数据却无法确权,数据的生产者和数据的价值无法进行绑定。

3.4 数据共享

由于数据巨大的商业价值,在同一行业的不同竞争对手中,为了防止商业秘密的泄露和商业价值的损害,很难进行数据共享,从而形成了大量数据孤岛。然而,合作在很多场景下是非常必要的,数据的无法共享对行业中的不同角色来说,都会对自身的发展产生阻碍。这也大大增加了平台通过正常途径获取数据的可能性。

四大隐患之间的逻辑关系如下:

(1)数据确权问题是所有问题的起源

无论是隐私泄露、滥用,还是数据共享的困难,其根本原因还是数据确权的问题。由于数据的产生者用户无法对自己的数据进行确权,才使得平台可以泄露、滥用用户的数据;也同样是因为数据的拥有者无法保障自身对于数据的控制,才使得不同平台之间无法达成数据的共享。

(2)部分场景下,数据泄露是无法进行数据共享的替代手段

由于数据共享无法进行,导致部分平台无法通过合理途径获取用户数据,从而试图通过非法手段获取数据,这就给了数据泄露生存的土壤。如果能够促进数据共享,数据泄露情况也会随之减少。

可见,四大隐患之间是相互联系的,而问题的关键症结是数据确权。由此,数据确权问题也是大数据产业所需要解决的核心问题。然而,由于数据确权不同于传统物权,目前法律专家们倾向于将数据的权属分开,即不探讨整体数据权,而是从管理权、使用权、所有权等维度进行探讨。但总的来说,相关研究、法律都尚未形成足够的支撑。

4.区块链技术在大数据行业的应用

4.1 数据确权问题的核心仍然是信任问题

数据作为一种资产,不像传统资产一样具有实体,可以在物理空间进行掌握;同时,因为数据的可复制性,一旦经过他人之手,就存在被盗取的可能性。同时,数据的产生和支配并不一定是同步的,有的数据产生之初由其提供者支配,有的产生之初便被数据收集人支配(如微信聊天内容、电商消费数据等)。

根据这个思路,需要解决两个问题:

一是,如果数据产生之初,就由平台支配,怎么保证平台不盗取数据?

二是,在各种经济活动中,数据总是要流转的,怎么保证这期间数据不被复制或者盗取?

我们可以用通俗一点的方式来思考这两个问题:

(1)如果数据产生之初,就能建立一个多方可信体系,控制好数据,就可以防止平台的盗龋

(2)如果数据在流转时,就能建立一个多方可信体系,监督全流程,就可以防止数据被复制或者盗龋

那么现在问题变成了,如何建立这样一个多方可信体系?

4.2 区块链建立多方可信体系

区块链通过去中心化的分布式存储,保证了自身的真实性和不可篡改性,从而保障区块链网络中数据的可信。因此,将权限写入区块链,即可保障平台未经授权无法访问用户数据,阻止平台的非法访问;而在数据流转的过程中,也可以将业务流程和权限控制写入智能合约,保证数据的使用和共享只在业务流程中进行,不会被复制、盗取或者用于其他用途。

可以说,区块链相当于一个信任机器,在建立信任的基础上,促进数据的共享,构建高效的协作关系。

4.3 通过区块链掌握数据的使用权

区块链的解决方案不着眼于数据的所有权,而是着眼于数据的使用权,因为数据只有使用才能产生价值。我们按照前述,分平台+用户以及平台+平台两种情景来进行阐述。

(1)平台+用户在一个基于区块链网络的平台上,数据一经产出,就即刻上传至链上。平台自身并没有权限访问这些数据,除非用户对其进行授权。在传统平台上,没有可靠的方法确保平台是否调用了用户的数据;但是通过区块链真实而不可篡改的特性,可以保障平台确实无法获取用户数据。平台如果想要使用用户数据,必须向用户获取授权,甚至支付一定的费用。通过这样的方式,可以实现数据价值的合理分配,既通过控制使用权的方式,保障了用户对数据的确权,又可以将数据资产所产生的价值返还到用户身上。

(2)平台+平台假设在前文中的两个平台,从用户那里得到授权获取了一批数据,平台之间想要共享数据,仍然可以将各自的数据传到内部的联盟链上,并相互向对方授权。出于商业竞争的目的,平台之间的授权可能不像用户授权那样,直接将数据出售给平台,而是仅允许对方能够调用。也就是说,在这个联盟链之中,成员只能够通过联盟链中的智能合约将数据用于具体的业务流程,而不能看到具体的数据信息(不能看到用户具体是谁,联系方式是什么,名下有没有贷款等等)。

可以看到,无论是哪一种情景,区块链既可以让用户相信链上的数据不会被平台获取,也能让平台之间相信链上的数据不会被其他平台获取,从而保障了数据的确权,促进了数据的共享,防止了数据泄露、数据滥用等情况的发生。

5.区块链+大数据应用案例

5.1 Engima

Engima是一个初创的保护隐私的数据计算平台。Engima的主网在2020年2月上线,其主要功能为保护数据隐私安全并解决数据确权问题。

目前,如果一名用户安装了一个APP,则会无限期地授予这个APP权限,如果用户想撤销访问权限,那么他必须卸载该应用程序并停止使用服务。

Engima的思路是将权限的控制策略存储在区块链上,然后让区块链节点适度访问DHT(Decentralized Hash Table,分布式哈希表)。该解决方案由用户,提供服务的企业或平台、以及区块链这三方共同组成。当用户想要授予或撤销企业或平台对于其个人数据的访问权限时,区块链将会将策略上传至链上,保护用户的权益。

(图片来源:Engima白皮书)

当用户安装新的应用程序时,即会创建一个共享的身份,同时会记录下用户的权限配置策略,将其上传到区块链上。用户对企业或者平台的授权会形成一个复合密钥,该复合密钥由双方的签名密钥对组成,可以保护数据免受无授权方的侵害。

而企业作为被授权方,访问数据时,系统都会根据最新的权限授予策略检查其权限。这意味着用户可以随时调整授权,可以增加授权,也可以取消授权。通过这种方式,Engima完成了对于数据隐私的保护和数据确权的工作。

5.2 上海数据交易中心

2019年10月,上海数据交易中心基于区块链底层技术的数据交易系统正式上线,该系统利用区块链的可追溯和不可篡改等特性,对每笔交易和数据进行确权和记录,解决了大交易量情况下的交易记账、清结算处理和分布式环境下的信息分发、同步和存储问题,构造了开放性、去中心化的可信数据交易服务环境。

基于区块链的数据交易系统采用联盟链、分布式的架构体系,实现将数据交易相关的会员基础信息、交易品信息、订单信息、交易账本存储在区块链节点,利用区块链的可追溯和不可篡改等特性,确保数据交易安全、高效、可信。系统在标准规范上充分兼容区块链网络的通用功能和特性,并在底层对于共识机制、准入机制和保密机制进行改进,由需方节点、供方节点、交易中心、清算节点构成联盟区块链,数据存储通过智能合约实现,包括会员合约、订单合约、交易品合约、账本合约。

供需方节点通过交易平台进行数据交易,交易过程中产生的日志记录定时汇总并提交交易中心节点进行背书签名后写入到区块链平台形成分布式总账,清算节点主要实现根据区块链中的订单结算规则计算交易双方的结算金额,并最终通过账本同步至相关节点。数据供需方节点之间通过数据交易形成逻辑上的交易数据链,通过采用分区共识机制和交易访问权限控制,保证交易参与方只能访问到与其相关的交易信息,保护交易双方商业机密。

(图片来源:上海数据交易中心)

此系统不仅构建了高安全、可信的交易环境激发数据交易主体参与的积极性,且将促成数据交易市场的规模性增长,真正推动各行业、企业运用大数据实现升级转型,推动数字经济快速发展。

6.区块链有效遏制大数据野蛮生长

大数据领域虽已有众多成功应用,产业链逐渐完善,但“数据孤岛、数据质量、数据安全”等问题一直是大数据发展的弊端所在。

2020年IDC研究数据表明,在可用的企业数据中,2/3以上的数据未被利用,闲置在企业组织的数据孤岛中。大数据帮人们发掘了许多高价值信息的同时也产生了更多”暗数据”,即处于未被利用、价值不明的状态的数据。

此外,虽然数据共享开放的需求十分迫切,但是对于企业来说,由于数据中蕴藏着自身的商业秘密以及巨大的商业价值和机会,因此对开放和共享数据往往保持谨慎态度。对于单一组织机构而言,靠自身的积累往往难以聚集足够的高质量数据。对于信息被采集者而言,用户由于担心隐私被泄露因此常常不愿意提供敏感数据。

如何打破信息孤岛、盘活数据存量,已经成为大数据发展亟待解决的问题。区块链技术的迅速崛起,必将帮助大数据突破困境,两种技术在相互融合中共生共长。

“加密和安全”作为区块链应用的基本前提,数字签名、私钥、“时间戳”等技术保障数据安全,区块链与物联网的强强联手,可以保证链上数据的真实性、准确性,通过数据追溯机制改善数据的可信度,使得数据获得强信任背书。

随着数字经济的发展,越来越多的企业开始意识到区块链的价值。大数据作为信息技术发展的必然产物,推动了数字经济的形成与繁荣。对于区块链而言,更需要借助使用场景和其他技术才能最大程度发挥效应,而大数据可能是区块链完美的“借力点”之一。

END

赞助本站

人工智能实验室
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港