随着数字经济的发展,区块链作为新型分布式数据库,在推动相关行业的数字化转型进程、促使经济社会发生深刻变革中发挥着至关重要的作用。基于国内庞大的人口基数、5G和AI先进技术的广泛应用、各行业数字化转型与升级、规模化数据量的产生将给数据存储市场带来压力,但也提供了广阔的市场机遇。
可以说,包括IPFS等在内的分布式存储与计算,基于天然的开放兼容的优势,可以快速吸收、容纳、融合新技术和应用发展趋势,吸引了包括微软、谷歌以及阿里、腾讯国内外诸多企业巨头,提前重资金布局。今天就让旺链科技带你一探分布式存储与计算领域的世界。
数据存储存在的问题
如何来定义我们所身处的时代呢?在人类早期的农业经济时代,一个典型特征是,人们生存和发展依赖的是土地和劳动力。随着工业时代的到来,经济发展越来越依赖资本和技术。那么现如今,随着数字经济的快速推进,假设让一个企业只能保留一样生产要素,那一定是数据。
这也是为什么有人把数据称为数字经济时代的“新石油”。因为数字经济时代的背景下,数据已成为未来企业、国家之间竞争的核心资产。举一个形象的例子,比如腾讯、阿里等头部企业都有着同样的人才、技术,在社交领域竞争关键是什么?无疑是大量的用户数据。
据IDC的预测,到了2023年,中国的数据量将达到40zb,从市场规模上来看,2024年全球数据市场规模将突破千亿美元大关。
我们还要注意到,随着5G技术的普及与使用,企业数据将成为数据输出的主流,数据量一定会成指数级别的增长。
如此庞大的数据量以及可预见的未来数据规模,如何把这些数据存储和使用好呢?现在我们都是通过互联网把海量计算机、移动端串联起来,数据的传输与访问,是基于HTTP协议实现的,数据以计算机、终端IP为地址进行集中存储,形成了一个集中式的库。
这里就有很多“肉眼可见”的问题!
首先是速度问题,集中式的数据库在巨大的访问量和数据传输下,承载着巨大的压力。在网络出现集中并发的时候就会“死机”,例如因为热搜造成微博的死机,我们现在都习以为常。
其次还有安全问题,数据的集中式的存储对于黑客来说,只需要集中攻克单个节点,就可以获取这里所有的数据。
另一方面,作为数据存储方理论上也有作恶的可能。如何在未来把数据使用好的同时,还能确保数据传输不宕机、确保数据的安全性、隐私性、有序性?这就是我们在数字经济时代,探讨分布式数据存储协议的必然性。
分布式存储与计算的优势
提到分布式数据存储与计算,IPFS协议无疑是当前最被市场关注的分布式协议之一。根据百度百科的定义,IPFS是一个旨在创建持久且分布式存储和共享文件的网络传输协议。它是一种内容可寻址的对等超媒体分发协议,在IPFS网络中的节点将构成一个分布式文件系统。
有人说IPFS协议是取代HTTP的存在,也有人认为它是HTTP的重要补充。如果我们对IPFS协议的优势和特征进行总结,“内容寻址”、“分布式”、“点对点”是它被认可的潜力。
其一,分布式输出存储。基于分布式网络,庞大的数据不再需要存储在同一个数据库中,而是分别存储在网络内部的所有节点里。根据分布式网络的容错机制,数据可以被复制足够多的数量,分散存放在不同地区的数据库里。因此,即使某一个数据被完全摧毁,通过其他节点的备份完全可以恢复,保证了分布式网络上的数据安全性。
其二,点对点的数据传输。基于分布式数据存储与计算网络,数据传输将不再通过集中通过同一个数据库处理,形象理解为对数据进行“私人订制”。例如用户需要下载一个MP3文件时,传统的方式,这个MP3可能存储在供应商的数据库里,但是供应商的数据库显然不仅仅只有这一个MP3文件,因此当所有人同时下载自己需要的文件时,就会出现数据传输的延迟。而分布式网络的点对点数据传输,是节点用户直接访问存储该数据的节点,不需要中间的统一处理,大大提升了效率。
尤其是一些比较大的文件,也可以不用存在同一个节点里,而是通过加密算法将其切割成若干份,然后再分散存储在世界各地的节点上。当发起下载时,分布式网络把这些节点列表全部并行抓取拼成完整的文件,这样并行的速度远远大于直接下载完整文件的速度。
其三是基于内容寻址的数据检索。传统的数据库的数据检索成为“地址寻址”,例如当用户下载电影时,需要告诉电脑这部电影的对应的IP地址或者域名。而“内容寻址”是将这部电影进行哈希映射,从而得到一个独特的“哈希值”,检索时直接通过哈希值进行检索,下载时直接进行点对点下载。
总体而言,分布式数据存储与计算在数据的处理速度、安全保障、低成本和安全性上为我们在数字经济时代将面临的数据激增,提供了新的突破口。
去年11月6日,国家广播电视总局办公厅印发《国家广播电视总局办公厅关于印发区块链技术应用系列白皮书的通知》,肯定了分布式存储与计算的应用价值与技术优势。这也是包括亚马逊、阿里云、腾讯云等在内的头部企业,一直以来重点投入的重要原因。
数字经济时代的基础设施
《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要(草案)》提出,迎接数字时代,激活数据要素潜能,推进网络强国建设,加快建设数字经济、数字社会、数字政府,以数字化转型整体驱动生产方式、生活方式和治理方式变革。作为“十四五”开局之年,国家层面已经为数字中国发展明确了方向。
区块链作为新型的分布式数据库,目前仍处于早期的发展阶段。伴随着分布式存储与计算技术的迅速推进与迭代,未来必将成为数字经济时代的重要基础设施之一。从另一角度来看,某种意义上而言,分布式数据存储与计算的发展,也决定了区块链技术创新应用的程度。
例如区块链技术对版权的保护、数字艺术品的确权等等,在分布式数据库的发展上给我们带来许多的想象空间。例如传统的数字版权、数字艺术品等,需要通过区块链技术进行唯一性与所属权的认证,并基于区块链网络进行高效率的流转。而目前,包括海外知名的以太坊网络,在图片、视频的存储上,依旧面临昂贵的手续费和吞吐量等问题。
旺链科技在产业区块链领域具备丰富经验,目前已成功为国家技术转移东部中心、东港股份、益海嘉里、点筹网、中兴能源、京蓝科技、宝丽嘉华等数十个领域上百家企业提供优质区块链服务。依托“十四五”重点规划的联盟链技术,在大体量数据安全、存储、流转等技术层面,具备行业领先优势。
总结
随着数字产业化、产业数字化的深入发展,数字经济必将有力地推动质量变革、效率变革和动力变革,为高质量发展注入新动能。而区块链技术的发展必将不断催生新产业、新业态、新模式,用新动能推动新发展。旺链科技认为,在数字经济的时代浪潮下,分布式存储技术作为区块链技术的延伸,企业只有在新技术领域做好前沿布局,才能构筑新赛场,形成先发主导优势。