亚马逊Web服务(AWS)最近向有限数量的用户提供其低价的大数据分析服务Redshift。你可以把Redshift当作满足大数据关系数据库需求和旨在支持数据仓库的一个公共云服务。我们预计还可以看到这个云服务与大数据库厂商甲骨文展开直接竞争。
使用AWS管理控制台或者亚马逊Redshift API,企业可以配置一个2TB数据库;作为选择,企业可以选择由16个2TB超大容量存储(XL)节点组成的一个集群。除了2TB或者16TB存储容量之外,这些节点还有15GB内存或者120GB内存。价格是XL节点每小时85美分,8XL节点每小时6.80美元。
同许多其他技术一样,你必须考虑Redshift的好的方面和不好的方面。下面是好的方面:
● 能够根据需要配置大型数据库,不必经过昂贵的和缓慢的采购过程以便获得硬件和软件。
● 能够升级处理庞大的数据库,也许超过PB容量范围。
● 有潜力使用一套弹性资源以足够快的速度返回结果集。当运营一个企业的时候,这实际上是很重要的。
● 与使用自己的硬件和软件的成本相比,这个服务有潜力在多年时间里节省大量的资金。
不好的方面:
● 可能发生中断故障;这不是说企业的内部数据仓库不会经常出现故障,而是说任何故障都将是公开的并且在内部给予云计算一个打击。
● 数据迁移和集成的成本;你需要大量的带宽从内部系统向云托管的Redshift服务传送数据,或者需要通过FedEx向亚马逊Web服务运送优盘。
● 缺少最佳实践;我们刚刚开始应用公共云托管的数据仓库,显然还有不少要学习的东西。
● 更高成本的可能性;虽然许多机构将发现使用Redshift等云托管的数据库会节省成本,但是,许多机构将发现他们的云计算账单将远远高于预期,也许会超过内部部署的数据库的成本。
业内人士预计,就像其他人喜欢的那样,Redshift将取得成功。然而,在我们开始迁移到这项服务之前,我们一定要认真观察。我们需要喘口气和做一些规划。