在分析业界,大数据是这些天被讨论最多的词。在企业业务方面,也许将掀起一场空前的变革浪潮。
绝大多数企业已经意识到,快速、高效的分析、挖掘海量数据背后价值将给企业洞察未来,带来绝对竞争优势。
大数据一种空前的颠覆技术,其将带来数据仓库协会( TDWI)已经发布的3V——体积、速度、多样性(Volume, Velocity & Variety.)外的第四方面的价值。
它使业务用户以更快的方式处理每颗粒度的数据位,消除了传统的采样然后在模型的方式。
鼓励调查用户数据方法,因为可以接近到大量数据。
能揭示隐藏在数据背后的深刻洞察力,由于大型数据的移动特性,过去预测成本太过昂贵。
根据Gartner报告,大数据优先于中小企业,到2016年,将驱动2320亿美元的资金投放量。
一些用于大数据的技术平台:
基于分布式平台:Hadoop-MapReduce
基于硬件平台:Greenplum, IBM Puredata(Netezza), Oracle, Teradata
柱状数据库平台:HP Vertica, ParAccel, 1010data
内存数据库平台/工具:SAP Hana, Qlikview, Tableau
非关系型数据/NoSQL:Cassandra, MongoDB, Splunk, Hbase
由于其超高的可伸缩性以及比其他平台更低的成本,Hadoop位于技术列表中的最顶层,用于处理大数据。它是由一系列联系的产品组合起来的,可以将大型数据集分成若干小块放在商品型服务器上,并且在一个分布式集群环境里处理数据,并快速返回结果。
可能用到大数据的一些行业案例:
保险:从固定在汽车上的监测装置上收集数据,以基于驾驶习惯提供个性化的保险政策,提供价格最优化的保险产品,索赔欺诈以及社会网络链接分析。
零售:为整个购物车分析购物过程数据而不是样本数据,基于社会媒体的情感分析以提升品牌认知度、客户服务、竞争环境分析、顾客与市场划分、网络日志分析等来了解顾客的行为。
银行与金融:启动整个历史数据以更好地识别欺诈行为,资本市场的贸易管制、为客户更准确的风险评估、挖掘呼叫中心的数据价值。
医疗:分析电子健康病例以提升患者治疗率,与减少保险支付成本、通过分析出院卡信息减少再入院率。
制造:预测保修成本与在备件物品上的检测问题,数据挖掘帮助了解客户对产品改进的一些意见。
由于大数据举措还处于不成熟的萌芽阶段,有许多不同观点与如何被应用。企业需要关注大数据处理的过程,同时尽量避免移动大量数据时非常昂贵的。
大数据帮助企业以及个人做出更佳决策——更快、更有效与更高质量。