谈到大数据,很多人往往会津津乐道地提起“啤酒和尿布”的故事。这个故事产生于美国沃尔玛超市,看起来,啤酒和尿布似乎完全是面向完全不同顾客群的商品,但沃尔玛通过对数据做产品关联性分析,结果显示:在居民区中尿布卖得好的店面啤酒也卖得很好。原来,一般太太让先生买尿布的时候,先生一般都会犒劳自己两听啤酒,因此啤酒和尿布一起购买的机会是最多的。
这是一个现代商场智能化信息分析系统发现的秘密,这个故事也被公认标致着商业数据分析的诞生。
近日,Teradata 天睿公司大中华区Aster事业部总监孔宇华在采访中告诉记者,产品关联分析还对超市中产品的摆放、促销活动、采购产品都有非常大的用途,而美国大型连锁超市SuperValue通过部署Teradata Aster,可以分析过去8年产生的海量数据。从实际使用看,Aster 能够在2分钟内完成13个超市集团的商品关联度分析,这在过去往往需要超过4个小时。
此次孔宇华来到中国,他对国内市场充满信心,他说:“国外和国内在大数据的应用有所不同,目前传统企业对数据分析的认识还不足,但随着企业增长速度加快、大数据应用的范围不断增加,很快就会有大数据分析的需求,国内市场的潜力非常大。”
|
#p#副标题#e#
Teradata Aster分析为用户寻求价值
在银行业,争取到一个客户比保留一个客户需要耗三倍多的资源,通常银行需要关注两点:一是在客户关闭账户之前,有哪些可以辨认的行为模式;二是在购买新产品之前是否有不同的行为模式。传统的分析方法采用SQL或者SPSS等数据挖掘工具进行分析,可以预测交易的一些模式,来发现用户可能会流失或购买产品,但无法知道确切的时间点。而合适的时间点可帮助银行适时采取行动,防止过早或过晚采取行动以至于成本上升或行动失败。
孔宇华介绍,Aster提供路径分析模式,可以将网上银行、电话、ATM机等不同的信息来源做综合分析,并形成可视化视图,银行的业务、分析人员可以很清晰地看到关闭账户的客户路径,从而适时采取挽救行动。
他举例,如果一个客户被无理收费,依次通过网上银行、打电话和当面沟通,银行都没能及时给予关注,那这个客户可能就流失了。但如果把不同渠道的数据集中起来,做路径分析,才发现这个客户跟银行有这么多互动。除此之外,Aster提供的防欺诈路径分析还可以根据卡主应用不同的模式分析出欺诈行为。
其实在很多领域都存在着这样的需求,比如电商,这些企业都会关注客户浏览路径的分析,以更加了解这个客户以后会购买什么产品;比如汽车维修,通过分析向维修工程师建议哪些配件需要维修……这些产品关联分析,同时也可以应用到人与人之间,孔宇华称其为社会关联分析。如今社交化趋势的凸显,如何通过一个人影响更多人呢?他指出,其实手机和电话清单是每个人社会网络最好的呈现,电信公司可以通过一个人的通话信息分析出其关系网,以及他所能影响的人群和自己受影响的人群。
Aster SQL-MapReduce:大数据分析的“瑞士军刀”
孔宇华表示,Aster将SQL和MapReduce两种框架结合,形成一个可以重复使用的、易用、灵活、并行的,可以处理海量数据的分析工具,即SQL-MapReduce。它不但可以对不同结构化的数据、非结构化数据、多结构化数据进行更深入的分析处理,提供具有突破性的性能,还可以借助Teradata Aster统一数据架构及SQL-H等高速连接器带来高可扩展性的分析能力。
Aster是怎么做到这些分析呢?Teradata是一个并行数据库,Aster是一个并行操作系统,并行数据库注重在操作系统和数据库上面的研发和优化,Aster注重的不仅是并行平台上的数据库,还包括其他引擎的综合应用。Aster对分析师的界面采用SQL交流,便于分析师使用,但是对内的系统分析很灵活。在数据库中运行用SQL,做海量分析时,Aster把数据引导到同一台服务器的MapReduce引擎运行,然后再把输出的数据返回数据库。通过软件实现结合,无需把数据在不同平台和服务器间搬移。孔宇华说:“这相当于给分析人员提供了一个‘瑞士军刀’,他们可以用最适合的工具来完成他们的工作。”
孔宇华指出,与Hadoop不同,Aster分析计算速度非常快。Aster适用于快速互动分析,而Hadoop门槛较高,需要大量的研发团队。他建议,企业在处理大数据的时候,可以在Aster上先做一些快速开发以最快的速度获得价值,然后等数据量不断增加,再开发Hadoop平台做储存、做转换的处理。这对企业来说是很好的长期架构目标,可以让每一个系统最大程度发挥自己的优点,互补缺点。
除此之外,Teradata Aster作为一款软硬件高度集成的“开箱即用”系统,预先封装了超过50项开启即用的分析功能,便于实现快速部署。
|
Teradata Aster的中国策略
#p#副标题#e#
Teradata Aster在研发方面做了很大的投入,除美国外,Aster研发团队设在北京,承担着基础技术、平台,以及功能包的研发,并且可以针对客户的需求做快速的功能包研发。
根据孔宇华的介绍,在全球,已经有多个厂商采用了Teradata Aster解决方案,其中第一个知名客户是MySpace,后将客户拓展至金融、零售、电信、医疗各个不同的行业,其客户名单也包括了AT&T、美国大型超市SuperValue、富国银行等。
其实类似“啤酒与尿布”的案例有很多,在软件行业,大家都知道卖软件是可以赚钱的,但是可能不知道,某个小公司靠卖软件中必须的数据,就赚到近亿的收入。
让数据活起来,应用起来,才能更好地为用户提供服务,增加收入并降低成本。大数据给我们带来的不仅是商业模式的改变,未来还会颠覆更多。