社交媒体针对大数据主题的聊天次数激增,DataSift是密切跟踪有关大数据炒作主题的厂商之一,通过分析Twitter数据确定未来发展趋势。DataSift的Tim Barker提供的下列信息表涵盖了2012年全年提及大数据的所有Twitter信息分析结果。
该分析透露的主要信息是,世界仍在了解大数据,这或意味着我们还处于早期应用阶段,而非炒作周期巅峰。下面是部分重大分析结果的大致纲要:
·2012年第二季度与第一季度相比,有关大数据的Twitter信息几乎持平,但在第三季度和第四季度,有关大数据的Twitter信息激增25%。
·72%的Twitter信息包含链接,表明对话内容主要是分享信息源。
·2012年分享最多的文章主要是对大数据主题解释、探索或神话揭秘。
·Hadoop保证了Apache是关注度最高的厂商,MongoDB开发者10gen位居第二。
·IBM的主动式内容营销战略无疑助力该公司超越惠普、Teradata、甲骨文和ECM的受关注度。
·Splunk通过IPO提高知名度。相反,惠普与Autonomy交恶在有关大数据的Twitter信息中给自己带来的负面影响最大。
·鉴于Cloudera在大数据市场上的卓越表现,日本偏向于构建自有解决方案。
·Splunk在美国表现突出,DataSift在英国做得风生水起,SAP在德国颇有威望,IBM在法国口碑很高。
DataSift坚持自己是欧洲最大的Hadoop集群。DataSift声称存储的每条Twitter信息中平均有72个数据项与大数据有关,每天存储4TB数据。在对2012年与大数据相关的Twitter信息分析中,DataSift发现与逾200万条交互信息相关的作者不足100万人;高峰期每小时发出3000条Twitter信息,几乎每秒钟发出一条。但与DataSift每秒监测逾8000条Twitter信息相比,有关大数据的Twitter信息只是沧海之一粟。