如果你了解“大数据”的相关信息,你肯定非常熟悉“数据科学家”这个术语,它一般是指个人拥有多个技术领域的技能,包括计算机科学、分析、数学、建模和统计。拥有该专业技能的人善于从海量数据集中发掘出有意义的见解,然后这些见解分享给包括技术部门以及前台办公的各种人员。
总部位于伦敦以北73公里的一家英国数据分析公司Atheon Analytics的董事总经理Guy Cuthbert指出,我们应该仔细想想,信息大师们所说的“推动数据的发展”究竟意味着什么。
Atheon Analytics 是6年前成立的,起初是一个拥有10个人的公司,主要是为像乐购、维特罗斯和森宝利这样的英国超市连锁店,以及可口可乐、雀巢、慧俪轻体、优诺等食品供应商分析大量的零售数据。Cuthbert在接受电话采访时说道:“我们专注于可视化分析。我们的主要事情是把相对比较大的数据集变成丰富的、交互式的应用程序。”
就像Cuthbert所认为的,一个数据科学家,在本质上就像一个动画师勾勒出视觉效果来讲一个故事一样。他说:“我们倾向于使用‘动画师’这个术语,因为我们做的工作就是让数据丰富我们的生活,并使它变得具体可感。”他还把他的工作称为一个“有趣的混合”,意味着既需要很强的数学技能,又需要人际交往的诀窍。
这种罕见的组合正是使得寻找合格的数据动画师(或者说是科学家)变得很困难的原因。Cuthbert说:”我们试图招募计算机科学的毕业生,但他们并不总是最合适的。他们当然需要对数学有强烈的兴趣,但他们也必须对人性有洞察,并且有一个天生的求知欲,从而有兴趣去寻找数据中的模式。”换句话说,所有数据都讲述了一个故事,如果你知道如何找到它的话。他说道:“在讲一个故事的时候,数据中蕴含着非常大的价值。我们所做的大量工作,其最终目的是教会人们如何利用他们的数据,来进行创造性地思考。
Atheon Analytics用来管理其客户不断增长的数据集的工具之一是ActianVectorwise,这是一个有着高性能的商用硬件的分析数据库,这对像Atheon这样注重成本的创业公司来说,是一个重要的考虑因素。Cuthbert说:“我们买不起高端的eradata设备或者相类似的东西。我们必须找到现成的东西,既能够在我们的服务器上使用,又能够在我们的云平台上部署。
在过去的两年里,Atheon Analytics发现,他们的许多客户的庞大的数据集对于传统的数据库来说,变得过于庞大了,于是他们在9个月前决定尝试Vectorwise。
迄今为止,该公司在他们所执行的四到五个项目的上面,已经从SQL Server切换到Vectorwise了。Cuthbert说:“查询的时间已经从15到20分钟下降到3到4秒了。更快的性能展现出了极大的优势。它改变了人们处理信息的方式,尤其当人们能以思考问题的速度来操纵信息的时候。”