Hadoop in China社区一年一次的技术年度盛会Hadoop中国云计算大会(Hadoop in China 2011,HiC2011)12.2-12.3日在北京召开,Hadoop in China已经成功举办四届,今年大会的主题是“海量数据掘宝”,HiC2011由中国科学院计算技术研究所主办,通过技术应用和科学研究双重视角审视云计算以及Hadoop开源生态系统的现状和发展趋势,发扬开源精神,促进Hadoop以及云计算开源生态系统在中国的发展壮大。
▲张栋
在12月3日的“云计算研究”分会场上,自由职业者张栋发表了“海量数据与机器学习”的演讲,介绍了在互联网行业对数据挖掘而产生的广泛应用。
张栋曾就职于微软、谷歌和百度,对机器学习有着深入的理解,他表示互联网给机器学习带来了新的生机。张栋介绍机器学习是指程序员通过一定的程序结构,让机器具备学习的能力。
1.豆瓣电台
▲
在互联网行业,已经有不少应用能通过机器学习来完成,张栋介绍,比如在豆瓣电台中,在播放歌曲的界面中,用户可通过“喜欢”、“不喜欢”等按键来表达自己对这首歌的态度,而通过用户反馈的大量数据,通过这些广泛的数据就能够分析出该用户的喜好和习惯,判断出用户喜欢哪一类型的音乐,进而推送用户喜欢类型的音乐。
2.电子商务
▲
机器学习同样也可以与电子商务结合起来,一个好的电子商务平台通常必须处理好四个重要环节,分别是:线下货、流量获取、源流量转化、售后服务。而点击率和订单转换率都是可以借助于机器学习来获得提升的。
3.团购
▲
在Groupon团购网站的流量中,最大的一部分来自向用户发送的推送邮件,因此根据用户的消费习惯和收入状况来个性化的调整网站上团购的排序,同时制定个性化的推送邮件,来促进用户的点击进而购买。而对团购的排序和个性化邮件制定都来自对用户访问信息统计和分析。
浏览Hadoop中国云计算大会专题请猛击这里。
▲