导读:信息爆炸,带来海量信息,如何从一堆垃圾信息中淘出金子?昨日光博会上,中国工程院院士邬贺铨透露了个中秘密。 他介绍,华尔街有一家名为德温特资本市场公司,通过分析全球3.4亿微博账户的留言,来判断民众的情绪。该公司发现,高兴时会买股票,而焦虑时就...
信息爆炸,带来海量信息,如何从一堆“垃圾”信息中淘出金子?昨日光博会上,中国工程院院士邬贺铨透露了个中秘密。他介绍,华尔街有一家名为“德温特资本市场”公司,通过分析全球3.4亿微博账户的留言,来判断民众的情绪。该公司发现,高兴时会买股票,而焦虑时就会抛售股票。他们就依此买卖股票,今年第一季度获得了7%的收益率。
邬贺铨表示,目前全球互联网每分钟生产63TB数据,而2011年全球人类信息总和则达到了1.8ZB,即相当于18亿个现在市面上常见的1TB移动硬盘,“世界正在进入"大数据"时代”。而这些动辄几十TB、数PB的“大数据”背后,蕴藏着商机、知识与洞见。
比如,美国总统奥巴马的竞选团队中就有数千名志愿者,他们通过社交网络和微博等收集选民的爱好和关注,并利用软件分析并建立选民档案。例如,某个选民在网上的大部分帖子都是关于环保和医疗成本,竞选团队就会通过电子邮件发一条源自奥巴马专门谈论环境问题的信息,“鼓动”选民支持总统连任。而美国谷歌公司,则通过分析网上搜索“哪里可以买感冒药”的用户,发现这些用户集中在哪些地区,从而成功预测该地区爆发了流感。
而在国内,阿里巴巴根据淘宝网上中小企业的交易状况,筛选出诚信企业提供无担保贷款,坏账率仅0.9%。
邬贺铨介绍,有研究表明,利用“大数据分析”美国每年可产生3000亿美元的医保盈余,令零售商提升六成利润,制造商减少一半的装配成本,同时催生一个150万人的数量分析行业。
他特别提到,硅谷一家气候公司通过分析几十年天气数据,预测任一农场明年的天气,以此向农户出售个性化保险,“如果中国也能引入,谷贱伤农、猪肉暴涨现象将可避免”。