baidu
互联网 一舟书库

一舟书评 读(英)舍恩伯格《大数据时代》

 

 

 

  大数据并非新近才有的现象。对茹毛饮血的原始人而言,草原中鹿群的数量就是难以统计的big data。而对于19世纪末的美国政府来说,算清楚国内究竟人口几何也是一个天大的难题。但今天我们宣称进入了“大数据时代”,原因是找到了降服它们的办法。

 

  能有效处理大数据的是功能强大的“云计算机”,这指的是一长串强悍单机或服务器的结合体。作为普通人,我们没有必要深究其中的技术原理,值得了解的是“大数据时代”会给生活带来哪些改变,而这正是本书准备讲述的。

 

  大数据时代首先将使抽样调查之类统计分析手段逐步淡出市场。我们之所以推崇抽样调查,很大原因是我们难以负担对全部数据——例如一个万人学校所有学生对拾金不昧的看法——进行统计研究的成本。但云计算最擅长的就是及时吞吐处理海量信息,因此很容易想到,大数据的优势之一是能保证各种微弱个体或观点得以体现存在感,而不是轻易被样本代表进而湮灭,这实际上也正是“长尾理论”的出发点。

 

  大数据方式将能显著提升运行决策效率。以书中所说,谷歌公司能够比美国疾控中心更早知道发生流感的地域,原因是疾控中心需要等待材料整理和逐级上报,而谷歌只需查看当天哪些地区搜索感冒药次数明显上升就可以了。当然必须承认,这样的统计结果不甚精确,因此大数据处理不能用于指导卫星发射。但是当需要处理的事务并不要求极端精准时,大数据方式对效率的提升则将显而易见。书中介绍,VISA信用卡公司在引入Hadoop系统后,统计处理730亿单交易的时间从一个月缩减至13分钟,这足以掀起一场商业革命。一个更为明晰的例子则是想象购买绿豆:你不会为购买同样重量的绿豆去要求其中颗粒数相同,这种牺牲精确性换来效率的方式就是大数据处理。

 

  第三种改变是更多考虑“WHAT”而不是“WHY”,这实际上是计算机本身的功能使然。书中写道,沃尔玛超市的大数据系统显示将蛋挞、手电筒和飓风用品摆在一起出售会有更好的市场,虽然这里的原因人类显而易见,可计算机得出此结论并非基于因果律。作者指出,商业模式的进益正有必要从重视商品间的因果关系转向相关关系。因为前者往往需要雇佣一堆成本不菲的专家,而后者价格低廉且效率更高。亚马逊公司创业之初,即雇佣了数十位书评家在线为读者服务,然而当基于大数据分析的“自动匹配荐书”系统建成后,他们很快失掉了工作。

 

  在大数据时代,我们这样的平凡人并非看客而是具体的建设者。我们在网络中的每一份订单、每一篇日志、每一个评论,乃至我们在线下的各种交易、传递、分享都被汇总为大数据信息库中的元素。“人肉搜索”得以流行,其技术基础也即是对散漫于网络上下的个体信息有了足够的统计汇总能力。因此本书有一个非常贴切的副题,叫做“生活、工作与思维的大变革”。在这样的时代,你要分外小心,因为你的一举一动时刻都会被记录,而且将很难擦除。你喜悦于享用大数据的成果,就也不得不时时成为它统计的对象。这是时代展示的力量,你无法逃避,只能迎合并适应。

 

 

想看这本书?您可尝试网盘搜索(不会点这里)、网店购买或者在线阅读
网盘搜索
点击访问新浪共享资料 点击访问百度文库
 
点击访问豆丁网
点击访问百度云盘
网店购买
点击访问当当网
点击访问卓越网
在线阅读
点击访问网易读书频道
点击访问搜狐读书频道
任何意见建议,请通过以下方式与本站联系
电子邮件:guyizhou@hotmail.com
新浪微博:请关注@一舟书库