导读:我宁愿赌大数据不会使人类陷于宿命,大数据只是把人性中可预测的部分外包给机器,让人将自由更聚焦于只属于自己的独一无二的部分。 美国物理学会院士巴拉巴西的新著《爆发》,是讨论大数据问题的最新一部商业论著,可以被视为大数据的商业哲学。 作为复杂网...
我宁愿赌大数据不会使人类陷于宿命,大数据只是把人性中可预测的部分外包给机器,让人将自由更聚焦于只属于自己的独一无二的部分。美国物理学会院士巴拉巴西的新著《爆发》,是讨论大数据问题的最新一部商业论著,可以被视为大数据的商业哲学。
作为复杂网络研究的权威,巴拉巴西在大数据兴起的背景下,得出一个结论性的判断,认为数据、科学以及技术的合力,会使得人类变得比预期中更容易预测得多。这无疑会增强人们对Facebook所做的时间轴(Timeline)这类商业创新的信心。
这本书除了从现象上讨论大数据将带来的商业影响外,特别深入浅出地提炼出大数据背后的一个基本面上的哲学问题。《爆发》在最新的时间、最新的领域,讨论了一个最古老的问题:到底应该用决定论的观点,还是用非决定论的观点,看待人类行为?
这本书写法非常奇特,每章由科学和历史两部分交织组成。科学的部分讨论用大数据能否测准人类行为,就象物理学家讨论测不准定理一样。历史的部分用故事说明人类行为确曾被不可思议地测准过。
这本书的历史部分写得非常富有趣味和悬念,我是象看金庸的武侠小说那样,一口气读下来的。它差不多就是一部小说,情节是如此吸引人,以至看到一半,我开始扔掉每章的前半部分,专看“小说”部分,一直看到主人公赛克勒被处死的大结局。这种感觉有点象看电视连续剧,被“欲知后事如何”吸引得顾不上按部就班一集一集观看,直接到百度(微博)去搜分集剧情简介,先睹为快。
故事讲的是匈牙利十字军的一段历史,主人公赛克勒受主教之命,征召农民组成十字军。在出征半路上,与同为十字军的贵族军发生一场至今也没搞清原因的“误会”。结果大水冲了龙王庙,十字军内部草根与精英打了起来,贵族军杀了两千农民军。这一事变,将赛克勒激反,走上领导草根起义之路。国王身边的泰勒格迪事先曾准确预言事情的走向,他认为,主教发动农民军充当十字军过于冒险,因为这些农民从军主要并非为了信仰,而是为了摆脱贵族劳役,他们手中有了武器,一旦遇到突发事件就有掉头将矛头直指国王和贵族的危险。这样的事情结果还真发生了。可惜农民军在造反打下大半个匈牙利后,最终被贵族军镇压,赛克勒兵败被擒,坐上“燃烧的御座”,带上烧红的铁制王冠,被当众处死。
这本书虽然可以当历史小说来看,但它的重心在每章的前半部分,即讨论科学的部分。历史故事只是为了证明作者的观点:人类行为90%是可以预测的,就象泰勒格迪做到的那样。
在日趋精密的数字技术条件下,有了从四处搜集来的信息,我们不会再把人类的行为视为互不相关、随意偶然的独立事件。相反,它们应该是相互依存的奇妙大网的一部分,是相互串联的故事集中的一个片段。它们会在不经意时显示次序,在意想不到之处偶然出现。人类行为遵循着一套简单并可重复的模型,而这些模型受制于更加广泛的规律。
巴拉巴西这里讲的实际是语义网络的道理。根据语义网络理论,一个词最初有许多歧义,但一旦被放在由它的上下文编织的语境网络中,它的微言大义就会被精确锁定。
如果把人类行为比喻成这个词的话,人的内心想法十分微妙,往往只可意会不可言传,说出就是错,自身都可能都搞不清楚自己想要的到底是什么。但借助大数据,可以象解梦那样,把这种潜意识层面的不可道之道,借助种种蛛丝马迹,判断出来。
爆发的规律,被作者视为宇宙运行的科学。人类行为并不象自然界那样多是随机运动,而可能在意向作用下表现出非常规的突变的行为。例如,赛克勒出兵时压根就没想过起义,但当手下两千人被“自己人”残杀时,一怒之下导致了爆发,结果目标从对外转成了对内。
爆发是那种脱离自然常规,但符合人的规律的行为。对农民军来说,爆发具有内因,这个内因就是泰勒格迪看到的那个基本面上的原因,即农民因受压迫而产生对贵族的仇视。作者认为,当我们将生活数字化、公式化以及模型化的时候,我们会发现其实大家都非常相似。我们都具有爆发式,而且非常规律。看上去很随意、很偶然,但却极其容易被预测。
如果我们把泰勒格迪不是当作一个人,而是当作一种大数据机制,泰勒格迪无非就是通过经验数据的搜索、分析、挖掘,最终猜测赛克勒们的爆发行为的一套人工智能机理的象征。从这个意义上说,Facebook的时间轴就是个泰勒格迪。
巴拉巴西的观点虽然独特,但并没有从哲学的谱系中逃逸。作者采用的“科学-历史”叙事框架,正构成本书所涉及问题的元问题本身。当科学和历史被“主义”化为科学主义和历史主义时,二者的对立构成的是一个老问题:自然是决定论的,历史是非决定论的。如果把社会发展当作一个自然过程,作为科学的对象,它是有规律、可预测的;如果把社会发展当作一个历史过程,作为(历史主义的)历史学的对象,它是无规律、不可预测的。介于二者之间的观点认为,社会发展是一个自然历史过程。
按巴拉巴西的观点,自然与历史的比重,大约应是90%与10%的关系。这就不难理解,作者对波普尔的观点——否定历史决定论的观点——基本是否定的。由此可以看出巴拉巴西观点在哲学上的大致定位。
作为《链接》一书的作者,巴拉巴西还是一位知名的网络问题专家。《爆发》一书的新意,并不在于提出了新的历史观,而在于结合科学技术发展新的事实,对特定历史观进行了重新论证。作为网络研究者,我对此也很感兴趣。尤其其中涉及的大数据,正是下一步互联网发展的重要方向,Facebook推出的时间轴(Timeline)与本书反复提到的Lifelinear都是当前网络前沿的时尚,代表着人工智能实践的新进展。
就此谈谈我个人的判断。书中说到的技术事实的部分是可信的。例如谈及手机运营商掌握着我们的实时通信信息和行踪等。其实网络实践比书中说的更为丰富。目前,这种可供分析人类行为的“泰勒格迪”系统主要有几大类,一类是采集分析个人的地球上的全部运动轨迹(通过LBS采集);一类是采集分析个人的全部支付记录(通过在线支付采集);一类是采集分析个人的全部交往记录(通过SNS采集);一类是采集分析个人的全部言行记录(通过邮件、文档、Timeline、视频监控等采集)。
商家通过这些数据,确实可以预测客户的行为,从而提供有别于他人的个性化服务。从这个意义上来说,巴拉巴西的预言是有道理的。
但是,这些事实是否足以改变“决定论-非决定论”这个水平上的哲学结论,每个人可能都会有自己的判断。人具有自由意志,这是不同于分子随机运动之处。如果泰勒格迪成了国王,所有的人是不是都应变为宿命论者?我们有可能成功预测到一个沉默的人在某个时刻突然爆发,但要猜透这个人的斯芬克斯之谜,光有科学和技术可能还是不够的。物理学家也许希望发现历史的宿命,但人通过知识获得解放,不仅是为了排除不可能的自由,更是为了增加可能的选择。
我宁愿赌大数据不会使人类陷于宿命,大数据只是把人性中可预测的部分外包给机器,让人将自由更聚焦于只属于自己的独一无二的部分。