主持人:各位好,欢迎收看本期橙色视点。随着1988年互联网的出现,你有没有发现,如今的我们已经进入了一个万物皆联网,无处不计算的世界呢?而这样的一个世界又可以将每一个地区的个别数据储成一个庞大的数据库供我们搜索,不过你有没有意识到,掌握了这些庞大的数据,其实是一个大的机遇,对政府,企业是,对我们每个普通人也是。
(画面)本周二晚,经济观察报·书评携手广西师范大学出版社·理想国,与嘉宾涂子沛、王煜全、姜奇平一起在北京师范大学就【“大数据”时代的公民生活】这个命题进行了一场有趣的讨论。主讲人涂子沛先生,《大数据》一书的作者提出:我们能从数据中发现以往不能发现的价值。因为摩尔定律和普适计算将生成一个机会更平等、信息更充分的时代,而一旦开放数据,那么创新将不再是精英们只有的特权,普通人也将能用数据来创新。那么将如波普尔所言,一个开放的社会,意味着人们把决定建立在他们自己的才智和掌控之上。
涂子沛:我们看到摩尔定律、普适计算、数据挖掘、社交媒体怎么会影响我们公民的生活。首先我认为摩尔定律跟普适计算它代表我国社会进入一个机会平等,信息更充分的社会,就是说你最后的成就,你能走多远,恐怕跟你出生,跟你家庭的情况,跟你的种族,跟你的性别,跟你以前种种情况下的约束的能量会越来越小。因为知识无所不在,信息自由的流动,我们这个社会变的越来越开放,每一个人在面对很多社会禁忌的时候,他可以利用自己的信息和知识去作出自己的决定,他不会盲从,我们以前的社会有很多禁忌,一个禁忌的社会,告诉你这个不能做,那个不能做,一个主动你就能改变的时代,因为资源就在那里,你不能去等其他的人,我们说公民一点,公民最主要的精神是什么?是积极的介入,积极的改变。
主持人:大数据时代也是一个前所未有紧密相联的时代。我们会发现,微博传播消息的速度比地震波还快,但这随之也带来一些问题,其中隐私权的问题就显得日益尖锐。在这个时代,我们应该如何来保护个人隐私呢?对这个问题,三位嘉宾各抒己见。
涂子沛:隐私问题是一个很大的问题,我的手机回国没多久,现在也有人打来推销东西,因为它背后是一个利益的驱动,刚才我们看到这里,有人发微博,能不能有一个反数据挖掘的手段,当然是有的,现在有很多平台,像facebook,新浪,你进来的时候就问你愿不愿意公开自己的数据。进来的时候就是说信息是公开的,但是你能不能选这个地方说信息不公开,新浪微博是可以的是吧。你对部分人开放,并不是代表它在后台不能搜索你的,其实它还是可以搜索你的,像海外的平台他们已经做到这个程度,因为隐私权是一个最大的争议,facebook怎么上新闻头条?它每次上新闻头条就是因为隐私权,它现在还设了一个首席隐私官,这个争议最大。如果它给你一个事先的权利,说你愿不愿意开放自己的数据,你不愿意开放的话就是锁上自己的数据,别人就搜索不了了,这是一个方法,还有其他的反挖掘。隐私这个东西,就是数据成为一个权利,隐私权是集中的体现为你管理自己数据的一个权利,你什么时候决定能够开放,什么时候决定能够编辑,什么时候决定这个信息可以删除。
姜奇平:我从产业和政策方向我估计是这样的,首先第一位是法律上要解决这个问题,首先第一位决定隐私开关权是交给消费者,这个是法律将来的共同趋势,中国也不例外,这个也是根本性的保证,所以它在我们的隐私里面你不打开别人不能搜你,相反的这是一个,具体还有几个趋势使隐私的状态得到根本性的改变,第一个是技术发展,我们现在的隐私讨厌在什么地方,就是推技术,但是将来是挖技术,这个挖技术是什么呢?你不要它不来,这个技术一旦变化,所有非垃圾的就没有了,这时候你可以发现,他挖的隐私没有意义了,这是一种情况,由于技术类型的变化。另外一个是产业变化带来形势的变化。第二比如说将来会出现原数据和加工数据分离的趋势,比如现在在阿里巴巴的原始数据,你能读你出你情书这种类型的数据是绝对保护的,任何人都不能读,但是经过打马赛克以后或者被编码化以后或者粉碎化以后,他有可能被提炼出来,那么这个提炼出来的信息也可能是某某人,或者某某号,比如说这里面买鞋类的信息的一个剧目。第三个方法是什么呢?商业模式会对隐私权造成巨大的影响,我们现在考虑的都是大批量的穿梭,如果是一对一就不一样了,因为什么呢?你看大夫的时候,谁会说面对一个大夫隐瞒自己的隐私,所以可见当你一对一时候和一对多的时候是不一样的,你把你的信息可以给满大世界的人去看和这个人正好就可以帮助你,帮完了你他连你姓名都不知道是完全不一样的,这第三个。第四是人们消费习惯不一样,刚才我打的比喻,我说现在你相当于大家都穿着西服戈履,你土人透明化了,变成比基尼了,大家都会觉得非常不自在,但是将来如果说进入一个透明化的世界,大家都穿比基尼的时候,你突然西服戈履跑沙滩上,人家说你这人有毛病,所以这个时候实际上大家的隐私还有另外一中心态,就是看大家,如果大家都是这个水平那我也要这个水平,大家都不是这个水平我也不是这个水平,所以这些事情随着时间发展我相信不会像我们今天看来的这么严重,但是不管怎么样法律在这里起关键作用,就是说主动权在谁手里,如果你有开关权一切都OK了,现在的问题我们现在不是这种情况,以后会慢慢改变。
王煜全:因为涂老师也讲了,社会网络是真正特别巨大的潮流,这个潮流是不可推断的,会使我们人进入到另一个时代,数字菠萝化时代。就是你想有隐私也不太可能有那么多了,大家大学的时候,你一定住过宿舍,你们同宿舍想在大学期间维系这四年的隐私容易吗?
这是第一,隐私必然降低。姜老师说未来的人必然会适应,因为隐私降低大家还要活,所以大家就一定会适应,而且会衍生出另外一套方法来。第二个就是隐私的保护是巨难的事,为什么呢?我们是研究数据的,你把A数据级和B数据集放到一起,尤其以前的数据搁数据没有参照系这个很难做分析,现在一个参照系就是以人为参照,大数据最要命的是什么,我们说同一个用户的身份,叫user ID,如果我拿手机做用户身份,你在手机上干的任何事我都能汇总起来,这我分析你,我比你还了解你自己,所以这个就造成什么问题,就是说如果你掌握了这些数据,那你知道的事就多了,所以我认为未来其实对隐私这件事还不是今天我们谈的这点问题,是个巨大的问题,但是第三点大家别担心,那个问题很遥远,就是运营商不知道他们家的数据那么值钱,他也不屑于采,这个问题在美国谈还略有点意义,因为美国已经开始在整合了,涂老师数据讲了很多,各部门一整合,因为我们做数据的知道,各部门数据一整合,尤其是以用户为核心点把数据一整合,你对用户的行为了解会惊人的准确,所以这个很恐怖,你知道他的社保数据,你知道他的银行数据,就会出很多事,比如说诈骗社保的就出来了,银行里都有钱他还去拿社保,现在美国发现这个事很严肃,我宁可不抓这个诈骗犯,我也不能让数据整合,所以他对隐私考虑的很严重,中国这事想都别想,他们两个部门的数据直接整合不起来,所以在中国这事还很遥远,我们先朝着整合数据努力,即使那是未来的痛,那也是个美好的痛,因为等到我们能谈那个痛的时候,说明我们离“大数据”不远了。
主持人:涂子沛先生在《大数据》一书中提出:一个真正的信息社会,首先是一个公民社会,那么做为公民个人又应该如何来对待自己的数据及建立自己的数据库呢?让我们接着听三位嘉宾在现场各自独到的理解。
涂子沛:如果你对这个行为有个分析,这个行为的分析其实这里意味着很多的商机,这个跟王总再讨论一下,什么商机呢?美国有一些应用,如果你把这部分数据全部提交给别人,他们会进行一些更深层的分析,比如说分析你的消费行为合不合理。是不是什么东西买多了,什么东西买少了,还有什么东西是不是买的特别贵,它们在量化你自己的时候,它发现其实你自己的行为根本不像你想象的那样,就是你对自己的感觉实际上是有盲区的,它通过这种量化就可以纠正自己的行为,让自己的行为更加健康,搜集个人的数据也是有价值的.
姜奇平:我就不讲那么多理论了,我谈谈我个人的感受,我自己是怎么管理的,我写日记跟别人不一样,我白天的事全都不记,我专门记我的梦,我做了什么梦,白天的事过去就过去了,我做这个梦是什么是分析,对我进行心理分析,因为梦它是非常真实的,是在大数据这个层面才能挖掘出来的东西,我交给大家一招,你们大家都没有孩子,如果有孩子就可以看出,比如问你小孩,说他晚上梦的是大灰狼还是老巫婆,他如果说大灰狼一定是丈夫对他批评太严厉了,如果是老巫婆一定是夫人太严厉了,因为什么呢?因为小孩受到心理压力了,在臆意层面受到心理压力了,他说不出来了,他也不敢对大人反抗,但是他晚上胡乱做梦的时候是毫无障碍了,这时候他就随意匹配,因为他看到什么,他看到的不是公的就是母的,这时候就可以匹配。再有一个你们都有一个印象,你要是做梦发大水,肯定是你喝水喝多了没上厕所,这时候你可以分析出什么,你可以分析出自己的快乐和不快乐的根源在什么地方,比如说你焦虑,焦虑状态,焦虑到什么程度或者说这个时候可以达到一个状态,就是所谓的自知之明,自己知道自己太困难了,你要能知道自己,刚才我非常赞成涂老师说的,你说别人的时候说的头头是道,等说到你自己的时候比较困难,为什么?就因为你自我隐藏的太深了,藏在了潜意识层面,大数据干嘛的?就是干这些用的,所以将来我建议大家除了记白天的事,晚上还可以记一下梦。
王煜全:一直有个说法,现在社会学那帮人对人研究的兴趣还不如行为经济学,因为行为经济学是要看结果的,社会学太理论,我们总结“大数据”给我们的经验教训,你要太理论了没有数据做支持就会脱离实际,比如说某个叫马克思主义的东西,我们说数据支持有点弱,那么必须要数据支持,其实行为经济学里面最爱做数据分析了,哪怕在学校里也是实证得来的。如果这个人身材更高,他谈恋爱的时候会有优势,所以矮的人他能够量化计算,他要每年多挣多少钱才能谈到差不多同样的女朋友数量,才能弥补这数,所以个矮的各位赶紧学习,赶紧挣钱吧,要不然在找朋友上很有劣势,那么这个东西可以看到量化,所以他的背后理论依据是什么,其实我们原来在做学校学生研究的时候,原来专门找过高校的学生,去跟踪他们的行为也得到了验证,什么意思呢?说简单点就是社会地位高的人倾向于占有更多的社会资源,在学生里社会地位高,比如说这人吉他弹的特好被别人崇拜或者这个人是他们的戏剧社的社长,被一堆小女孩追着,他倾向于占有更好的社会资源什么意思呢?我们当时在学校里发现他的女朋友一定漂亮,所以回去看看你们班女朋友漂亮的孩子一定有出众的地方,当然不一定成绩好,别的地方好,受别人追捧。当然这事我们现在想办法在干嘛?在微博里面做全样本的量化分析,这个是据我所知国外也没人干过,我们是干一些史无前例的事,所以我跟高校有合作,我们跟清华合作,我们的目标是把我们的文章登在顶尖论文期刊上,因为没人干过,怎么测呢?我也告诉大家,看看你们能不能做,能做大家合作,某个人他拥有社会资源怎么测,就是他在微博里双向好友,代表你认识的,互相互粉的好友,你的异性好友的年龄和你的平均年龄差,比如说我40岁,我是一个看校门的。另外一个人40岁,他是一个亿万富翁,你猜我们俩谁更有可能认识更多年轻漂亮的女孩呢?我想把它量化出来,通过你的异性好友跟你年龄差来推算你是不是掌握更好的社会资源。
主持人:数据时代是大众创新的时代,越来越多的平民英雄将呼之欲出。“每一个人的心里,都有理想主义的火花,它可以被燃成火焰,进而迸发出非凡的能量和结果。”平民英雄的伟大之处在于他们以自己的行动唤起对人性本位的回归,重构着时代的道德图景。这是涂子沛先生在《大数据》一书中始终强调一个观点,也希望对各位有所启发,好感谢收看本期节目,再见。