首页 » 大数据 » 大数据全文在线阅读

《大数据》访谈 大数据时代的“中国梦”共识网专访《大数据》作者涂子沛

关灯直达底部

□采访人:杨传银、郑子蒙 □访谈时间:2012年7月2日

大数据:正在到来的数据革命

杨传银:您写《大数据》这本书的初衷在哪里?您说这不是一本纯粹谈技术的书,而是以技术为背景探讨人和社会的关系的书,这个观察和写作的角度是从什么时候开始建立的?

涂子沛:这本书应该说是时代浪潮的一个产物。我是理工科出身,大学毕业后我的第一份工作就是数据库程序员。十几年之后,我在美国的第一份工作是数据仓库程序员,从数据库变成了数据仓库,这也是我们从小数据时代进入大数据时代的明证。但更巧的是,十几年前,我在中国为政府部门开发数据管理的软件,现在在美国的工作,恰恰又是为美国的政府部门提供数据管理、分析的解决方案。这是一种“轮回”,也是一种“上升”,这种经历让我找到了一个很好的角度来观察、体验、分析两个不同国家如何解决、处理一个相同的问题。无疑,中国在数据收集、使用和管理的各个方面,和美国相比都存在差距。但我发现,最大的差距还是意识和态度。我们的传统文化,长期重定性、轻定量,重观点、轻数据。在现实生活中,数据也往往成为一个任人打扮的小姑娘,得不到应有的尊重,数据的公信力严重不足。但正在到来的大数据时代,数据的作用将前所未有地凸显,数据将成为国家竞争的前沿、企业创新的来源。这些传统和现实的不足,是我们中国社会迈进大数据时代的制约和障碍,我们应该如何应对?对这个问题的思考,催生了这本书。

这本书首先是一本信息时代的科普读本。但我想写的,不仅仅是一本科普书。1997年,我在广东省边防局开发“反偷渡信息管理系统”的软件,那时候我就明白了,要编好一个程序,就必须是商务过程的专家。其实,技术工作永远是从业务中来、到业务中去的,技术归根到底是为人和社会服务的。这个时代,我们好比身处一列快速奔驰的列车,技术就是它的发动机,我觉得幸运的是,作为信息技术的从业者,我在这台发动机的核心部件上工作过,程序员把自己对业务的理解、自己的理念转化为软件,来改造世界。但这不够,因为发动机再强大、程序员再能干也不够,火车要开到哪里去,是政治家、企业家在掌舵领航的。

基于这些体会,我努力尝试在这本书中融合技术、政治、商业三个方面的视角。而且,这本书谈的是“数据革命”,我想任何一种革命,首先都是社会层面的事。

大数据时代会使不理性的人更不理性

杨传银:大数据时代有没有可能使不理性的人更不理性呢?

涂子沛:有可能。这是我下一本书计划要讨论的内容。下一本书,我想探讨大数据时代潜在的弊端。这个时代,是个数据奔流的时代,信息无处不在。一个信息开放社会给不理性的人带来的问题是,可能导致他“信息过度窄化”,例如,信息开放的时候,一个偏激的人更容易找到同类,然后放大异常,会变得更加偏激,而在一个信息流动没那么快、相对封闭的时代,偏激的人像是一个“孤岛”,他更有可能会怀疑自己。仔细观察信息时代中的人的境况,你会发现知识水平越高的人往往越顽固,这是因为他更知道怎么去获得支持自己的信息、形成自己的气场。

数据开放的界限

杨传银:在数据开放的过程中,政府、公司和个人可能是不一样的,这个数据开放的界限在哪里?

涂子沛:目前,数据开放已经形成了一股潮流。在各个国家数据开放的实践中,基本形成了两个界限,第一就是不危及国家安全,第二是不能侵犯公民隐私。当然,对商业组织来说,还要顾及它的商业利益。

在这几个界限之外的数据,都应该开放,而且是免费开放,其中的道理也很简单,政府收集了数据,用的是纳税人的钱、收集的也是关于纳税人的数据,自然要向纳税人开放。你不能用我的钳子、拨了我的毛,再卖给我收钱,对不对?英国社会这方面的步子迈得比美国还大,一个新的名词——公民数据权,也应运而生了。这是公共领域,而商业领域,数据开放也是一个大的趋势,我们也能看到各种各样的商业数据正在走向开放。

对个人来说,关键在于要有能力、渠道、权利去管理和自己身份相关的信息,你可以决定什么时候公开,以及用什么方式公开和自己相关的数据和信息。换言之,你个人对自己的数据必须要有控制权。因为这关系到你的隐私权。

中国人有不尊重数据的传统

杨传银:现在国内对数据的重视您关注得多吗?据说国内可能是对内做统计,但是对外创造数据。

涂子沛:我很关注,但总的情况是,不尽人意。我在书中详细阐述了,中国人缺乏尊重数据的传统。我们现在好一些,认识到了数据的重要性,但还是有很多问题,集中表现在,数据普遍缺乏公信力。发布数据,是一件很严肃的工作,我在书中曾经提到,2000年美国国会甚至专门通过了《数据质量法》来确保政府发布数据的质量。这个法律规定,政府发布的数据,其产生方法必须是透明的,也就是说,要说清楚,数据怎么来的,每一个数据,都要有“出生证”,说明其产生的方法,这样做了,这个数据就是可以“复制”的,这意味着,个人可以通过同样的方法,获得和政府同样的数据和结论。美国的这些经验,我认为,是值得我们借鉴的。

此外,我们还要回到刚刚谈到的开放数据,一个数据是孤立的、难分对错,一片数据才可以互相支持、互证真相,所以,要提高数据的公信力,最好的办法就是开放数据、让老百姓获得一个数据背后的一片数据。

我们社会常见的利用数据弄虚作假的问题,可以总结为几个方面:一是一叶障目,片面解释一个数据,其中也可能是别有用心、故意为之;二是人为地控制数据的收集和统计过程,使结果产生扭曲和偏差;三是暗箱操作、修改数据;最后就是无中生有、“创造”数据了,这是最糟糕的,因为假数据比没数据对社会的危害还要大。

中美政府信息开放的差异

杨传银:您觉得中美政府在信息开放方面有哪些差异,形成这种差异的原因在哪里?

涂子沛:最大的差别当然是我们起步较晚,美国1967年就通过了《信息自由法》,中国社会在2008年前后,才制定了《政府信息公开条例》,而且实施4年以来,总体情况还不太理想。

除了起步晚,各方面制约的力量也还不成熟。信息公开是一件很难的事情,难就难在没有人愿意主动公开!虽然一谈到透明和公开,大多数人都会认可这是正确的价值观,但一旦要自己透明、要自己公开,那公开和透明就会立刻转化为一种威胁,美国政府也不例外。它的《信息自由法》,也是经历了十多年的论证、辩论甚至激烈的争议才出台的,立法过程中,政府部门还坚决表示反对。甚至1967年美国的《信息自由法》通过之后,政府部门也是消极应对的,对于公民提出披露信息的要求,政府部门往往以各种理由搪塞、拖延。后来在公民团体、新闻记者的批评和抗议中,美国国会在1972年提出了《信息自由法修正案》。该法规定,如果政府拒绝公民的信息公开要求,公民可以提起司法诉讼,而法院才拥有信息是否公开的最终裁判权。这个法律颁布之后,才真正打开了政府信息公开的大门。

所以,信息公开,不仅要有民间的诉求,还需要新闻界以及司法力量对政府的监督,我们中国的情况,这几方面的力量都明显还火候不够。

中国的公民社会建设,需要大众启蒙,也需要“开路先锋”

杨传银:您提到了美国推动信息公开的过程是非常艰难的,法院、新闻界和民间在这个过程中都付出了努力,您觉得如果在中国来推动这件事可以从哪方面努力?

涂子沛:美国社会最后达成了信息公开的共识,主要原因在于它的体制,权力是需要制衡的。但我在这里更想讨论一下社会层面的努力。

公民社会的要义在于自由、平等、责任和参与。我在书中也强调,一个真正的信息社会,首先是一个公民社会。没有人的自由和平等,就不可能有真正的信息自由和平等。自由和平等是公民社会的特点,但要建设一个公民社会,这还不够,还需要我们的公民愿意承担公共责任、参与公共事务。通过意见表达,凡事发出声音,防止政府犯错误。防止我们的政府犯下错误,是我们每一个公民的责任,公民社会是一个需要公共精神、能量和想象力的社会。当然,谈到参与,还有一个机制的问题。就是老百姓能够自由地组织起来,形成团体,他们的声音才会被放大,最后形成一个防止政府犯下错误的监督力量。

在一个缺乏参与精神的社会,首要的工作是大众启蒙,也就是需要一些人来做表率、做开路先锋。我们这个社会,也总是有人愿意来做开路先锋和道德楷模的,中国社会已经出现了不少这种先锋人物。“那美好的仗我已经打过,当跑的路我已经跑尽,所信的道我已经守住。从此以后,有公义的冠冕为我存留。”我在书中引用了这段话来形容美国的国会议员摩斯,他是美国的《信息自由法》之父,他一直认为信息公开应该立法,得罪了几任总统,也很孤立,但是他始终坚持。他的坚持和努力历经十多年,发生了很多错综复杂、戏剧性的故事,才实现了信息公开立法的目标。

我们现在特别需要这种开路先锋和道德楷模的力量。他们是少数人,但历史,常常就是由这些人改变和创造的。我愿意和大家分享我书中的这样一句话:

“永远不要怀疑:那一小部分有思想并且执著努力的公民能够改变这个世界。事实上,人类的历史从来都是这样。”(本书第239页)

民主的本质就是参与和妥协

杨传银:但是放在中国,您刚刚说的这些问题恰恰是中国存在的,如果要把您在书中提到的这些选择在中国落实的话,还是存在很难突破的一个问题。

涂子沛:突破的关键,还是培养公民精神的问题。大家愿意去参与公共事务,愿意去发言,情况就会彻底改变。我们可以看看古今中外的历史,专制制度为什么会存在?这种制度的存在,其实是我们大部分人理性选择的结果。专制者把你的一部分权利拿掉了,被拿掉权利的人就在想:我要是反抗,把这个权利夺回来,成本和收益各有多大呢?他一计算,发现他如果要拿回他失去的权利,和专制者对抗,他可能要失去更多,成本比收益大,理解这个问题的关键是:当一个人通过抗争从专制者那里拿回了这个权利,受益的将是一个社会的全体成员,他们都可能重新获得这个权利。也就是说,整个群体都受益,但代价却可能要少数人付。每个人一理性计算,结果不约而同都放弃了。专制者其实也在计算,他在找那个专制的“度”,把自己的专制放在一个大家可以适度容忍的框架里面,因为,他不怕一个人反抗,他怕的是大家都反抗,如果超出那个度,引起大多数人的反抗,那他就完蛋了。所以要破局,主要看有多少人参与,大家都参与,形成一个集体行动的态势,情况就会彻底改变。这也是专制者要不遗余力打压集体行动的原因,一旦有集体行动,他就把那个头头打掉,其他人一看做头头要付出这么大的代价,结果就又放弃了。正因为如此,专制制度才会存在。

杨传银:击碎这一块的可能性在哪里呢?

涂子沛:集体行动的形成,最重要的是民众的自觉,他们知道了自己必须要参与。中国人的参与感比较差,我们长期处于农业社会,农业社会是靠天吃饭的,靠血缘关系,靠地、靠自己,工业社会就不一样了,是一个大协作的社会,你必须要有公共精神、协作精神。中国人为什么公共精神、协作精神比较差,跟我们进入工业社会的时间比较短也是有关系的。

当然我们更希望体制能够建立更好的分权制衡和监督,但是如果公民社会真正成熟了,其他的事情将是一个由下而上的过程,自然而然就会发生、做到了。

我觉得广东现在就做得很好,它把非政府组织放开了,看起来这是一小步,其实是历史的一大步,因为你一放开,老百姓就可以自由结成团体,他们会自动寻求把利益诉求捆绑在一起,一旦捆绑在一起,形成一个团体了,现代信息社会有很多工具,人其实很容易连接起来的,就会形成一股力量,这股力量就会形成一种监督。

杨传银:刚才您也提到了有一些人是要当英雄来推动这个事情,另一方面来说美国政府或者资本一方是有一定的妥协的,您在书中也提到了关于妥协的问题。但是在许多环境之下这个妥协可能是很有限的,比如在极权国家里。

涂子沛:民主的本质就是妥协。一个善于妥协的社会,才是一个理性的社会。妥协的发生也是有一个临界点的,当有越来越多的人参与的时候他就必须妥协,问题是维权人士常常是孤岛,给予支援的人太少,伸出手的人太少,最后轮到自己头上就嗷嗷叫,别人再受苦受难,我视而不见,过好自己的日子就行了。所以还是缺少一个公共精神,一个参与的精神。

中国的当务之急是“代表专业化”和“民主操练”

杨传银:您在书中提到了关于利益代表机制问题,在中国现在也是很显著的一个问题,其中也涉及关于结社自由的授权制度,我不知道您在国外对这块了解得怎么样?

涂子沛:我先说一下利益代表,我觉得我们可以做的一件事情是把代表专业化,这是比较务实的,一旦专业化会出现很多新的情况和气象,那个大气氛就会立刻完全不一样了。现在是兼职,一旦专业化变成全职的,提出的议案质量也会更高。

杨传银:实际上这是很系统的一个问题,提到代表专业化首先一个前提就是代表的产生问题,可能在中国人大代表的产生,我们从结果上来看代表的身份比例,官员可能是占一大部分,富人是占更大的一部分。

涂子沛:我还是觉得专业化是一个途径,一旦专业化的话,产生的途径就会不一样了,就会有更多的人想去当,会有更多的人站出来参选。

杨传银:就像您刚才说的,去年就出现了一波独立参选人大代表的热潮,但是各个地方都出现了打压的现象。

涂子沛:这种现象的出现,有它的必然性,这是一个博弈的过程,社会的进步就是这样产生的,很多人都在做铺路石,大家来参与,这个社会才会进步。我们这个社会其实呼唤这种道德英雄,像摩斯这种,也呼唤像独立参选人这样的人,我们不仅呼唤普通的公民觉醒,我们也需要道德英雄,需要开路先锋。

杨传银:前段时间柳传志说一人一票可能把中国带进万劫不复的问题,您怎么看这个问题?

涂子沛:那个信息好像传达得不完全,有点断章取义。

杨传银:有偏差,但是也是反映了一个思潮。

涂子沛:我是这么看的,民主是需要操练的,一人一票是需要操练的。台湾其实也走过了这种混乱期,今天的台湾,我们看到他们败选之后,已经像美国的候选人一样站出来发表败选感言,说我认输,我祝贺你,这都是谦谦君子之风,是一步一步操练体会出来的,当他犯了错误之后他才知道我不该这么做,所以民主是需要操练的。操练一两届,大家都会成熟,每个人都会找到合适的方式。但是在找到之前,可能是有这样一个阶段和过程的。比如现在基层的村委会的选举,现在贿选得很厉害。我们还在这个过程当中徘徊。

杨传银:我觉得这是很荒谬的事情,一边说国民素质不高,一边又在最基层可能相对来说从文化素质上来说最不高的群体里搞直接的民主。

涂子沛:对,存在这个问题。但也要看到,在最普通的老百姓中操练,有一天它最终会成熟的,我相信老百姓是会觉醒的,当大家认真来投这一票的时候,民主制度就实现了。

华人社会需要政治参与

杨传银:您在美国有没有参与类似的公民运动,华人社会的政治参与度如何呢?

涂子沛:我现在担任中国旅美科技协会匹兹堡分会的主席,这是我们当地最大的一个华人组织,我们这个组织常常代表华人社区,参与美国社会的一些公益活动。

我们华人有很多优点,最大优点就是遵纪守法、勤劳肯干,但在公共生活的参与上,确实有很多不足。例如公共活动的募款,一般来说,向华人募款比较困难。这里有很多原因,不是因为华人没有钱,华人大部分都是中产阶级,而是因为我们没有这个传统。但美国人一般都乐于捐款,大部分的家庭每年都有这部分预算,你说清楚了募款的目的,捐或不捐,一般比较干脆爽快。但我们华人就不一样了,大部分华人的生存状态还是各人自扫门前雪,过好自己的小生活,其他事情不关心、也不过问。回到刚才谈到的,这可能是农业社会的传统,不仅是中国大陆,海外的华人也是这样。我们进入工业社会的时间较短,还不习惯协作介入公共生活、营造公共价值。

这是普遍现象,当然也不能绝对化,我也看到了一些好的方面。我碰到一个台湾来的人,我觉得他介入公共生活就很好,哪里有选举,他就去投票、募款,各种公益活动上也能见到他的身影,我说你为什么这么积极,他说了一句话,给我印象非常深刻,他说“我比美国人还热爱美国。因为美国人生来就是美国人,我是二次选择要做美国人的,我珍惜这种权利和参与”。认识到公共参与的重要性,其实就是认识到,现代生活是群体性的,如果脱离群体,个人就会原子化,难以发出自己的声音,这正是专制者求之不得的。

“美国梦”与“中国梦”

杨传银:您的书里前面提到了奥巴马和美国的一人一票,里面谈到了中国梦、美国梦的问题,您最初的理想是考公务员进入政府,也算是改变中国的一个梦想。以您的亲身体会来讲,美国梦和中国梦的差别在哪里?

涂子沛:我在书中提及了美国社会有很多外来的移民,解释了他们为什么要去美国、又如何在美国获得成功的故事,其中,有政治家、企业家,也有科学家,等等。我想,美国梦最吸引人的地方,在于这是一个开放的社会、拥有相对公平的制度,在这样一个环境中,只要通过自己的不懈努力,即使是移民,也能够获得成功。一人一票,其实代表着一种自由和平等。这是美国梦的精髓吧。

虽然我现在在海外工作和生活,内心深处,却仍然有一个中国梦,我们一定会进步,这种进步,应该以全世界的文明为基础。我们未来的发展,不仅要重科技、重创新,快步迈向信息社会,还要建设一个公民社会。因为只有在一个自由、平等的社会里,每一个人的创造力才能真正迸发出来,我们的社会才会涌现乔布斯、扎克伯格这种创新型人才。创新,才是一个国家和社会持续发展的真正动力。

这是我写《大数据》一书的初衷,也是我的“中国梦”。