首页 » 大数据 » 大数据全文在线阅读

《大数据》第七章 全国隐私风波

关灯直达底部

文明,就是向拥有隐私权的社会不断迈进的进程。野蛮社会的一切都是公共的,靠部落的法则来治理。文明是将一个人从一群人当中解放出来的过程。01

——艾茵·兰德(1905-1982),俄裔美国哲学家、文学家,1943年

《一九八四》:零隐私的恐惧

不论是睡着还是醒着,在工作还是在吃饭,在室内还是在户外,在澡盆里还是在床上——没有躲避的地方。除了你脑壳里的几个立方厘米以外,没有东西是属于你自己的。02

——乔治·奥威尔,《一九八四》第一部第二章,1948年

《一九八四》是英国作家乔治·奥威尔(George Orwell)在1948年创作的一部讽刺小说。

这部小说问世之后,先后被翻译成60多种语言,在世界范围内获得了极高的知名度,被誉为对“极权和专制”进行反思的巅峰巨著。当然,由于其对极权主义入木三分的鞭挞,也在一些国家屡屡被禁止出版。

故事发生在虚拟的大洋国。这里的居民,处于党的完全监视之下,没有任何的隐私。党的领袖就像“老大哥”一样,无处不在、无微不至地“关心”他的国民,确保他们思想“纯洁”、没有任何反叛的行为。一种被称为“电幕”的高科技视频器材被用来监控人民的表达、交流和生活。每个人的住所、办公室和公共场所都安装着监控镜头和窃听器,到处都贴着标语:“老大哥在看着你!”记者们写的一切东西都要经过党的审查才能发表,孩子们也被党煽动、鼓励向警察报告他们父母的可疑行为。

即使一个对党不敬的细微表情,都可能被报告,然后是教育、逮捕、改造、清洗。

故事的主人公史密斯是一名有独立思考能力的青年,他怀疑党的理论,和一名年轻的女性相爱。他们“出轨”的思想和行为很快就被秘密警察发现,在残酷的监禁、审问、拷打和洗脑之后,这对年轻的恋人最终悲伤无奈地选择了放弃,分别背叛了对方。

《一九八四》刻画了一个无比强大的党和政府、一个令人窒息的恐怖社会。在这里,人性被扼杀,隐私被践踏,思想受到钳制,生活极度贫乏。任何人读完这部小说,都会倒吸一口冷气,对极权主义不寒而栗。1984年,为了纪念奥威尔,这部小说被改编成同名电影,再一次引起了全世界无数心灵的震颤。

在美国的历史上,“老大哥”这种高度集权的党国体制其实并没有出现过。但片中的“老大哥”,通过技术手段实现了无处不在的监控,这一点,给美国人留下了深刻的印象。科学技术不断突飞猛进,政府权力在扩张和蔓延,这些都是对个人隐私的潜在威胁,美国人担心,两者一旦结合,就会有产生“老大哥”的危险。

《一九八四》电影剧照:老大哥在看着你!

说明:乔治·奥威尔的传世之作还有《动物庄园》,该书也是反乌托邦主义的代表作。鉴于他对人类社会的贡献,1984年,一颗新发现的小行星被命名为奥威尔星。

1960年代以后,随着信息技术的推进、计算机的增多,这种危险引起了越来越多人的关注。他们担心,联邦政府会利用信息技术来侵犯个人的隐私。

这种担心并不是空穴来风。

大数据就是“老大哥”:中央数据银行之争

我们有很多小的、独立的信息记录系统。这些系统,就单个而言,它们可能无关痛痒,甚至是很有用的、完全合理的。但一旦把它们通过自动化的技术整合连接起来,它们就会渐渐蚕食我们的个人自由。这才是真正的危险。03

——美国隐私研究委员会,1977年

1965年,人类的计算模式还仅仅处在第一个阶段——主机时代,这种危险和担心就开始初现端倪。

那个时候,现在白宫的行政管理预算局(OMB)还叫预算局。

预算局提出了一个简单、大胆、在当时堪称革命性的创新计划。

该局建议,联邦政府应该成立一个统一的“数据中心”,把政府部门所有的数据库连接、集中、整合起来,建立一个大型的数据库。预算局相信,这不仅能节约硬件成本,还能提高数据管理、查询和统计的效率;此外,通过部门之间的数据对接和整合,还可以提高数据的准确性和一致性,减少数据的错误。

预算局甚至为这个计划提出了具体的实施方案:人口普查局、劳工统计局、税务局以及社保局等4个数据密集型部门先行一步,首先将数据库连接起来,其他各个部门的数据库逐步纳入,最终的目标是,以公民为单位,为全国每一个人建立一个数据档案,这个档案将包括每一个人教育、医疗、福利、犯罪和纳税等等一切从摇篮到坟墓的数据记录。

预算局将这个大型数据库称为“中央数据银行”。

普林斯顿大学的高等研究院(IAS)是全世界最顶尖的研究机构之一,它的特点,是可以不屈从任何行政的任务和资金的压力,自主开展纯粹的科学研究。时任该研究院主任的是凯森教授(Carl Kaysen),他盛赞这是一个划时代的计划。凯森发表了专门的可行性报告,指出统一管理不仅能节省运营成本、提高数据的准确性和查询的效率,还将更好地保障数据安全。

听起来有百利而无一弊,中央数据银行的计划得到了行政圈、学术界的一致响应。

经过一年的论证,1966年,联邦政府正式向国会提交了“中央数据银行”的方案,请求拨款、开工,开创新的数据管理篇章。

新闻界也开始报道联邦政府的这个创举。

但没想到,新闻界的报道引起了强烈的社会反弹。这种反弹,最后导致了这个计划的流产。

1967年1月,《纽约时报》发表了著名记者、隐私权专家帕卡德(Vance Packard)的文章《不能告诉计算机》,他写道:

“当政府把我们每一个人的信息和日常生活的细节都装进一个中央级的数据银行,我们将受控于坐在电脑机器前面的那个人和他的按钮。这令人不安,这是一种危险。”04

美国公民自由联盟(ACLU)是一个成立于1920年、位于纽约的公益组织,它的目标是利用法律的手段维护公民的权利,隐私权正是ACLU关心的重点。对于中央数据银行的计划,ACLU强烈反对,并发表了一系列的声明和调查。

哈佛大学也对这个计划开展了专门的民调,其调查的结果表明,56%的美国人担心自己的隐私会受到侵害,明确反对这个计划。

一时间,曾经赢得了各方赞誉的数据银行计划在国会的讨论中陷入了泥沼。

此后,美国国会对此召开了一系列的听证会。1968年,众议院隐私委员会发布了一份报告,作出结论说,该计划无法保证公民的隐私不会受到侵害,不予批准。

但这只是一个中断,甚至仅仅只是一个开始。此后的几十年,随着数据库越来越多,类似于“中央数据银行”的计划不断改头换面,在国会发起冲刺。美国各界对其的讨论也从来没有间断过,并形成了泾渭分明的两派。

支持的一派以经济学家和技术专家为主,这个阵营认为,现代经济依赖于大规模的数据整合和交换,统一集成的中央数据库,将提高经济效率,方便大众的生活,是现代社会发展的必然,是社会进步的不二选择。

反对方自然是隐私至上的信奉者。他们认为,在信息时代,无论是个人的日常消费等琐碎小事,还是事关健康、教育的重大决策,都会在各种各样的信息系统当中留下“数据脚印”。这些“数据脚印”,保存在不同的系统中,可能无伤大雅。但如果建立起中央数据银行,通过数据整合和信息加总,就可以再现一个人生活的轨迹和全景,各个系统之间的数据可以彼此印证、互相解释,个人隐私就无所遁形。

隐私学学者认为,这种信息加总和数据整合,无异于一种监控,准确地说,是一种“数据监控”(Dataveillance),其对个人隐私权的侵害,无异于《一九八四》中的电幕。进入大数据时代之后,甚至有专家提出:大数据就是老大哥!(Big Data is Big Brother)

当然,这两派当中,也不乏改变态度、转换阵营之人。

迪博德(John Diebold),是美国实业界著名的计算机专家。80年代以前,他一直都是“中央数据银行”计划的强力支持者。

1986年,他公开承认:“中央数据银行”的计划如果实行,将会是一个错误。

迪博德是ATM提款机的主要发明人。促使他发生深刻转变的,是推广ATM提款机过程中发生的一件小事。

迪博德的客户在某地区新安装了一部ATM提款机。但接下来几周的数据记录却非常异常:每天的午夜12点到2点之间,有大量的款项被提取。这有悖常情,该银行担心这涉及诈骗等违规操作,于是雇用了侦探对该提款机进行监控和调查。

侦探很快发现,确实有很多顾客午夜来提款。其原因在于,这个提款机,靠近当地一家色情俱乐部。而顾客提取现金的目的,正是不想在信用卡上留下“不体面”的消费记录。

当该银行了解到真相之后,其经理层忍俊不禁。

很快,一篇新闻报道出现在当地的报纸上:“XX银行知道昨晚谁光顾了妓女”。

迪博德分析说:当你在银行存钱、提款的时候,你留下的信息绝不仅仅是一笔银行交易,其实你还告诉了银行,某一时刻你所处的地理位置。这些信息,很可能会成为你其他行为的解释,从而透露你的隐私。例如,这个提款记录,如果和你当天的通讯、消费、旅行等其他数据记录整合起来,你当天的行踪和作为,就不会有太多的秘密可言。

迪博德后来总结说,在信息时代,计算机内的每一个数据、每一片字节,都是构成一个人隐私的血肉。信息加总和数据整合,对隐私的穿透力不仅仅是“1+1=2”的,很多时候,是大于2的。

随着时间的推移,数据整合这种“1+1>2”的效果,在美国社会表现得越来越明显。进入80年代之后,甚至在最高法院的若干判例中也有所体现。

1988年,哥伦比亚广播公司(CBS)的一名新闻记者根据《信息自由法》向司法部下辖的联邦调查局(FBI)提出申请,要求公开一名犯罪嫌疑人麦迪科(Charles Medico)的犯罪记录。个人的罪案记录原本属于隐私,FBI以此理由拒绝了这个要求。但CBS认为,麦迪科已经被确定参与了有组织的犯罪,并贿赂了一名国会议员,他的犯罪记录涉及公共利益,必须公开。CBS后来汇同新闻自由委员会将司法部告上了法院。05

一审、二审双方各有输赢,官司最后打到了最高法院。

最高法院认定这是隐私,应该保护。CBS又提出了新的理由,CBS认为,FBI的犯罪记录只是各个执法部门记录的一个加总,麦迪科的这些信息,都曾经在某个特定的时候公开过,不能算作隐私。

1989年3月,最高法院的9名大法官一致否定了CBS和新闻自由委员会的抗辩,他们在判词中陈述道:

“在一个有组织的社会里,几乎每一则信息都在不同的时候以不同的形式公开过。但是,就个人隐私而言,不同时期零散地公开和一次性完整地公开,即使内容相同,也有本质的区别。”

虽然数据整合这种“1+1>2”的性质得到了越来越多人的认同,但中央数据银行计划的支持者仍然大有人在。他们相信,中央数据银行的建设,是经济发展的必然。这不是一个“建”与“不建”的问题,而是一个“何时建”、“如何建”的问题。他们更关心技术层面如何实现,他们知道,在通向数据银行的大道上,美国还有一个关键性的问题,没有得到很好地解决。

这就是个人信息的统一标识问题。

如果要将不同的数据库联接整合起来,各个数据库之间必须要有一座桥梁,也就是一个共同的数据项。这个数据项,用数据库的专业术语来说,就是“主键”(Primary Key)。只有通过一个合理的主键,不同的数据才能方便快捷地联接起来。

这个“主键”,就是每个人独一无二的标识。这个标识,在很多国家,就是身份证号码。

而在美国,还从来没有过全国统一的身份证件及号码。因为没有共同的“主键”,在金融、医疗、教育、福利和公共安全等等不同的数据库中,政府的各个部门以及商业组织都各行其是,使用、设计了不同的标识方法。

这些不同的标识方法,是将不同数据库相连起来的一个障碍,也是影响中央数据银行建设的一个难题。

百年纠结:统一身份证

我们的立场是:现在或者可预见的将来,在美国都不应该建立统一的身份证。就严格的定义来说,社会安全号不能算是身份证,它最多只能算一个近似的身份标识。06

——联邦政府卫生、教育和福利部部长咨询委员会的报告

《数据记录、计算机和公民权利》,1973年

统一身份证,也是美国近百年来隐私风波中的一个中心话题。

在美国的历史上,联邦政府从来没有发放过全国统一的身份证件。但在现实生活中,有3个证件,不同程度起到了身份证件的作用。

一是驾驶证。从1903年起,美国开始发放驾驶证,该证件被广泛地用作身份证明。但驾驶证是以州为单位发放的,每个州的证件格式、号码位数都不一样;一个人可以拥有多个州的驾驶证,也可以没有驾驶证。所以严格地说,驾驶证虽然具备了身份标识的作用,却还谈不上统一的身份标志,而且很容易伪造。

二是护照,其格式倒是统一的,号码也是唯一的,并由联邦政府发放,但其发放方式,是以自愿申请为基础的,个人不申请、政府就不发放,除了出入境,日常生活中也很少使用。

三是社会安全号。1935年,罗斯福新政期间,他为了建立社会保障系统,提出为每一个有工作的人员,建立一个社会安全账号。每个月,政府将从其工资中扣除一部分金额,并补贴部分金额,共同存入其社会安全账号,以作为其退休养老的保障。

罗斯福这个建立全国统一安全号的提案,也遭到了隐私派激烈的反对。最后,罗斯福向国会妥协并保证:这个号码仅仅用于社会保险,一定不会用于身份标识的领域,并且会被保密。他的这个提案才最终在国会通过。

但一朝天子一朝臣。罗斯福之后,他的承诺并没有被严格地遵守,社会安全号的应用范围还是逐渐扩大了。先是个人纳税的表格启用了这个号码,慢慢地,找工作、申请信用卡、驾驶证、政府福利都需要出示个人的社会安全号。从一定程度上来说,社会安全号似乎也是身份证件的替代品,而且其使用的趋势还在不断上升。

但严格地说,社会安全号还是算不上统一的身份证件。因为它只记录姓名,连男女、年龄、住址、相片等基本的信息也没有,公民也不需要随身携带,该号码被明确规定为个人隐私。1974年的《隐私法》,甚至还有专门的条文规定:“要控制社会安全号对个人隐私造成的威胁”。

美国社会安全卡号的样板

说明:卡上只有个人姓名及社会安全号码,该号码的格式为XXX-XX-XXXX,总共只有9位,前3位、中间2位和最后4位分别代表地区号、群组号和个人序列号。有专家认为,受限于位数,社会安全号不可能成为一个好的身份标识号码。

因为没有统一的身份标识号码,美国各种信息系统中用来标识、区分公民个体的方法自然五花八门,其中最核心的方法,还是人的姓名。但不同的人可以拥有同样的名字,在输入电脑的过程中,还容易出现拼写的错误。毫无疑问,按照名字来查询个体信息的方法,其检索效率和准确率都很低。当要把不同系统的数据库联接整合到一起的时候,要确定“谁”是“谁”,就变得非常困难。

而在具有统一身份证的国家,由于各个数据库之间存在一个共同的、唯一的“主键”——身份证号码,这个挑战就小多了。由于身份证号码在其中穿针引线,各种数据库可以像糖葫芦一样串串相连。

信息技术领域的专家深谙其中的困难。甲骨文公司(Oracle)的创始人、首席执行官埃里森(Larry Ellison)就强烈呼吁美国政府建立一套全国统一的身份证系统。他曾经公开表示,如果美国采纳统一的身份证制度,甲骨文公司将免费给联邦政府捐赠一套全国身份证管理的软件。

当然,联邦政府也未尝不想建立全国统一的身份证件。但问题的关键在于:国会不同意!国会的问题又在于:大部分人民不答应!

美国社会的这种争议在第一次世界大战期间就开始了。

1917年,美国对德宣战之后,为了防止德裔美国人在境内从事谍报活动,联邦政府提出,要对德裔这个特殊的群体颁发统一的身份证件、加强管理。还有机构附议:统一的身份证应该延伸到所有的外国人,甚至全体国民。但这遭到了国会的强烈反对。国会仅仅同意了对德裔美国人加强管理,并在最后通过的法案中明确说:身份证的使用只能限于德裔群体,当国际冲突一结束,这种证件就应该立即撤销。

战争一结束,对德裔群体发放的身份证确实就被取消了。但二战期间,美国政府又因为同样的原因,曾经对日裔、意大利裔、华裔群体发放过统一的身份证。07

1941年12月,日本发动了著名的珍珠港袭击事件。美国的飞机、舰队受到了日本的重创,共有2402人在袭击中死亡。事件发生不久,盖洛普的民调表明,有69%的美国人支持统一身份证件的做法,明确反对的人降至25%。

但这个数据,只是昙花一现。没过多久,支持者就改变了念头,反对方又在民调中占据了主流。

珍珠港事件之后,联邦政府曾经发起过多次呼吁,要求实施全国统一的身份证件,但都没有在国会取得半数以上的支持,尽数夭折。

1974年,美国司法部成立了一个专门委员会(FACFI),研究统一身份证的问题。该委员会在联邦、州、地方三级政府以及商业领域进行综合调研之后,认为政府有义务为私营领域提供一个统一的标识,以方便全社会各种电子交易行为的发生和管理,因此建议采纳统一身份证的做法。但报告同时坦承:公众对于这个建议的反应是非常负面的。

鉴于此,几乎没有官员敢在公开场合表态支持统一身份证的做法。最后,这个建议只有不了了之。08

1967年,“中央数据银行”的争端出现之后,统一身份证更是遭到了“隐私派”的强力反对。

1994年,克林顿执政期间,曾经发起过医疗改革法案,其改革的重点之一,就是为全国每一个人建立一个统一的“医疗服务号”(Universal Health Care Identifier),在这个基础之上,搭建全国统一的医疗数据银行。但这个法案,也被“隐私派”否决了。1996年,克林顿试图重新包装这个想法,让医疗服务号成为另一个法案的一部分(HIPAA),还是没有通过。

近几十年以来,美国也对统一身份证这个问题做过很多次民意调查,但除了珍珠港事件之后的昙花一现,每次都是反对意见占了绝对上风。1942年,民意调查的创始人乔治·盖洛普曾经在《纽约时报》上对统一身份证这个问题做过一个很好的总结。他认为,统一身份证是管理社会、控制公民的一种手段,在美国,这种手段被视为是警察国家的做法,是集权社会的象征,是违反美国精神的。当然,盖洛普也承认,统一身份证有利于警察打击犯罪、加强国家的安全,特别是在应对恐怖袭击、自然灾害等等突发事件当中,统一身份证将大大方便政府对社会的管理和控制。09

统一身份证也多次成为总统大选的辩论话题。前文提到的纽约市的市长朱利安尼,曾经是2008年大选期间知名度最高的候选人,他表态支持全国统一身份证,随后遭到了其他多位候选人的攻击,这些候选人认为:没有任何理由去牺牲公民实实在在的自由以换取“可能会好一点”的国家安全。

“9·11”大拐点:以反恐的名义向左转

时间在流逝。但美国永远不会忘记“9·11”。我们会记住每一个光荣牺牲的救援队员、每一个生活在悲伤中的家庭,我们会记住这场大火和废墟,记住亲人们的最后一个电话和孩子们的葬礼。10

——乔治·布什,第43任美国总统,2001年11月11日

为了国家安全,美国人民必须牺牲一定程度的个人隐私。11

——路易斯·弗里,联邦调查局第5任局长,2001年

2001年9月11日,发生了震惊世界的“9·11”恐怖袭击事件。

这天上午,19名来自“基地”组织的恐怖分子先后劫持了4架民航飞机,分别在纽约、华盛顿两个城市实施了自杀式的撞机事件。其中两架撞上了纽约世贸中心的南北双塔,第三架撞向了国防部五角大楼。最后一架据称目标是国会大厦,但由于机组人员和乘客的反抗,飞机最后坠毁在宾夕法尼亚州。

包括恐怖分子,4架飞机上共有256名人员,无一生还。更为悲情的是,时值上班高峰时段,有上万人集聚在世贸中心,两座建筑在遭到撞击之后,先后都着火、燃烧、倒塌;有上千名工作人员来不及疏散,最后都葬身火海,还有近400名消防队员和警察,在大厦里面组织救援,也埋身于废墟之下。

包括劫机者在内,“9·11”总共造成了2996人死亡。这些人,来自全世界90多个国家。

“9·11”是继1941年珍珠港事件之后,美国遭受的最大袭击,其死亡人数,甚至超出了珍珠港。它对美国人的心理、文化和政治生活都产生了强烈的冲击和影响,在世界历史上,都堪称影响深远的事件。

对“9·11”的调查很快发现,19个劫机者当中,至少有11个人持有虚假的身份证件。

这又重新点燃了统一身份证的大讨论。

曾经全世界最高的建筑成为美国的悲情记忆

世贸中心建于1972年,曾经是全世界最高的建筑,也一直是纽约市最高的摩天大楼和标志。

世贸中心受到袭击轰然倒塌的一刻(图片来源:网络)

说明:在前世贸中心的旧址上,修建了“9·11”纪念碑,碑上刻有全部遇难者的名字。“9·11”十周年的当日,奥巴马夫妇和布什夫妇在新建成的纪念碑前默哀。(图片来源:维基百科)

皮尤研究中心(PRC)随后开展的民调表明,“9·11”事件发生的第二个月,有70%的民众都支持全民统一身份证的计划。

但没想到,这和珍珠港事件之后的社会反应一模一样。仅仅几个月之后,2002年3月,盖洛普的民调表明,统一身份证的支持率又下降到26%,反对率上升为41%。很多人都表示,他们支持在机场加强身份的查验,但反对在银行、医疗、教育、福利等领域使用统一的身份标识。

盖洛普的发言人解释说:

“我们的数据表明,公众只赞成在特定的场合、少数有限的情况下使用统一的身份标识。他们还是怀疑政府会滥用他们的信息。”12

但令人意外的是,这一次,统一身份证的讨论并没有持续发酵,中央数据银行的旧计划却再次现身。

9月24日,作为对“9·11”的直接反应,布什政府向国会提交了《爱国者法案》13,该法案要求限制公众获取政府信息的广度,并提高政府控制、检查公民个人信息的程度。这些个人信息,很多都属于隐私的范围。例如,根据这个法案,警察和情报机关不需要法院的核准,就有权窃听公民的电话,检查公民的电子邮件和医疗、财务甚至在图书馆的借阅记录等等一切信息记录。

2001年10月26日,布什总统签署《爱国者法案》。(图片来源:The White House/Eric Draper)

美国公民自由联盟(ACLU)批评这是向麦卡锡主义的回归,是以“反恐”的名义粗暴侵犯公民的隐私和自由。

但“9·11”的巨大阴影,使整个美国社会的政治文化都开始迅速转向,强调安全、秩序和国家管控的保守主义开始盛行。这时候的美国国会,甚至抛弃了党派之争,在反恐的问题上同仇敌忾、达到了空前的一致。2001年10月26日,《爱国者法案》以前所未有的速度在参众两院高票通过。众议长哈斯特德(John Hastert)解释说,为了打击恐怖主义,确保国家的安全,全体美国人都应该考虑牺牲一部分个人自由。

作为另一个强化国家安全的措施,10月初,布什宣布成立国土安全办公室,统管国家安全事务。很快,布什又向国会建议,将该办公室升格为内阁的部门。

次年11月,国会正式通过了《2002国土安全法》( Homeland Security Act of 2002),批准联邦政府在国土安全办公室的基础上成立一个新的内阁部门:国土安全部(DHS)。

2002年11月25日,国土安全部正式挂牌办公,海关、移民、特勤局、应急处理等22个部门、近18万工作人员归入了国土安全部。国土安全部的成立,是1947年以来联邦政府规模最大的一次职能重组,就人数而言,国土安全部成为排在国防部、退伍军人部之后的联邦政府第三大职能部门。

《2002国土安全法》被视为对《爱国者法案》的一个承接。这两份法案,都代表了联邦政府行政权力的迅速扩张和政府透明度的大幅下降,标志着美国联邦政府的历史性转折。

正是在《2002国土安全法》中,中央数据银行计划重出江湖,并再一次引起了全国性的风波和争议。

万维信息触角计划:追踪恐怖分子的“数据脚印”

监控就是监控,不管是通过人还是通过计算机来监控,多少都要侵犯个人的隐私和自由。数据库一旦建立,就应该严格保护,否则很容易被滥用。14

——西蒙·加芬克尔,美国学者、记者、技术专家,2006年

《2002国土安全法》中重新提出的中央数据银行计划,有一个更响亮的名字:万维信息触角计划(Total Information Awareness)。该法规定,为保证这项计划的实施,首期拨款2亿美元。

为了配合该项计划的实施,2002年5月,国防部在其下属的高级项目研究所(DARPA)内成立一个新的办公室:“信息触角办公室”(IAO)。

这时候国防部的主政者,正是和《信息自由法》几度结缘的强硬派人物:拉姆斯菲尔德。

信息触角办公室新任命的主任,也曾经是全美具有争议的政治人物:原里根时代的国家安全顾问、海军中将约翰·波因德克斯特(John Poindexter)。1990年,波因德克斯特因为身陷“伊朗门”丑闻,被迫辞去公职。这个新的职位,是他沉寂十年之后的东山再起。

伊朗门事件

伊朗门事件是继水门事件之后美国最著名的政治丑闻。

1985 年,联邦政府为了营救被黎巴嫩真主党绑架的人质,违背国会的法律,秘密向伊朗出售军火,以换得伊朗向黎巴嫩真主党的通融。在一名美国人质获得释放之后,白宫高层决定继续交易,波因德克斯特当时担任总统国家安全事务顾问,他同意了该项计划。该计划共换取了3 名美国人质的释放。

1987 年事发之后,波因德克斯特身陷风暴的中心,并涉嫌销毁相关的档案,他在法庭上陈述说“向国会隐瞒真相是其作为政府官员的职责”,引起了全国的哗然。波因德克斯特在司法调查中多次翻供,最后指证该计划获得了里根总统的批准。但里根此时已离任,并患上了老年痴呆症,无法出庭作证。

1991 年,波因德克斯特被无罪释放。

但波因德克斯特万万没有想到,“万维信息触角计划”居然又成了他的“滑铁卢”。短短15个月后,他再度被迫辞职,从此彻底结束了他的政坛生涯。

和1965年相比,2002年,人类的计算模式已经稳步进入了个人型计算阶段,商务智能的各项技术,都已经很成熟。因此,除了将数据联接、集中到一起,提高管理、查询和统计的效率之外,万维信息触角计划还有了新的内容。这个内容,就是数据挖掘。

2002年8月,在国防部高级项目研究所的技术年会上,波因德克斯特首次公开阐述了如何在统一集成的数据库中应用数据挖掘技术,构建“万维信息触角”:

“只有找到新的数据源,反恐工作才能变得更加高效和敏捷。我们必须把新的和旧的数据库结合起来,从中挖掘出信息,将其转化为知识,并付诸行动。

“这种新的数据资源就是‘交易空间’(Transaction Space)。如果恐怖分子要计划、执行一次恐怖活动,他们必定会在信息空间中留下某种‘数据脚印’。也就是说,他需要‘交易’,这种交易的数据记录,可以是通讯、财务、教育、医疗,也可以是旅行、交通、出入境、房屋等等其他一切数据记录。

我们必须在‘交易空间’中应用数据挖掘的技术,发现和追踪恐怖分子。”15

信息触角办公室标志(Logo)

金字塔上一只眼睛射出的光芒,照在地球上代表美国的地方,下面写着“知识就是力量”。这个标志后来备受批评,因为标志中的“眼睛”令人联想到偷窥和监控。

本书第四章曾提到:数据挖掘,是在海量的数据当中通过分析和建模,发现数据背后隐藏的模式和微妙的关系,以揭示过去的规律、预测未来的趋势。

波因德克斯特大谈数据挖掘,并不是偶然的。从1989年起,美国的计算机协会(Association of Computing Machinery)成立了专门的数据挖掘分会、举办了第一届学术年会、出版了专门期刊,数据挖掘技术就开始在美国受到追捧。此后,政府部门对其的应用也开始逐渐增加。更重要的是,数据挖掘的技术确实不负众望,给很多领域都带来了令人耳目一新的发现。

例如,流感是全球性的传染病。多年来,医务人员一直致力于研究它的爆发周期和特点。1999年,正是通过数据挖掘技术,研究人员获得了突破性的进展。通过对全国2万多个药店的销售数据进行挖掘,科研人员发现,在医院大规模地收治流感病人的两个星期之前,药店柜台的感冒药会有一个销售高峰,这个高峰,只要超过一定的“阀门”值,就预示着一场流感将要爆发。其中的原因在于,人们在患上感冒之后,一般先会尝试自己去买药,直到不见效、症状加重,才会到医院求助,而这个时候,流感已经在社会上全面爆发,失去了最后的治疗控制时机。

哈佛大学的另一位教授通过挖掘病人的就诊数据则发现,由于儿童的抵抗力更弱,儿童的就诊高峰往往是流感的先兆,这个高峰过后的一个月左右,成人流感的爆发就会接踵而来。

这些发现,都为防治即将爆发的流感,争取到了宝贵的时间。

根据这些发现,匹兹堡大学研发了“疾病爆发实时监控系统”(Real Time Outbreak and Disease Surveillance System)16,对宾夕法尼亚州全州药店的药品销售流量进行监控。由于系统的显著效果,2001年11月,系统的创建人受邀在国会作了专题报告。2002年2月,布什总统亲自到访该实验室,盛赞该监测系统的预警作用。2002年12月,联邦政府疾病预防中心(CDC)开始在全国推广这种数据监控模式。

数据挖掘技术的鼓吹者相信,正像流感的爆发有数据征兆一样,恐怖活动的出现也有迹可寻。因为,和普通人相比,恐怖分子在“交易空间”留下的“数据脚印”有其特定的模式。例如,恐怖分子要经常旅行、流动,他们没有固定的职业和住所,银行的账户上却有充足的现金,他们经常要接听国际电话,要购买特殊的器材、工具,甚至武器。通过在“交易空间”的海量数据中构建一些自动化的数据挖掘“触角”,就可以发现、锁定可疑分子。

波因德克斯特用来介绍“万维信息触角计划”工作原理及流程的幻灯片。

说明:这张幻灯片描绘了个人身份的数据和各种“交易空间”的数据进行整合的过程。(图片来源:维基百科)

“9·11”之后,数据挖掘技术的应用,在美国联邦政府曾经形成一个高潮,同时,也引起了全社会对隐私问题的广泛担心,认为这是一种利用数据对个人活动和交流的变相监控。2003年5月,华裔参议员阿卡卡(Daniel K. Akaka)要求国会问责办公室(Government Accountability Office)对数据挖掘在联邦政府的应用情况进行一个系统的调查。国会问责办公室在对128个联邦部门和机构进行问卷之后,于次年5月向他提交了专门的报告。

报告说,截至2004年5月,联邦政府已经有199个项目正计划使用或已经使用了数据挖掘的技术,其中122个使用了个人信用卡、银行账户、纳税记录等“交易空间”中的个人数据。报告承认,由于数据挖掘技术强大的信息整合能力、分析能力,这已经给公民的隐私保护带来了前所未有的挑战。17

万维信息触角计划公开之后,引起了隐私、民权保护团体的强烈反响。美国公民自由联盟(ACLU)指出,所谓的“交易空间”,是关于“所有人、所有事情的记录”,其实无所不包,该组织大声警告:

“如果该系统得以实施,美国人民将生活在《一九八四》所描绘的监控当中,唯一不同的是,监控我们的不是电幕,而是数据库!”

6种改变政府的力量:山姆大叔大退让

在这个国家,只有存在足够多的人愿意为他们的权利而抗争,我们才能称我们自己是“民主”的。18

——罗杰·鲍德温,美国公民自由联盟(ACLU)的创始人

2002年11月24日,著名的作家、新闻记者萨菲尔(William Safire)在《纽约时报》发表文章,批评了万维信息触角计划:

“你用信用卡支付的每一笔购买记录,你订阅每一份杂志,你生病、就诊、吃药的每一份记录,你浏览的每一个网站、发出的每一份邮件,每一笔存款记录,每一次旅行,所有的交易和通讯,都会存储到这个‘虚拟的、中央超级数据库’当中。

这些关于你个人的信息,还仅仅是从商业渠道获得的,再加上政府已经掌握的信息,例如你申请护照、驾驶证提交的表格,你经过收费站的记录,你结婚、离婚的法律文件,你报警的记录等等,这些信息,记录了你的一生。掌握这些信息,曾经是一个超级侦探的终极梦想——这就是现在和我们每一个人都有关的‘万维信息触角’计划。”19

美国人为了讽刺布什政府对社会加强监控的做法,制作的布什版“老大哥在看着你!”

一石激起千层浪。

萨菲尔的文章引起了全国的热烈讨论。在他发表文章之前,全国只有12家新闻机构对万维信息触角计划进行了报道。之后,该话题急剧升温,仅仅一个月,各大报纸出现了285篇评论和报道,到2003年2月,全国共出现了508篇相关报道。20

除了直接针对万维信息触角计划的分析和报道,各种政府工作人员滥用个人隐私数据的例子也被新闻界挖了出来,作为反面佐证,见诸报端。

密歇根州的一些警察,居然利用警务数据库“猎艳”。他们在街上邂逅漂亮的女性之后,就跟踪她们、记下她们的车牌号码,回到办公室,通过查询数据库,获得该女性的住址等个人信息,然后再人为制造进一步接触的机会。此外,还有警察利用数据库查询政治对手和上司的信息,对相关人员实施威胁。在2001年前后5年期间,涉嫌滥用警务数据库的警察共有90名之多。21特拉华州还有政府官员,将公民的个人信息泄露、出卖给赌博公司,帮助他们追债、开发新的顾客。22

面对强大的社会舆论,2002年12月,国防部副部长宣布对万维信息触角计划进行审查,确保该项目符合联邦政府的法律和规定。

审查报告很快公布了,国防部在报告中解释说,该项目并没有侵犯公民的任何权利。

但反对的声音仍然持续高涨。先后有3名参议员向国防部写信,质询这个项目。1月10日,国防部再度宣布,将对该项目是否侵犯了公民隐私权进行再次检讨。

2003年2月23日,国会对年度拨款法案进行投票,参议员怀登(Ron Wyden)利用这个机会,在该法案中掺了一粒“沙子”:要求国防部、国家安全局和司法部成立联合工作组对万维信息触角的项目进行调查,并在90天以内向国会提交专门的联合调查报告,否则终止项目的拨款。

作为年度拨款法案中的“沙子”,这个法案当然没有不通过的道理。

5月6日,国会的政府改革委员会又召开了听证会,国防部高级项目研究所的主任在听证会上陈述,该项目的名称已经更改为“反恐信息触角”(Terrorism Information Awareness),专门用于反恐活动,而且,将不使用任何商业机构“交易空间”的数据。

2003年5月19日,在3个部门联合调查报告出台之前,美国公民自由联盟(ACLU)发布了其独立调查报告《对政府超级监控计划的分析》,该报告分为4部分,对国防部前后不一致的解释提出了质疑,指出万维信息触角计划一旦付诸实践,将像“原子弹”一样改变世界。ACLU还指出,“9·11”的发生,并不是政府缺乏情报,而是情报在各个政府部门之间的流动和分享机制不畅通,对情报的分析能力不强造成的。

2003年5月23日,联合调查报告如期抵达国会。在这份报告中,3个部门再次改变口径,强调这是一个“研究性”的项目,充分考虑了公民的隐私权,至于数据,只使用真实的情报信息和仿真数据。

联邦政府步步退让,但万维信息触角计划还是没有逃脱夭折的命运。

2003年8月,波因德克斯特明白大势已去,主动辞去了办公室主任的职务。次月,国会投票通过了新的法案,命令立即终止该项目的开发工作,并停止项目的拨款。该法案还规定,没有国会的授权,今后类似的数据整合挖掘项目,不能使用任何美国公民个人的数据,只能使用外国人的信息和数据。

但联邦政府并没有彻底放弃中央数据银行和数据挖掘的计划。

2006年,国土安全部又卷土重来,再以反恐的名义提出了“建言”计划(Analysis, Dissemination, Visualization, Insight, and Semantic Enhancement,简称ADVISE)。这个计划,换汤不换药,还是要在“交易空间”的数据基础上实施数据挖掘技术,以发现潜在的恐怖威胁。这一次,国土安全部声称,他们已经把隐私保护的技术预先嵌入到系统中,例如,自动屏蔽个人的姓名和社会安全号码。

美国公民自由联盟当然再次披上战袍。这一次,他们在全国发起了一场“只剩6分钟”的动员运动,暗喻离美国变成一个监控性的社会,只有6分钟。

改变美国政府决策的6种力量:公共知识分子、新闻界、民调机构、公益组织、国会和法院

《基督科学箴言报》则报道了卡内基梅隆大学数据隐私专家的观点:

“即使没有姓名、没有社会安全号,只要通过性别、生日和邮编3个数据项,数据挖掘的技术就能够成功地识别全美87%的人口。”23

2007年9月,“建言”计划再次因为隐私原因,被国会中途叫停。

在中央数据银行计划一次又一次因为美国大众的反对而搁浅的过程中,我们可以清晰地看到,美国联邦政府并不仅仅受限于国会和法院,社会的力量,包括公共知识分子、新闻记者、民意调查机构以及种种公益组织,也是制约美国政府的强大力量。

2010年9月,美国公民自由联盟发布总结报告说,自“9·11”以来,为捍卫公民隐私,该组织经历了自1920年成立以来最为忙碌的阶段,仅仅为了反击布什政府的《爱国者法案》和《国土安全法》,他们就一共提起了50多宗法律诉讼,有的案件,最后还上诉到最高法院。

据统计,美国公民自由联盟,是除了美国司法部以外在美国最高法院提起诉讼最多的组织。每年,这个公民自治组织有200多名律师和2000多名法律工作的志愿者,处理上千起因为公民维权而产生的法律纠纷。

注释

01 英语原文为“:Civilization is the progress toward a society of privacy. The savage's whole existence is public, ruled the laws of his tribe. Civilization is the process of setting man free from men.”—Ayn Rand, The Fountainhead, 1943

02 本书采用董乐山的译文。

03 英语原文为:“The real danger is the gradual erosion of inpidual liberties through automation, integration, and interconnection of many small, separate record-keeping systems, each of which alone may seem innocuous, even benevolent, and wholly justifiable.”—U. S. Privacy Study Commission, 1977

04 Don't tell it to the computer, Vance Packard, New York Time Magazine, January, 1967

05 U.S. DEPT. of Justice v. Reporters Committee for Freedom of the Press, 489 U.S. 749(1989), 489 U.S. 749

06 Records, Computers, and the Rights of Citizens, Department of Health, Education and Welfare. Secretary's Advisory Committee on Automated Data Systems, 1973

07 二战期间,中国和美国是同盟国,并未有敌对情绪。华裔群体获得身份证是华人主动要求的,因华人担心自己被美国社会当做日本人,主动申请身份证以区别自己。

08 Card-carrying Americans. Privacy, Security, and the National ID Card Debate, Joseph Eaton, Rowman & Littlefield Publishers, 1986

09 George Gallup,“Card of Identity for all favored,”New York Times, February 4, 1942

10 英语原文为:“Time is passing. Yet, for the United States of America, there will be no forgetting September the 11th. We will remember every rescuer who died in honor. We will remember every family that lives in grief. We will remember the fire and ash, the last phone calls, the funerals of the children.”—President George W. Bush, November 11, 2001

11 英语原文为:“The American people must be willing to give up a degree of personal privacy in exchange for safety and security.”—Louis Freeh

12 Support for ID Cards Waning, Julia Scheeres, Wired News, March 2002

13 所谓的《爱国者法案》,其实是一个代称,该法案全称为“使用适当手段来阻止避免恐怖主义以团结和巩固美国的法案”(Uniting and Strengthening America by Providing Appropriate Tools Required to Intercept and Obstruct Terrorism Act),该法案全称的缩写正好是英语中的“爱国者”(PATRIOT),所以被称为“爱国者法案”。

14 英语原文为:“Surveillance is surveillance: whether the surveillance is done by a person or a computer, some kind of violation to personal privacy or liberty has occurred. The database, once created, must be protected with extraordinary measures and is subject to abuse.”—Data Surveillance, Simson Garfinkel, 2006

15 Overview of the Information Awareness Office, prepared remarks for delivery at DARPA Tech 2002, John Poindexter, Aug. 2, 2002

16 关于RODS Laboratory及其项目的介绍,请参见匹兹堡大学的相关网页www.rods.pitt.edu。

17 DATA MINING: Federal Efforts Cover a Wide Range of Uses, Report to the Ranking Minority Member, Subcommittee on Financial Management, the Budget, and International Security, Committee on Governmental Affairs, U.S. Senate, United States General Accounting Office

18 “So long as we have enough people in this country willing to fight for their rights, we'll be called a democracy.”—ACLU Founder Roger Baldwin

19 “You Are a Suspect”, William Safire, New York Times, Nov. 14, 2002

20 Safeguarding Privacy in the Fight Against Terrorism, The Report of the Technology and Privacy Advisory Committee, Department of Defense, March 2004

21 Cops Tap Database to Harass, Intimidate: Misuse Among Police Frequent, Say Some, but Punishments Rare, M.L. Elrick, Detroit Free Press, July 31, 2001

22 Feds Accuse Newport Manager of Misusing Criminal Database, Associated Press, December 6, 2001

23 US plans massive data sweep, The Christian Science Monitor, February 9, 2006