首页 » 决策与判断 » 决策与判断全文在线阅读

《决策与判断》第四部分 直觉与偏差

关灯直达底部

当人们面临一个复杂的判断或决策问题时,他们通常会依据自己的直觉或者是一些常识来进行决策。大多数情况下,根据此类原则得到的答案往往会非常接近“最优”方案。但是在某些情况下,直觉就可能产生某些可预测的偏差和不一致。这部分将着重说明几种众所周知的直觉和偏差。

第10章 代表性直觉

人们是如何进行决策的?如何在不同的备选方案之间进行选择?如何对具体事件的价值或者可能性做出判断?这部分将关注以下两个相关的话题:决策者得出结论的整个过程,以及这样的过程可能导致的偏差。

阿莫斯·特韦尔斯基和丹尼尔·卡尼曼(1974)曾经建议决策者运用“直觉”或者是一般的常识来进行决策。利用直觉进行决策的优点是可以用很少的时间和努力达到与理性决策相同的结果。例如,直觉可以很容易地估计某种结果出现的可能性,而不必用计算的方式(即把该结果过去的每一种发生可能性相加,然后再除以该结果发生的总数)。在绝大多数情况下,一个粗略的近似值就已经足够了(正如让人们满意的通常并不一定就是最优的方案)。

通常而言,直觉可以得到一个令人相对较为满意的答案。但是利用直觉进行判断的缺点是,在某些情况下,直觉判断可能导致一些系统性的偏差。在本章中讨论的直觉类型是“代表性直觉”(representativeness heuristic)。在某些情况下,使用代表性直觉可以导致一些可预测的偏差的产生。正如前文中所提到的,在这里更多的是关注偏差而不是成功的原因,主要是因为偏差能够更多地揭示一些隐含的过程。事实上,现在所有有关决策的理论都是基于决策偏差的研究而产生的。

A、B和C的代表性直觉

根据特韦尔斯基和卡尼曼(1974, p. 1124)的理论,人们通常会根据“A在多大程度上能够代表B,或者说是A在多大程度上与B相似”来判断事件发生的可能性。特韦尔斯基和卡尼曼将这样的一种原则称为“代表性直觉”。

什么是“A”和“B”?这将取决于你进行决策的情境。如果你在估计A来自B的可能性,那么A可能就是一个例子或者一个样本,而B则是一个种类或者样本总体。例如,A可能是一个个体,而B则是一个群体,而决策的问题则可能是A成员属于B群体的可能性。另一方面,如果你试图判断A在多大程度上是B导致的,那么A可能是一个事件的结果,而B则是事件发生的过程或者原因。例如,B可能是一个投掷硬币的过程,而A可能就是在一系列的投掷中有6次是人头,判断所关心的可能就是出现这种结果的可能性。由于代表性直觉的定义是抽象的,理解起来有一定的难度,我们将举一些具体的例子来说明代表性直觉在特定情境下是如何起作用的,以及偏差是如何产生的。

读者调查中的第1题就是一个很好的例子。这个例子来自特韦尔斯基和卡尼曼(1982)的研究,内容如下:

琳达,31岁,单身,坦率直言,性格开朗。她所学的专业是哲学。当她还是一个学生的时候,她就非常关注歧视和社会公正问题,同时参加了反对核武器的活动。请从以下选项中选出可能性更高的选项:

□ 琳达是一个银行出纳

□ 琳达是一个银行出纳,同时是一个活跃的女权主义者

绝大多数人认为琳达是一个女权主义的银行出纳,而不仅是一个银行出纳。当特韦尔斯基和卡尼曼(1982)让86个人回答以上这个问题时,超过90%的人都是这样认为的。尽管有可能你也是这样认为的,但是这样的答案违反了概率的基本原则。两个独立事件(“银行出纳员”和“女权主义者”)同时发生的概率不可能高于单个事件发生的概率(例如,银行出纳员)。出于这样的原因,特韦尔斯基和卡尼曼(1983)将这种现象称为“结合谬论”(conjunction fallacy)(见Leddo, Abelson&Gross, 1984;Morier&Borgida, 1984)。

你可以通过图10.1清楚地看到连接的原则。左边的圆圈代表所有的银行出纳员,右边的圆圈代表所有的女权主义者,中间重合的部分代表既是银行出纳员,又是女权主义者的个体。由于银行出纳员中有一部分并不是女权主义者,因此成为银行出纳员(不论是否是女权主义者)的概率必定大于中间重合的部分个体。

图10.1 银行出纳和女权主义者的交集

为了确保人们不会将“银行出纳员”理解成为“在女权运动中不活跃的银行出纳员”,特韦尔斯基和卡尼曼(1982)又进行了一个补充实验,在这个实验中有两组不同的个体,其中一组个体进行选择的备选方案中只出现“银行出纳员”以及其他的选项,而另一组个体选择的备选方案中只出现“女权主义的银行出纳员”这一选项和其他的选项(这样就能确保了两个选项没有被直接进行比较)。即便是在这样的实验情境下,人们还是认为琳达是一个女权主义的银行出纳员的概率也大于认为琳达是一个银行出纳员的概率。

特韦尔斯基和卡尼曼(1982)在其他一些情境下也得到了类似的结果。“比尔”被认为“更可能是一个会计和爵士乐的演奏者,而不仅仅是一个爵士乐的演奏者”;同时,“一个温布尔登网球赛的选手更可能在输掉第一局以后而赢得整个比赛,其概率大于其仅仅输掉第一局的概率”;“美国的一位前总统更可能为未婚母亲提供财政援助和削减对地方政府的财政支持,其概率大于仅仅减少对地方政府的财政支持”。

根据上述结果,特韦尔斯基和卡尼曼(1982, p. 98)得出这样的结论:“随着情境中细节数量的增加,该情境发生的概率只会逐渐降低,但是它的代表性和由此带来的外显的可能性却会上升。我们相信,基于代表性的决策判断是人们喜欢选择毫无根据的细节化情境的主要原因。例如,‘被告离开犯罪现场’的陈述似乎比‘被告由于害怕被起诉谋杀而离开犯罪现场’的陈述更没有说服力。”

这样的结论得到了进一步的支持,读者调查中的第11题要求读者判断以下两个情境哪一个更可能发生:

在未来10年中,你认为最有可能发生的事件是:

□ 美国和俄罗斯将爆发一场全面的核战争

□ 美国和俄罗斯将爆发一场全面的核战争,但一开始两国都不想动用自己的核武器,只是在卷入了一场局部战争之后,如伊拉克、利比亚、以色列或者巴基斯坦等国的战争,才被迫动用核武器。

和银行出纳员问题一样,绝大多数人都认为更为具体的事件(由第三方拖累的全面战争的爆发)比一个一般性的事件(一场全面战争)发生的可能性更大。事实上,五角大楼针对这些具体的但完全不可能出现的情境,花费了几十年的时间制定了非常详尽的战争计划,生产了大量的武器来应付这样的情境的出现。根据特韦尔斯基和卡尼曼的理论,相对于一般的情境而言,表述非常具体的事件似乎更可能发生,因为这样的情境与人们对于具体事件的想像是一致的。

小数法则

代表性直觉的另一个结果被特韦尔斯基和卡尼曼(1971)称为“小数法则”。称做“小数法则”只是作者的玩笑话,主要是相对于统计学中的众所周知的“大数法则”(在统计学中,你从总体中抽取的样本容量越大,该样本的平均数与总体的平均数越是接近)而言。而人们所使用的“小数法则”则是认为从总体中抽取的随机样本相互之间是类似的,与总体之间的接近程度比实际的统计抽样理论所预测的要高得多。

例如,当你要求人们写下一个随机的投掷硬币的数列(不是真正去投掷硬币),人们试图将这个序列的每一个点都看上去像随机的[特韦尔斯基和卡尼曼(1972)将这样的现象称为“局部代表性”]。结果,在他们写下的答案中并没有很长的相同的序列,而相对于真实的随机序列而言,硬币的正面和背面之间的更替明显增加。在一个随机序列当中,如果只是看某一些局部的序列,它们看起来可能并不一定是随机的。为了证实这样的观点,你可以实际投掷100次硬币,并记录下正面和背面出现的次序,这样就可以大致模拟出一个真实的随机序列。

读者调查中的第15题就是对小数法则最好的说明。这个问题来自于特韦尔斯基和卡尼曼(1971)的一个研究,内容如下:

在一个城市中,8年级学生的IQ平均数是100。你从中抽取了50名学生来进行有关学业成就的研究。你抽取的第一个学生的IQ为150。你认为你抽取的这个50人的样本的IQ平均数为多少?

很多人对这个问题的回答是IQ的平均数将依然是100。但是事实上,正确的答案是这50个个体的IQ平均数应该为101。因为第一个孩子的IQ为150,剩余的49个孩子的期望IQ依然是100,因此这50个孩子的IQ总数为5050(150+4900),然后除以50,因此这50个孩子的IQ平均数应该是101。

如果你的答案是100,而不是101,你可能假定在余下的49个学生中必定会出现一个IQ的低分将150的IQ高分“平衡”掉。但是这样的观点实际上就是假定偶然事件具有自我修正的功能,事实上,偶然事件并不具有自我修正的功能,出现一个高分也不一定出现相应的低分与之抵消;余下的样本只是对这个偶然事件进行“稀释”,使其平均数更加接近总体的平均数(在这个例子中总体的平均数是100)。特韦尔斯基和卡尼曼(1971)认为,人们倾向于认为偶然事件具有自我修正的功能,这样的偏差也是来自代表性直觉,因为人们总是希望随机抽取的样本能够很好地代表总体。

同样,特韦尔斯基和卡尼曼(1971)认为代表性直觉可以导致人们承认“赌徒谬论”(gamblers fallacy),这种观点认为,在一系列的坏运气之后必然会有好的结果出现(或者,用更为通俗的话讲,就是认为一系列结果相同的独立事件必然会跟随一个相反的结果)。读者调查中的第31题就是检验你是否相信这样的赌徒谬论。题目的内容如下:

假定你连续投掷了3次硬币(该硬币没有偏差),每一次的结果都是正面。如果你必须对下一次的投掷进行投注,金额是100美元,你会选择正面还是反面?

由于这个硬币是没有误差的,正确的答案是你对正面还是反面没有偏好,因为两者出现的机会是相等的。但是有一些人错误地认为在连续出现了3次正面之后,反面出现的概率更大。特韦尔斯基和卡尼曼认为出现这样的答案就是因为人们错误地认为一个随机序列必须具备局部代表性(即序列的每一个部分都必须看起来像是随机的)。

手热现象

对小数法则一个最形象的说明是由托马斯·吉洛维奇等人(Thomas Gilovich, Robert Vallone,&Amos Tversky, 1985)进行的研究。这次研究者关心的是篮球比赛中的人们对于“手热现象”的认知。一位手热的篮球运动员就是指其在投中一个或者几个球以后,再次投篮时命中的概率大于其投失一个球以后的再次尝试。

吉洛维奇等人的研究发现费城76人队的球迷——包括几个队员和教练——都认为存在这样的手热现象,尽管数据统计分析发现并不存在这样的现象。也就是说,这些人认为一位队员在命中几个球以后再次尝试投篮的命中率将提高,然而事实上投中下一个球的可能性与该队员总体的投篮命中率并没有显著的差异。吉洛维奇和他的助手们通过对波士顿凯尔特人队的罚篮情况进行分析以及对康奈尔大学篮球队的男女运动员进行实验室的模拟实验(更具体而言,是在体育馆中进行的实验)的结果都证实了这样的结论。

在很短的时间内,这些研究发现在美国的运动界引起了轰动。吉洛维奇等人怎么可以将手热的现象仅仅说成是一种错觉?任何一个打过或者观看过篮球比赛的人都知道运动员在有些时候手热,而有些时候手冷!篮球队有时候为了防守手热的球员甚至改变他们的防守战术。认为同一个篮球运动员进行的投篮情况在统计上是不相关的观点似乎很难被接受。

为了找出这一现象存在的原因,吉洛维奇等人(1985)进行了一个实验,在这个实验中被试要观看6个由“X”和“O”组成的不同序列(也许你可以将它们理解成篮球比赛中的命中和失败)。每一个系列中都包含有11个“X”和10个“O”,在不同的序列中两个字母交替的可能性分别为.40,.50,.60,.70,.80或者.90。例如,下面的序列“XOXOXOOOXXOXOXOOXXXOX”表示两个字母之间转换的概率为.70(因为在20个相邻字母之间,两字母进行转换的次数为14次)。

吉洛维奇等人发现被试更多地认为.70或者.80的序列是随机序列的代表,而不是正确地选择.50的序列。只有32%的被试认为.50的序列是一个随机的序列,而62%的被试将.50的序列定义为是“手热”序列。

如果你想看看自己在这项任务中的表现,请查看一下你在读者调查中第38题的答案。第一个序列(XOXXXOOOOXOXXOOOXXXOX)有一半的情况下字母之间进行转换(类似于一个随机的序列)。与之相对应的是第二个序列(XOXOXOOOXXOXOXOOXXXO)代表.70的转换可能性序列——远远高于随机序列50%的数值。如果你认为在第一个序列中存在太多的连续性的相同字母,你必定会期望在序列中X和O有更多的转换(也就是人们为什么将一些随机的序列认知为“手热现象”)。本书的第14章将更加详细讨论个体对随机性的知觉。

忽视基线值

某些情况下,依赖于代表性直觉可能会使人们忽略“基线值”的信息(也就是一个事件发生的相对频率)。卡尼曼和特韦尔斯基在一系列的实验中考察了这一现象。例如,在一个实验中卡尼曼和特韦尔斯基(1973, p. 241)告诉被试:

一群心理学家对30名工程师和70名律师进行了访谈和人格测试,这些人在他们各自的领域内都相当成功。基于这样一些信息,心理学家对这30名工程师和70名律师进行了简单的描述。下面你将看到5个这样的描述,都是从100个描述中随机抽取的。对于每一个描述,请在一个0至100的标尺上选择你认为该描述有多大的可能性是对一个工程师的描述?

例如,下面一段话就是卡尼曼和特韦尔斯基用来代表一个工程师性格的简单描述:

杰克今年45岁。他已经结婚并有4个孩子。他通常比较保守,谨慎和雄心勃勃。他对政治和社会事件并没有多大的兴趣,他将他大部分的业余时间都用在了自己的爱好上面,例如家中的木工活、航海以及数字游戏。

使用同样的5个描述,卡尼曼和特韦尔斯基将第二组被试中工程师和律师的比例做了对调(即70名工程师和30名律师)。但是由于结果是相对应的,我们只是关注30名工程师组的结果。

每一位被试对这5个描述为工程师的可能性进行评价以后,研究者要求其估计一下从100个描述中随机抽取一个描述,该描述是工程师的描述的可能性。不出意料之外,被试大多认为这样的可能性接近30%。换一句话讲,在这样的情境中,人们使用了给定的基线信息。

在另一方面,当被试得到了一些有关的描述信息——即使有一些信息与工程师或者律师的职业特点并没有任何的联系——他们将忽略这样的基线信息。例如,卡尼曼和特韦尔斯基(1973)特地选择了以下的描述,这样的描述与工程师或者律师的职业特点并没有关联:

迪克今年30岁。他已经结婚了,但还没有孩子。他拥有很强的能力和很高的工作积极性,他希望在自己的领域内取得很大的成功,同时他也很受其同事的欢迎。

相对于迪克的职业而言,这样的描述并不能提供有用的信息;因此在这种情况下,该描述是一个工程师的可能性应该为30%。但是卡尼曼和特韦尔斯基(1973)的实验结果发现,被试认为该描述为工程师的可能性的平均估计为50%。很显然,在这种情况下,被试忽略了情境的基线信息,而仅仅从一个中性描述的角度来进行判断。

还有大量的研究都发现在某些情境下人们可能会忽视基线信息(Bar-Hillel, 1980, 1990;Fischhoff&Bar-Hillel,1984;Osberg&Shrauger,1986)。例如,艾克·阿杰增(1977)的研究发现,当基线信息与人们对因果关系的认知相一致时,人们就会使用基线值。在一个实验中,阿杰增要求被试根据一些相关的因素(例如该学生每周的学习时间)或者一些非相关因素(例如该学生每周的收入)来预测该名学生的学习成绩。实验结果发现,人们在接受了相关的信息以后更加愿意使用基线值,而对于那些不相关的信息——即使是被告知这样的信息也可以对学生的学业成绩产生预测作用,他们还是很少使用。

非回归性的预测

人们在进行预测时往往缺乏对信息来源的诊断,结果可能造成“非回归性的”(nonregressive)预测。例如,在读者调查中的第35题(基于卡尼曼和特韦尔斯基在1973年进行的研究)的内容如下:

假定一个学生高中时的考试成绩与其在大学中的学业成绩(GPA)有中等程度的相关。基于如下图所示的百分等级(见图10.2),如果一个考试成绩为725分的学生,其GPA将是多少?

你的答案将是什么呢?绝大多数人的预测是其GPA将在3.5和3.7之间。如果高中时期的考试成绩能够很好地预测大学时期的学业成绩,那么这样的答案无可厚非。即如果两者之间能够一一对应,725的考试成绩应该对应的GPA为3.6。但是根据整个问题的背景,我们发现高中时期的考试成绩并不能很好地预测大学的GPA,因为两者之间只有中等程度的相关。由于存在着这样中等程度的相关,因此对该学生GPA最好的预测将在3.6和GPA的平均数2.5之间——这样才能体现“向平均数回归”。

图10.2 高中考试成绩与大学学业成绩(GPA)之间的关系

向平均数回归是统计中存在的一个现象,即较高或者较低的分数往往会伴随着一些更加接近平均数的分数,就像两位非常高的父母亲的孩子往往会更接近平均身高一些。因为725是一个很高的分数,如果你让该名学生再次考试,其成绩可能会更加接近平均分500分一些(根据同样的逻辑,它可以预测一个相应更低一些的GPA)。你可以用这样的方法来进行思维:如果你不知道一名学生任何方面的信息,你最佳的预测是他的GPA将是2.5,如果高中的考试成绩和大学的学业成绩之间有完全的正相关,你的预测将是3.6。因为高中的考试成绩与大学的学业成绩之间具有中等程度的相关,那么最好的预测就是居于2.5和3.6之间(比平均数高,但是没有3.6那么高)。

绝大多数心理学家都认为考试成绩是由两个独立的成分组成的:“真实分数”和“误差”。如果一个考试能够很好地测量一个人的能力,真实分数就是该学生在考试中应得的分数;同时误差因素包括所有与能力无关但是同样会影响考试成绩的因素(例如考试前一天晚上的睡眠时间、血糖水平、心境以及当时的照明情况等等)。在绝大多数的情况下,这些因素可以相抵消,但是在一些偶然的情况下,这些因素共同作用可以戏剧性地提高或者降低一个人的考试成绩。由于这样的波动与真实分数之间是没有关系的,因此下一次的考试成绩就更有可能向真实分数进行“回归”。

忽视这种回归现象可能会使决策产生重大失误。例如,卡尼曼和特韦尔斯基(1973)讨论了这样一个案例,一所飞行学校的指导员得出了这样的结论,对飞行员的出色表现进行表扬会导致其下一次飞行成绩的下降。这样的成绩下降是否意味着指导员应该停止对飞行员进行表扬?完全不是这样!如果只是考虑回归理论,即一个非常出色的成绩必将跟随着一个更加接近平均数的成绩。那么,糟糕的成绩得到惩罚以后也必将得到提高,而不用考虑这样的惩罚是否真正产生了作用。

理查德·尼斯比特和李·罗斯(Richard Nisbett&Lee Ross, 1980, pp.163, 165)在他们有关人类推论的书中描述了人们对回归错误理解后产生的另一些后果:

人们对于一些简单的回归现象的错误理解(例如一件非常好或者非常差的事件之后,必然会跟随着一些不那么好或者不那么差的事件,而不管其中是否存在随机因素)在我们的日常生活中是屡见不鲜的。这样的误解可能会使人们惊惶失措,以为产生了严重的“危机”(如犯罪率、疾病或者银行破产的突然上升,或者是销售额、降雨量或奥林匹克运动会的金牌数量突然减少),这样的一些事件对人们产生的影响看起来比实际情况要严重得多……仅仅在观察到一些简单的回归现象后,人们就会产生一些迷信:比如说非要做点什么去结束一连串的“坏运气”;或者什么都不敢做以免失去“好运气”。

乔治·迈尔奇(George Gmelch, 1978年秋)曾经是一名职业棒球运动员,后来成了一名社会科学研究者,他在他题为“棒球中的魔术”一文中列举了一些这样的迷信。根据迈尔奇的说法,纽约巨人队为了保持16场连胜的势头,不愿意洗他们的队服,生怕洗掉了他们的好运气。同样,1941年布鲁克林Dodgers队的队员Leo Durocher在三周半的时间内一直穿着同一双黑鞋,灰色的袜子,蓝色的外套,目的是为了保持连胜的势头。

向平均数回归同样也可以解释为什么非常成功的运动员或者运动队在登上了《体育画报》杂志的封面以后,其运动成绩马上就有所下降。通常来讲,能够登上该杂志封面的运动员都是取得了一系列非常优秀的成绩之后,如果单单是从回归的角度考虑,其运动成绩有所下降也有其必然性。众所周知的“《体育画报》厄运”其实根本就不是厄运,而仅仅是向平均数回归而已。

人为的预测和数据的预测

人们忽视基线值和数据回归性的倾向性造成了许多令人吃惊和窘迫的现象。在社会科学中(Dawes, Faust&Meehl, 1989)有大约100个研究的结果表明“数据”预测(仅仅是依据给定变量和结果之间的实证关系来进行预测)的准确性等于或者高于“人为”预测(依据个体的判断而进行的预测)。换言之,与一般的常识相反,由决策者完成的决策的准确性往往偏低——即使该决策者完全掌握了数据的信息。

例如,有这样一项针对人为决策进行的研究(Lasky, Hover, Smith, Bostian, Duffendack&Nord, 1959),在预测患者是否需要重新进行心理治疗的决策中,将12名心理治疗专业人员的决策与患者的病历档案重量之间进行比较。患者的病历档案重量可以用来作为患者以往就医情况的一个大致估计。结果表明,专业人员的判断的准确性并没有显著高于病历档案重量的预测作用(两者的相关系数分别为.62和.61)。

很显然,专业人员的专业知识以及掌握的相关信息是其他因素所无法比拟的。但是使用人为决策的方法通常需要依赖于像代表性这样的直觉——容易受到很多偏差的影响——因此人为预测的准确性很难超过仅仅依据数据关系而进行的预测。

结论

有关代表性直觉的研究结果表明,有一些方法可以提高决策和判断的技巧,内容如下:

√不要被很细节的情境所迷惑。正是情境中的细节使得整个情境看起来更加具有代表性,但是同时也减少了其发生的可能性。一般而言,情境越是具体,其发生的可能性越低——即便这样的情境看起来能够非常好地代表最可能发生的结果。

√只要有可能,无论什么时候都应该注意基线值。当一个事件极少发生或者是非常普通的事件时,基线值就显得尤为重要。例如,由于录取的比例非常低,因此很多优秀的申请者都没有机会进入研究生院进一步深造(通常的误解就会认为这样的申请者并不具备所需要的学术能力)。相反,由于通过的比例非常高,许多不合格的驾驶员都顺利拿到了驾驶执照。当基线值是一个极端数值时,代表性往往成为发生可能性的误导因素。

√记住偶然性并不具备自我修正的功能。一系列的坏运气,就是一系列的坏运气。它并不意味着相应的好运气必然会来临,也不意味着事物总是一成不变的。如果一个随机的过程(就像投掷一枚没有偏差的硬币)存在一定的可能性产生一定的结果,那么过去的事件对将来发生的结果并不会产生影响。

√不要错误地理解向平均数回归。即使出现了一系列的坏运气,也不一定会有一系列的好运气与之相平衡(或者相反),但是一些极端的成绩往往会跟随着一些更接近平均数的成绩。向平均数回归是非常正常的,无论结果是否受到一些随机因素的影响。即使在某些时段,这些随机因素结合在一起可能产生一些非正常的结果,但是在接下去的情境中,成绩通常会回归正常。

将这些建议牢牢记在心中,就有可能避免许多由于依赖代表性直觉而产生的偏差,在下面的第11章里,我们将重点讨论另一个著名的直觉:“易得性直觉”,以及由此而产生的偏差。

第11章 易得性直觉

根据阿莫斯·特韦尔斯基和丹尼尔·卡尼曼(1974, p. 1127)的理论,易得性直觉也是人们经常使用的一种直觉。决策者“通常会依据一些容易想起来的事例来判断一种类别出现的频次或者事件发生的概率”。通常情况下,这样的直觉能够很好地发挥作用,在所有条件都平等的前提下,普通的事件要比不寻常的事件更容易被记住或者想像出来。决策者利用易得性直觉(availability heuristic)来估计事件发生的频率和概率往往能够将困难的决策内容简化。

但是,无论你使用何种直觉,在某些特定的情况下,这样的一般原则都可能失效并导致系统性偏差。有一些事件相对于其他事件而言更容易想到,并不是因为这样的事件更经常发生或者具有更高的发生概率,而只是因为这样的事件更容易被提取。可能是因为这样的事件是刚刚才发生的,也可能是这样的事件掺杂了很多情绪的因素。在本章中,我们将着重讨论以下几个问题:(1)在哪些情境下,易得性直觉可能会导致偏差?(2)当人们想像一件事件发生以后,他们是否会认为这样的事件更加容易发生?(3)生动的信息与其他类型的信息是如何进行区分的?

歪曲的易得性

请你想像一下,在美国,下面两种情况哪一种更容易导致人死亡——被飞机上掉下来的零件砸死还是被鲨鱼咬死?绝大多数的人都认为被鲨鱼咬死的可能性更大(请查看一下你对读者调查第7题的回答)。相对于被掉下的飞机零件砸死的案例,被鲨鱼咬死的案例得到了更多的社会关注,这样的例子更容易被人们想像出来(从某种程度上讲,这也应该感谢像《大白鲨》这样的电影所造成的影响)。但事实上,在美国,死于掉下来的飞机零件的个案是被鲨鱼咬死的个案的30倍。在这个例子中,易得性直觉就是一个误导人们进行频率判断的因素。

读者调查中的第8题进行了一次比较,人们又发现一个惊人的答案(取自库姆斯和斯洛维奇1979年的研究)。例如,由于很少有媒体关注这样的问题,因此人们对于下列事实感到十分惊讶,那就是:每年死于糖尿病或者胃癌的人数是死于凶杀案或者交通事故的人数的两倍,而每年死于雷击的人数高于死于龙卷风的人数。特韦尔斯基和卡尼曼认为,这样的统计数据与人们的直觉正好是相反的,人们的直觉会根据事件在大脑中唤起的难易程度来估计事件发生的可能性。由于交通事故、龙卷风或者谋杀几乎都是媒体的头条新闻,因此它比那些发生频率更高的事件——胃癌、雷电或者糖尿病——更“容易提取”。

当某些事件本身很难被想像时,易得性直觉也可能会导致偏差。例如,特韦尔斯基和卡尼曼(1973)问人们如下问题:在一般的英文词汇当中,以K作为开头字母的单词和以K作为第三个字母的单词相比,哪一个更多(不要考虑字母数少于3的单词)?在回答问题的152个被试当中,有105个被试认为由K作为首字母的单词要多。但是事实上,以K作为第三个字母的单词数是以K作为起首字母的单词数的两倍。因为人们更容易想到的是以K作为起首字母的单词,而不是以K作为第三个字母的单词,因此人们会错误估计了这两类单词的相对比例。

当结果在视觉上更加容易辨认的时候,易得性直觉同样可能会导致偏差。读者调查中的第37题正好可以说明这样一种现象:

请仔细观察下面A、B两个不同的结构。

这里的一条“通路”就是指将本结构中的每一层上的一个X连接起来。换一句话讲,在结构A中,一条通路就是连接三层中的X(一共三层结构,每一层选取一个X);而在结构B中,一条通路就是连接九层中的X(九层结构,每一层选取一个X)。

(a)在这两个结构中,哪一个包含的通路更多?

(b)在结构A中,大约包含了多少条通路?在结构B中呢?

绝大多数的人都发现,在结构A中找到一条通路比在结构B中简单多了,因此他们都认为结构A中包含的通路较多。特韦尔斯基和卡尼曼(1973)针对这个问题进行了研究,发现85%的个体都认为结构A所包含的通路较多。而他们对于通路数量的估计是:在结构A中包含的通路数大约为40条,而结构B中大约为18条。

事实上,这两种结构中所包含的通路数是相等的。在结构A中,第一层的X共有八种不同的选择,第二层的X也有八种选择;而第三层的X同样有八种不同的选择。因此在这个结构中通路数量为8×8×8(512)。在结构B中,一共包含的通路数量为2×2×2×2×2×2×2×2×2,其通路的总量也是512。这样,这两种不同的结构所包含的通路数量是相等的,尽管结构A中的通路更加容易被识别(因为在结构A中每一层一共有8个不同的选择,而在结构B中,每一层只有两个不同的选择)。

一个想像的研究

1978年,约翰·卡罗尔(John Carroll)发表了一项研究成果,他将易得性直觉与对一个事件的想像联系了起来。卡罗尔的推理是如果一个容易被想像的事件能够被判断为更可能发生的事件,那么对一个事件的刻意想像可以增加其易得性,从而使它看起来更可能发生。他用两个实验来验证这样的假设。

第一个实验是在1976年美国总统大选的前一天进行的,参与者被要求想像他们在当天的晚上或者第二天一早从电视上看到了总统大选的结果。大约一半的参与者被要求进行如下的想像:

福特赢得了最后的大选,而卡特由于没有抓住几个关键的州而失败,福特最终赢得了中西部和西部的绝大多数州的选票,他一共获得了316个选举团的选票,而卡特赢得了222个。如果以州为单位来进行统计,福特最后赢得了32个州的选票,而卡特赢得了18个州和哥伦比亚特区的选票。

而余下的另一半参与者被要求进行如下的想像:

卡特利用其在南部和东部取得的不可逾越的优势而赢得了最后的大选,福特尽管横扫了西部但是也无济于事。卡特最后赢得了342个选举团的选票,而福特赢得了196个。卡特赢得了28个州和哥伦比亚特区的选票,而福特赢得了22个州。

这些情境中使用的是最新的民意调查的结果,参与者不仅要想像这样的情境是真实的,而且还要同时想像获胜者胜利之后的演讲,以及失败者失败后的情境。这样的想像力求尽可能真实。然后,当参与者完成这样的想像之后,让他们判断最后的大选的实际结果如何。

实验的结果表明想像卡特获胜的参与者更多地预期卡特能够获得最终的胜利,而想像福特获胜的参与者更多相信福特能够获得最终的胜利。根据卡罗尔的假设,对给定结果的想像可以使结果容易提取,同时也增加了对其发生概率的估计。

在第二个研究中,卡罗尔(1978)要求匹兹堡大学的学生想像他们的橄榄球队在1977赛季取得了很好的战绩或者想像他们在该赛季糟糕的表现(匹兹堡大学的橄榄球队赢得了1976赛季的全国冠军,但是在1977年该队的教练和几位优秀的队员相继离开了球队)。尽管最后的结果并不能完全验证原来的假设,但还是显示对结果的想像可以增加对其结果发生概率的预期。例如,在35名想像球队取得好成绩的参与者中,63%的参与者认为他们在1977赛季可以取得很好的成绩;而在38名想像球队糟糕表现的参与者中,只有40%的人认为球队能够在1977赛季取得好成绩。结合这两个研究的结果,卡罗尔认为个体对结果的想像可以增加对其结果发生可能性的预期。之后,又有一些研究者的研究重复或者发展了这样的研究结果(Anderson, 1983;Gregory, Cialdini,&Carpenter, 1982)。

想像的局限性

如果一个事件的结果很难想像,将会出现什么情况呢?如果一个决策者很难想像出一个事件的结果,其知觉的结果的可能性是会上升还是下降?在1985年,吉姆·舍曼,罗伯特·恰尔蒂尼,唐娜·施瓦茨曼和金·雷诺兹(Jim Sherman, Robert Cialdini, Donna Schwartzman,&Kim Reynolds)就这个问题进行了研究。

舍曼和其合作者要求参与者阅读两种疾病的描述之一,这两种疾病在校园里发生的频率越来越高。这两种疾病在医学上都被称为是“Hyposcenia-B”,但是根据实验条件的不同,对这两种疾病的描述是完全不同的。在“容易想像”的实验条件下,参与者读到的疾病描述是非常具体的症状描述,例如肌肉疼痛,很低的能量水平以及经常性的头痛等等。而在“很难想像”的实验条件下,参与者阅读的是非常抽象的症状,例如模糊的方向迷失感,神经系统的功能失调以及肝脏发炎等等。

控制组的参与者就是简单地阅读了有关“Hyposcenia-B”的症状描述——无论想像是简单还是困难的——然后判断将来患上此病的可能性有多大。另一方面,实验组的被试要求他们“想像在3周的时间内他们感染上了这样的疾病,并且会经历到描述中的症状。”同时,他们被要求想像一下在3周的时间内,他们感染上这样的疾病以后的感受。

舍曼和其合作者发现,控制组的被试不会受到结果想像的难易程度的影响,但是实验组的结果是非常显著的。在实验组的被试中,相对于控制组的被试而言,“易于想像”的实验条件下,被试认为感染此病的可能性更大。舍曼等人(1985)认为对结果的想像并不能保证其出现的可能性更高;如果事件的结果是很难想像的,想像的努力就会降低人们对其发生可能性的预期。

否定

对事件结果的想像并不一定会提高人们对其发生可能性的预期,另一种情况是事件的结果是极端负性的。有些事件的结果是如此糟糕,以至于对事件结果的想像使他们否认这样的结果会在自己的身上发生(Rothbart, 1970)。

对于许多人而言,这样的极端结果事件的例子是核战争。在1989年,作者发表了一个研究,研究者询问了大约2000个人,让他们估计一下在未来的10年中发生核战争的可能性有多大。尽管在本书的第13章中将更加详细地阐述这个研究的过程和结果,但是其中的两个结果与易得性直觉是相关联的。首先,让参与者很形象地想像核战争爆发时的情景(例如,增加“结果的易得性”)并不能显著地影响个体对于发生核战争可能性的预期。第二,让参与者想像发生核战争的各种不同的途径(增加“路径的易得性”)同样不能显著影响他们的判断。第二个结果是令人惊讶的,因为有不少的研究已经发现路径易得性的重要性(Hoch, 1984;Levi&Pryor, 1987;Ross, Lepper, Strack,&Steinmetz, 1977;Sherman, Zehner, Johnson,&Hirt, 1983)。

人们对于这样一些情境——包括将自己最亲近的朋友和家人火化这样的情境——产生如此强烈的否定感,以至于认为核战争是不可能发生的。就是这样一种排斥感抵消了上升的易得性,使个体对于事件发生的可能性的预期保持不变。这样,如果一个事件的结果是非常恐怖的,就会使个体产生否定感,这样对其结果的想像并不一定能够提高个体对其结果发生可能性的预期。

生动性

与易得性相近的一个概念是生动性。生动性通常是指某事件多么具体和易于想像,尽管在另外一些情况下,它还会有其他的含义。有时候,指某事在情绪上的令人激动,或者是事件之间在时间或者空间上的接近性。许多研究的结果表明,决策者更加容易被生动的信息所影响,而不是平淡的、抽象的或者是统计的数据(Nesbett&Ross, 1980)。

例如,尤金·博吉达和理查德·尼斯比特(Eugene Borgida&Richard Nusbett, 1977)进行了一项研究,对比了一项大学课程评估的统计数据和一个更加生动的描述之间的有效性。参加本实验的被试,绝大多数都是来自密歇根大学心理学专业的学生,他们被安排到了三个不同的实验条件下:(1)基线条件,在这样一个实验条件下,他们读到的是一个在5点量表上的对课程的评分统计结果,这样一些统计结果都是来自于上一个学期选课同学对于该门课程的打分;(2)面对面的条件,在这样一个实验条件下,被试听取了1~4个不同学生委员会对课程的评估报告(这样的评估委员会也为不同的课程在5点量表上进行打分,评分的结果与上一个基线条件下的结果是相同的);(3)没有评估结果的控制条件,在这样的实验条件下,被试既没有听到也没有读到任何有关课程评估的信息。然后,在读完学生对课程的评估信息或者听完委员会对课程的评估报告之后(对于控制组而言,他们并没有得到任何的信息),学生被要求列出27门大学课程中哪一些是他们将来最有可能选择的课程。

因为基线条件下的被试读到的信息包含了几乎所有学生对该课程的评估结果,因此最“逻辑”的结果是在该实验条件下的被试最容易接受课程推荐中的所推荐的课程。但是正如表11.1所示,博吉达和尼斯比特发现结果正好相反,只是听取了少数学生的评估意见的学生比那些读过详细的综合统计分析结果的学生更容易接受所推荐的课程。事实上,基线条件的被试与控制条件的被试相比,在统计上他们并没有显著地多选被推荐的课程,而少选没有被推荐的课程。而只有面对面实验条件的被试与控制组的被试之间的差异是显著的。与控制组的被试相比,面对面条件的被试平均多选了1.4门推荐的课程,而少选了0.9门非推荐的课程。

这样的实验条件可以证明少量的对课程的生动评价可以超过综合性的统计数据。正如许多新车购买者都遇到过的,一个生动的关于车辆瑕疵的故事足可以消磨掉你从《消费者报告》这样专业杂志的统计中建立起来的信心(Nisbett, Borgida, Crandall,&Reed, 1976)。同样,罪犯或者目击者对犯罪事实的生动描述也可以掩盖犯罪的统计数据和报告。因为这样生动的信息是“可得的”,与平淡的信息相比更容易被回忆起来,因此会使决策产生偏差。

在法律上的应用

生动信息的力量深得广告人、政客以及许多其他的“专业说服者”的青睐。而生动性能够起到决定性作用的一个领域是法庭。罗伯特·雷耶斯,比尔·汤普森和戈尔登·鲍尔(Robert Reyes, Bill Thompson,&Gordon Bower,1980)通过一项研究来证实这样的观点,即信息的生动性可以影响陪审团最后的决策。实验是通过两个过程来完成的。

表11.1 推荐生动性的力量

注释:该表摘自博吉达和尼斯比特所做的研究(1977)。比起控制组学生来,面对面条件下的学生选择了更多的推荐课程和更少的非推荐课程,而基线条件下的学生与控制组没有显著差异。

第一步,被试读到了一个关于酒后驾驶的案例。被告在圣诞节晚会以后驾车回家,撞倒了一个停车的标志,最后与一辆垃圾车相撞。但是被告血液中的酒精含量还没有检测,需要在当时这样一些证据的基础上进行判断。辩方认为被告并没有酒后驾车。

在读完被告的一个简单的人格描述以后,被试将读到9条由辩方提供的无罪的证据,也会读到9条由控方提供的被告有罪的证据。这18条陈述每一条都是一个证据,将用一种生动或者平淡的方式提供给不同的被试。例如,控方的一条平淡的证据是这样描述的:

在他出门的路上,桑德斯(被告)沿着桌子蹒跚而行,将一个盘子打落在地上。

同样的证据,用生动的方式表述是这样的:

在他出门的路上,桑德斯(被告)沿着桌子蹒跚而行,将一个蘸酱的碟子碰到了地上,酱在粗毛绒的地毯上溅了一地。

同样,辩方平淡的证据是这样表述的:

在交叉询问中,垃圾车的驾驶员承认,在晚上,垃圾车是很难辨认的,因为该车的颜色是灰色的。

而同样的信息用生动的方式表述是这样的:

垃圾车的司机承认垃圾车是灰色的,他说:“因为它成天在垃圾堆里面打滚,你觉得我应该怎么做,难道把它涂成紫色吗?”

大约一半的被试获得的是辩方生动的证据陈述和控方平淡的证据陈述;而另一半的被试获得的是辩方平淡的证据陈述和控方生动的证据陈述。

当读完这18个陈述以后,被试被要求进行下面三个决策:(1)你认为在事故发生的时候,桑德斯喝得有多醉?(2)以你个人的观点,你认为桑德斯是有罪还是无罪的?(3)如果你是陪审团的成员,你必须依据“在毫无疑问的情况下才可以定罪”的原则,你会怎样进行裁决?(这三个判断最后将平均起来形成一个总体指数,判断被试认为桑德斯犯罪的程度。)第一阶段的实验结束,被试可以返回,但是被要求在48小时以后回来进行实验的第二阶段。

当被试来参加实验的第二阶段时,首先要求他们尽可能多地回忆两天以前读到的18条证据。他们要回答第一阶段结束时要求回答的同样的三个问题。告诉被试他们不用要求自己的回答与上一次相同,他们应该“就像第一次遇到这样的案例一样”做出自己的判断。

雷耶斯,汤普森和鲍尔的实验结果发现,在第一阶段,当被试读完18条证据之后,证据的生动性并不能影响他们的判断,但是在实验的第二阶段(48小时以后)却产生了显著的影响。在控方生动证据条件下的被试更多地认为被告是有罪的。雷耶斯,汤普森和鲍尔(1980)对这一延迟现象的解释是生动的证据更容易被回忆起来。同样,在博吉达和尼斯比特(1977)的研究中发现,相对于平淡的信息而言,生动的信息最终可以产生更大的影响。这样的结果也可以解释为生动的信息更容易被提取。

不同的声音

为了证实以上的结论,有必要对有关“生动效应”的研究进行一次综述,以期了解在一般情况下,生动的信息相对于平淡的信息而言,是否能够产生更大的影响。谢利·泰勒和苏珊娜·汤普森(Shelley Taylor&Suzanne Thompson,1982, p. 178)对有关“生动效应”的实验室研究进行了一次全面的总结,结果发现绝大多数的实验室研究都发现生动效应是混合的,或者在有些实验室研究中根本就不存在生动效应。他们的结论是:至少相对于实验室研究而言,即便生动效应确实存在,这样的效应也是相当微弱的。

这个结论当然可以调节一下以往的结论,认为生动信息能够产生很大影响的观点值得商榷。同时,我们也不可否认,在一定的情境下,生动效应确实是存在的。原因有三个。第一,泰勒和汤普森在下一般性结论的同时也提出了许多的特例。例如,他们发现使用案例的历史资料就比统计的或者抽象的信息更具说服力;在一定的情境下,使用录像的呈现方式就比书面或者口头的陈述更具说服力。第二,泰勒和汤普森也意识到,可以有很多种不同的方法来解释研究结果的缺损。在一个具体的实验条件下没有发现生动效应,完全可能是由于实验设计中存在一定的偏差,从而导致实验的结果产生偏差,在某些研究中,生动性的变量与其他几个变量都产生了混淆。最后,泰勒和汤普森也指出,在实验室条件下,可能促使被试关注日常生活中经常被他们忽视的一些信息,这样就导致生动效应没有办法通过实验室模拟的方法得以验证。因此,实验室的设计可能在很大程度上低估了生动效应在人们日常生活中的作用。

在最后的分析中,我们也可以发现,尽管生动效应在某些情境下是可以产生作用的,但是其适用的范围和效力都存在一定的局限性。同时,依据易得性直觉的一般原则,相对于平淡信息而言,对事件的生动描述可以提高人们对其发生概率和频率的判断。

结论

在很多情况下,易得性直觉可以为我们提供很多关于发生频率和概率的准确估计。但是在某些情况下,它同样可以使人们的判断产生很大的偏差。例如,人们基于对胃癌这样的致死性疾病死亡率的认知来判断公共的健康水平。如果这样的疾病的死亡率被低估,人们就不太可能采取很多预防措施(Kristainsen, 1983)。同样的,如果一些描述非常生动的,但是并不经常发生的致死原因被高估了,人们的视线也将随之转移,而忽略了普遍的危险。例如,有一些作家也指出,美国人高估了他们在国外旅游时遭到恐怖分子袭击的概率(Paulos, 1986, November 24)。

解决这个问题的办法是公开比较这些以往被我们低估或者高估的危险。例如,美国癌症协会就可以推行一项公共信息运动,比较一下胃癌与其他公众认为更加危险的事故的死亡率,如谋杀和交通事故等。结果公告牌可能宣布:“今年死于胃癌的人数大于死于交通事故的人数。”毫无疑问,这样的比较可以使人们意识到胃癌的死亡率比他们想像的高得多(尽管这种宣传有可能使人们忽略交通事故的死亡率)。旅行社也可以使用同样的策略,告诉旅行者他们在国外遭遇交通事故的可能性远远大于受恐怖分子袭击的可能性。

谈到估计事件发生的概率和频率,易得性直觉是最重要的一个环节。但是大家需要牢记的是:易得性直觉也仅仅是影响人们对概率和频率判断的因素之一。在第12章中我们将讨论影响人们概率判断的其他因素,以及我们该采取什么样的措施来避免在决策中产生偏差。

第12章 概率和风险

概率和风险在我们的日常生活中无处不在:我们轿车的刹车,我们头顶的云彩,我们每天摄入的食物以及我们对他人的信任。但是风险通常很难进行量化,甚至概率事件中最基本的问题也可能成为一个很大的挑战。设想一下专栏作家玛丽莲·沃斯·萨万特(Marilyn vos Savant, 1990, 9月,p. 13)对声名狼藉的“游戏秀问题”所做的讨论。

假设你正在参加一个游戏,你可以选择三扇不同的门:在其中一扇门的背后是一辆轿车,而另两个门后面是山羊。你选择了一号门,然后主持人说我们来看一下另两个门后面到底是什么,主持人打开了三号门,后面是山羊。然后他问你:“你是否会选择二号门?”这个时候你会改变主意,转而选择二号门吗?

在你继续阅读以前,请先做出您的选择。

许多人都认为在这个时候是否改变决策都没有什么差异。原因是他们认为在主持人打开其中的一扇门以后,剩余的两扇门背后有轿车的概率是相同的。然而,这并不是正确的答案。

正确的答案是你应该改变你的决策。对于这个问题,萨万特是这样来解释的:

当你从三扇门中挑选第一扇门后,你就有三分之一的机会得到大奖,而有三分之二的机会得到山羊。但是随后主持人上台来给你提供线索。如果轿车是在二号门,他就会选择三号门来给你看;而如果轿车是在三号门,他就会选择二号门来给你看。因此,如果奖品是在二号门或者三号门的后面,你只要改变你的决定,你就可以获得大奖,只要它是在二号门或三号门的后面!但是如果你不改变你的决定,那只有奖品在一号门后面的情况下,你才能够得奖。

矛盾信息的困惑

这里有另外一个难题:假设你是一位外科大夫,正在为一位妇女检查她是否得了乳腺癌。她的乳房上有一个肿块,但是依据你多年的临床经验,她患有

表12.1 游戏秀问题的结果

注释:正如上表中显示,如果你采取改变决定的策略,在九种不同的情况下,有六种情况你将获得最后的胜利(adapted from Selvin, 1975, February)。因此采取改变决定的策略才是最佳的策略。

恶性肿瘤的概率只有1/100。但是为了安全起见,你让她做了X光检查。这样的X光检查确诊恶性肿瘤的准确率为80%,而检测良性肿瘤的准确率为90%。

令你非常惊讶的是,检查报告显示该妇女乳房上的肿块是恶性肿瘤。

问题:你先前的观点认为该妇女患有恶性肿瘤的概率只有百分之一,而检查报告的结果准确性为80%或者90%,现在你认为这位妇女患有恶性肿瘤的概率为多少?(在你继续阅读之前,请给出你的答案。)

根据戴维·埃迪(David Eddy, 1982)的研究结果,在100位外科大夫中有95位大夫认为这位妇女患癌症的可能性为75%以上。但是事实上,正确的答案应该是7%或者8%——只有大家所认为的1/10。很显然,大夫认为该妇女患癌症的概率大致与X光检查的准确性类似。决策研究者罗宾·迪尤斯(Robyn Dawes)将这样的错误称为“矛盾信息带来的困惑”。

为了让大家了解为什么正确的答案是7%或者8%,我们首先需要了解统计学中一个不太为人了解的定律——贝叶斯定律。根据贝叶斯定律,估计该妇女患癌症可能性的方法应该是:

这里“P(癌症)”就是患者得癌症的概率,“P(癌症|阳性)”表示在检查结果为阳性的情况下,患者得癌症的概率。前者是一个简单概率,而后者是一个条件概率。

等式的左边就是埃迪要求外科大夫判断的概率,而等式的右边则可以通过问题中给定的信息得到:

P(癌症)=.01[最先估计患者得恶性肿瘤的概率为1%]

P(良性)=.99[患者没有患癌症的概率]

P(阳性|癌症)=.80[癌症的检查结果下可能有80%的概率患者为阳性]

P(阳性|良性)=.10[将良性误判成恶性的概率为10%]

既然公式中的数据都是已知的,就可以将所得到的数据带入公式,计算出患者患有恶性肿瘤的条件概率为:

对于许多人而言,这样的结果是非常令人惊讶的,但是同样令人惊讶的是参加埃迪实验的外科大夫得到相关信息后的反应方式。埃迪是这样来描述的(1982, p. 254):

这些决策错误的大夫通常都假定X光检验呈阳性的患者得癌症的可能性就大致等于X光检查的准确性……第二个概率是在临床中得到的,他们对此都非常熟悉,但是第一个概率需要大夫进行临床的决策。即使不是绝大多数,也有许多大夫会把两者混淆起来。

尽管对于矛盾信息的困惑绝不仅仅局限于外科大夫,但是,在这个领域中,这个问题是非常重要的。在有关生死的决策中,很少有机会能够弥补。

如果在某种情境下贝叶斯定律并不能够起作用,你该怎么办呢?答案就是我们应该认真地审视统计学上被称为“先验概率”的概念。先验概率(prior probability)就是在新信息(X光的检查结果)到来之前,对一个事件发生概率的最佳估计。在乳腺癌决策问题中,先验概率就是大夫起初对于患者得癌症的概率判断,为1%。因为在这样的情境中先验概率是非常低的,而X光的检测准确率为80%~90%,因此在获得X光检查结果以后的概率判断应该不会比先验概率高出很多。如果实际的结果中先验概率是非常不可能发生(或者非常可能发生),然后“更新”源于不十分可靠的信息,这样的原则同样可以产生作用。根据像贝叶斯定律这样的标准理论,先验概率和修改后概率之间的绝对差异不会很大。

这样的事情绝对不会发生在我身上

对事件的概率判断同样会受到事件结果“效价”(就是事件的结果在多大程度上被认为是正性的还是负性的)的影响。早在20世纪50年代,许多研究都已经证明,在其他条件都相同的情况下,个体认为正性结果发生的概率比负性结果要高(Blascovicn, Ginsburg,&Howe, 1975;Crandall, Solomon,&Kellaway,1955;Irwin,1953;Irwin&Metzger,1966;Irwin&Snodgrass,1966;Marks,1951;Pruitt&Hoge, 1965)。当要求个体对事件的发生概率进行判断,或者判断两个结果哪一个更加可能发生,或者打赌一个结果的发生概率时,以上的现象都存在。即使是为了提高准确率而给予物质刺激的时候,这样的规律还是存在(尽管在这样的情况下,这种效应有可能降低)。

关于这种偏差的直接证据来自于戴维·罗森汉和塞缪尔·梅西克(David Rosenhan&Samuel Messick)在1966年进行的研究。在实验中,罗森汉和梅西克一共使用了150张带表情的图片(如图12.1),其中有一些图片是皱眉的脸孔,还有一些是微笑的脸孔。在其中的一个实验条件下,70%的图片是微笑的脸孔,而30%的图片是皱眉的脸孔;而在另一种实验条件下,30%的图片是微笑的脸孔,而70%的图片是皱眉的脸孔。被试的任务就是猜测当每一张图片翻过来时是微笑的脸孔的概率。

罗森汉和梅西克的实验结果发现,当图片中70%是微笑的脸孔的时候,被试的反应是比较准确的。在整个实验过程中,被试判断是笑脸的平均可能性为68.2%。但是在另一种实验条件下(70%是皱眉的脸孔),被试判断是皱眉的脸孔的平均可能性只有57.5%——明显少于70%的概率。在这样的情况下,个体对结果效价的估计影响了个体对结果发生概率的判断。