当农业刚刚兴起,自然选择往往作用在已有的遗传学改变上;就好像在小规模的人为选择实验里,改变的只是现有等位基因的频率。
大部分已有的遗传改变形式必然是一些中性变异,其中每一个基因的中性变异都不会与其他显著不同。这些遗传变化可能会起一些作用,但这些中性等位基因都在干一样的事情。欧亚大陆上未来的农牧者会遇到很多问题,我们很怀疑这些中性的基因中的大部分最终能转化成解决这些问题的性能。更可能的是,先前存在的功能性改变更加重要。比如说,有一个基因,它的古老形式会帮助人们去保存盐。因为人类在历史上大部分时期都生活在温热地区,这个遗传改变普遍地起作用。然而在如今的非洲裔美国人中,这个古老基因的高频出现则很可能是这一群体日益增高的高血压风险的其中一个原因。事实上,在热带非洲,几乎每个人都携带这一基因的古老形式。在欧亚大陆,随着人们向北迁移,这一基因的一个无效变体(它真的啥也不干)变得越来越常见。[4]有可能这一基因在肌体中储存盐的作用在更冷的地区变得有害,因为人们更少地通过流汗流失盐分,它会导致过量盐分引起的高血压。
很重要的是,这个无效基因在欧洲和在东亚是一样的,这就说明它源自非洲而且古老。如果它是分别在欧洲和亚洲独立起源的话,我们就该在这两个地区看到它的不同变体,就如不同的不连续色素基因带来的两个地区的浅色皮肤。
对这个失效的盐分保存基因最合理的解释是:(在人类扩张并走出非洲之前)非洲的某些地区足够凉爽,在这些地方保存肌体盐分不是迫切需求,因而这个基因的一种不活跃的形式反而是有利的。这有可能在冰期的埃塞俄比亚发生过,想想看即便如今埃塞俄比亚高原的气候仍然是温和的。如果情况就是如此,那么这个失效的等位基因就代表了先前存在的、由非洲之内环境变化引起的适应性变化,而不是中性变异。
另一种先前存在的遗传变异会带有平衡的多态性。当一个群体维系着同一个基因的两种不同的等位基因,平衡的多态性就会出现,而这种多态性之所以平衡是因为杂合的个体比同型结合的个体有更好的适应能力。杂合优势在比方说镰状细胞或疟疾防御中都会出现。也有一些等位基因在它们数量稀少的时候起到积极的效果,而其优势会随着数量增长而减弱,最终起负面影响(这称作频率依赖型选择)。其中一些最有趣的例子包括了可被博弈理论分析的行为。
一个有名的例子就是鹰鸽博弈,其中一些个体在遗传学层面上更具攻击性,而另一些则比较倾向和平。当鹰数量较少时,它们可以轻易击败鸽子并具有更高的适应性。而当它们数量多起来时,它们比较容易遭遇自己的同类,常常两败俱伤,适应性就降低了。在一定的数量比例时,鹰和鸽子的适应性是相同的,达到平衡的多态性。[5]
平衡的行为多态性对新的选择压力反应迅速。如果原先的数量比例是50%的鸽子和50%的鹰,那么当环境变化,攻击性行为的成本升高的时候,比例也会随之改变:比如说变成70%的鸽子和30%的鹰。这类演化变化是非常迅速的,特别是与新的选择性清除基因的演化变化过程相比,后者的出现本来就很罕见,并且要花上数千年才能达到20%或以上的数量比例。如果鸽子能得到5%的选择优势,那么数量比例从50%到70%可以在10代以内发生。
人类遗传变化在农业到来之前相当局限,部分是因为彼时人口数量少,同时也因为这些遗传改变没有用;许多被农业人口青睐的遗传改变事实上对他们的狩猎兼采集者祖先来说都是有害的。这意味着一些在农民身上有积极影响的等位基因在他们的狩猎兼采集者祖先们身上是极其罕见或不存在的。比如说,减低部分功能的G6PD(葡萄糖—6—磷酸脱氢酶)基因的变体,它可以抵御恶性疟疾,但也有负面影响,尤其是对人类。如今这些G6PD基因的变体在疟疾盛行的区域有净正效应,在许多人类群体中也变得很常见。而当恶性疟疾传播以前,这些变体很可能在所有人类群体中起净负适应,所以会极为罕有。
所以,新的变异很可能在人类对农业的演化回应中起到主要的作用;而幸运的是,由于人口随着农业的到来而增长,大致在农业出现的时段这些变异的供应也大大增加了。我们不是说农业的到来从哪个深渊中召唤出了合适的变体,让人类适应事物的新秩序。变体是随机出现的,而且一如既往地,它们中的绝大部分含有中性或负面效应。但大的人类群体中有更多的变异出现,而其中一些是有利的。增长的人口带来了有利突变供应的增长,就如买更多的彩票会增加你的得奖概率。
大约5000年前有记录的历史开始的时候,新的适应性突变以巨快的速度出现,比在更新世时速度快了100倍。这说明了晚近人类进化在性质上不同于加诸于驯养动物上的人为选择。这是简单的规模问题。在人为选择实验中,通常只有不超过几十或几百个个体,所以很少出现有利突变,这就决定了选择必然主要依赖于原有的基因变化。在晚近人类演化中,大约有几百万到几亿个个体,他们全是潜在的变异者,所以大部分有利变体都是新的。
人们或许会觉得在农业条件下,已经很常见的等位基因比新的变体更容易成为高频出现的基因。该观点基于这样的理由:新变体最初只有单一的样本,所以会面对许多劣势。然而这样想就低估了这个变体对它的承载者以及承载者的后代所产生的有利影响。即便是一个有利基因的单一样本也有相当可观的机会可以流传下去(有5%进化优势的基因流传的概率是10%),它的指数增长更使它能够迅速传播。许多新变体出现在大的农业人口中,绝大部分的清扫基因一定都是新的。
农业出现后的人类演化过程不仅比人为选择实验涵盖了更高数量的个体,而且还跨越了更长的时段,它大约有400代,这个时间长度对于以哺乳动物为对象进行人为选择实验来说根本不可能达到。而且这样的长时间段也会促成质的变化,因为新的变异有足够长的时间成为高频出现的基因,并在适应性变化中起关键的作用。
近期研究中发现了数百个正在起作用的清扫基因,它们几千年前就开始起作用,如今仍在继续。有一些等位基因已经成了固定存在的基因,但更多的则以中等频率出现,而其中最多是在部分地区存在的基因。它们中的许多是晚近出现的:在欧洲和中国的样本中,这些清扫基因起源的高峰是大约5000年前,而在非洲样本中是大约8500年前。有如此之多的清扫基因,事实上我们都可以进行一些统计研究了。通常我们对一个基因的功能能够有所了解,比如说,看看它在哪些组织中有最高的表达率,或者是看看当它被抑制的时候会有什么后果。通过这些信息,我们可以着手研究数百个正在起作用的清扫基因,看看它们正在干什么样的活。而当我们进行这一类研究的时候,我们可以看到大部分这些执行清扫功能的等位基因可以归纳为几个功能组:许多影响新陈代谢的变化,抵御入侵的疾病,影响繁殖,影响DNA修复,或作用于中枢神经系统。