首页 » 实验是如何终结的? » 实验是如何终结的?全文在线阅读

《实验是如何终结的?》鸭子、兔子与误差

关灯直达底部

20世纪早期实验物理学界的大事件可以说是非同寻常,表2.1和图2.15对此进行了概括。首先,在旋磁实验的尝试中,麦克斯韦一无所获。经典场论貌似无需物质载流子的概念,在几十年的时间里,该方面的重大成就使得所有种类的旋磁实验均遭到了淘汰。通过洛伦兹电子理论,物质流概念得到了复兴,英国物理学界对阴极射线的物质性也给予了强烈的关注。此时,理查森复苏了麦克斯韦的研究事业,但是仍然一无所获。在对这些研究并不知情的情况下,巴奈特开始着手研究逆效应:旋转铁棒时,较后来实验表明的、他“理应”发现的强度而言,检测到的磁场强度是其五倍以上。1915年,在阅读了理查森的论文并对自己的实验进行修正后,巴奈特得出的g值接近2.3,并对这一解释感到相当满意:原子中正离子绕轨旋转的方向与负电子的方向相反。但是,在结合了地心的未知情况后,他的主要结论却是:这一效应可能说明了地球自转是地磁产生的原因。

表2.1 旋磁实验结果汇总

图2.15 发表年份与g因子值的对比。实线描绘的是巴奈特研究结果的时间函数。爱因斯坦的理论预期值是g=1;后来的实验和理论给出的g值均约为2。

几乎与此同时,爱因斯坦和德哈斯一同进行了实验。爱因斯坦同巴奈特不同,他有充分理由确信g=1。陀螺仪曾经是重要的航海设备,是由绕轨电子形成的、假定的“原子陀螺仪”的完美模型,对其相关的专利工作爱因斯坦仍记忆犹新。此外,在帝国物理技术学会进行的磁学实验为洛伦兹的电动力学理论、朗之万对居里定律的解释、普朗克的零点能量猜想和安培的分子电流假说提供了实证机会。爱因斯坦和德哈斯构建了至少四组不同的实验装置后,最终貌似证实了这一理论:绕轨电子是导致永磁性的原因。他们确定的g值为1.02±0.10;在次年进行的二次定量系列实验中,德哈斯得到的g值为1.2。巴奈特明显受到了爱因斯坦理论和实验的影响,在重复了实验后,他获得的结论是对绕轨电子理论的证实:g值在1.4和1.1之间。

三名各自进行研究的实验家斯图尔特、贝克和阿维德森很快确定了g值不等于1。他们分别发表了各自的试验结果,值接近爱因斯坦的值的两倍。在数月后,巴奈特再次发表文章,肯定地表示他相信g值约为2。在随后的两年里,他改进了实验结果,摒弃了爱因斯坦的理论,转而接受了亚伯拉罕电子理论中的一种,用以解释自己的实验结论g=1.89。

与此同时,德哈斯了解到至少其他四位研究人员发现的g值是他得出的原始值的两倍左右,于是他在1921年重复进行了实验工作。在当年的索尔维物理学会议上,德哈斯报告中的g值为1.54,并表示自己认为g值仍然是一个开放性问题。随后,他又最后一次重复了该实验,实验的累积结果为g=1.08,与他在六年前同爱因斯坦获得的最初结果间的差距百分比较小。1922年,爱因斯坦在柏林也坚称g值仍为开放性问题。在这一时期,巴奈特夫妇进一步改善了实验方法,最终在1925年发表的重要论文中表示,g的平均值为1.929±0.006。最初,巴奈特依赖于兰德对塞曼效应光谱数据和旋转效应的结合。到了1933年,狄拉克理论广为人知,巴奈特连同广泛的物理学界均将他的研究结果归因于电子自旋与绕轨旋转间复杂的相互作用。

很明显,在决定结束这些各种各样的实验时,理论预期扮演了重要的角色。但是它是如何做到的?针对理论倾向对实验结果的影响方式而言,存在着许多更具影响力的解释,其中一种是由托马斯·库恩提出的。[1]他认为,测试新理论所需的测量值通常会在我们的实验能力范围内对现象造成影响。结果导致了随机误差相对于目标效应大小而言非常巨大。这为实验家和理论家保留了解释必然具有多重含义的研究结果的可能,并以此作为对自己首选理论的确证。若存在更为精确的测量技术,则这些完全相同的结果理应能够轻易证实相反的理论。

比如,库恩引用了皮埃尔·西蒙·德·拉普拉斯(Pierre Simon de Laplace)对空气中音速的预测。拉普拉斯算出的理论预测同弗朗索瓦·德拉罗什(FranÇois Delaroche)和克劳德路易斯·贝拉尔德(Claude-Louis Bérard)测出的实验参数间具有高度的一致性,在2.5%以内。目前的物理学观点认为,拉普拉斯热质论的应用范围中误差为40%;德拉罗什和贝拉尔德的测量值的误差相似,均与现代测量值间相差12%左右。库恩认为,实验与理论间的任何一致性均是由实验和理论间共有的不确定性导致的。在这类情况下,“对实证检验的选择和评价实际上就是偏好和判断的问题,是对理论的选择和评价”。[2]库恩又总结说,符合拉普拉斯理论的测量值,如德拉罗什和贝拉尔德等人的测量值,肯定也符合其他理论,“仅在‘几乎’一词形容下的实验普及范围内,自然才被证明为能够对测量者的理论倾向做出反应”。[3]

库恩的解释同他与汉森经常引用的可逆的格式塔意象图法十分相符。在观察者观看其中一张图片时,正因为观察者倾向于看见鸭子而非兔子,所以一定的纹路和曲线才具有了意义。那些与整体关联重要性不大的细节被错过或忽略了。库恩在探讨拉普拉斯时,也保留了一个异曲同工的类似情况:在开展的众多实验中,有的与理论一致,而有的相反。误差的来源多种多样,不确定性的扩展也十分广泛。当我们窥视着混乱的实验世界时,会发现理论家们或有理论倾向的实验家们可能倾向于获得可以证实其预期的数据,而非同其产生矛盾的数据。随着此类研究结果的传播,相矛盾的理论获得同样的“支持性”证据群组也就不足为奇了。

理论是如何影响实验结果的?笔者希望可以对此给出不同的解释,这一解释既非基于格式塔式的选择,亦非基于随机误差的广泛传播。对理论与实验间关系的理解是取决于对实验者工作中涉及的不同理论层面的理解,以及对各种将实验与理论元素联接起来的机制的分析。首先,具有决定性作用的是爱因斯坦和德哈斯的理论信仰:电流涡动由绕轨电子产生,这一信仰又转化为确切的量化预测。但需要注意的是并非所有理论层面都是相当的。爱因斯坦和德哈斯拥有一个量具,用以测量效应,这正是麦克斯韦明显不具备的。换言之,电子轨道详细模型的重要性远远不能与对电荷e和质量m的说明相提并论。这些说明由先前的实验延续下来,并通过这一一般性概念进行理论上的关联:若电荷与质量具有关联,则角动量与磁矩互成正比。在缺少e/m值一类量具的情况下,麦克斯韦感到十分茫然:他连可期待何种数量集效应都无从知晓,因此也无法计算出哪一背景效应具有重要性,无法预测出仪器倾斜测量的精确程度。

理论对实验的另一种影响是通过数学描述本身,施加的层面更为明确。毫无疑问,1917年巴奈特的理论预期之所以得以巩固(如同对德哈斯、贝克和阿维德森的支持一样),是源于对所写等式两边表示法的频繁切换:测定量L/M、与其理论上相等的量2m/e。由此,模型背后的理论假说暂时远离了视线,一个重要而又具有概念性不同的任务——提供新的荷质比值——走到了台前。简而言之,实验家们一直将旋磁实验视为荷质比研究,进而将安培涡动归入已有学科范畴。在这种思维定式之下,会认为旋磁比约为1也在预料之中。

在理论模型的细节层面上,爱因斯坦也表现出了对零点能量和原子结构的关注。鉴于这样的考量,爱因斯坦相信g值不仅数量级应当单一,而且应该只是1.0,而非2、4或1/2。此时困难就在于如何从实验中提取出较为精确的结果。这些操作的精确度较高,因此亟需谨记:在爱因斯坦与德哈斯的铁棒实验中,铁棒所反射光束的振荡移动是以毫米为单位的,巴奈特效应也依赖于约10-5高斯数量级的磁场。在具有难度的背景条件下,对精度的需求使得误差分析必不可少。若阻碍是来自随机误差,则应对步骤将清晰可见:查找并努力消除结果间的差量。但是,这一点之所以至关重要,还是因为系统性误差来源多样,若欲囊括标准偏差较大的指示器示踪,则平均值将较为分散。系统误差的影响范围较为狭窄。

让我们回到文字记录中来。在1921年索尔维会议相关的发表文章中,德哈斯这样写道:

我们一同获得的值与我自己获得的值之间差异较大,对此我必须说,这些实验的操作时间很短暂,我们已经尽量以无可辩驳的方式进行效应检测。对效应计算中所用的数值仅有大体的了解。因此我们没有测量磁化线圈的磁场,而是进行了计算;而且线圈的缠绕不是很整齐,并不是为了实验目的而制作的。我们也没有测量铁棒磁化作用,仅仅进行了估算……在我们看来这些初步结果十分令人满意,我们将最佳g值认作1.02也是很容易理解的。[4]

这些误差并不会导致结果的传播,地球磁场不完全中和相关的各种背景也不会导致其传播。事实上在1915年,爱因斯坦和德哈斯给出的概率误差为10%,即他们的结果与g值2间具有10个标准差。g值的差异由系统性误差引起的可能性更大,这与德哈斯报告的内容是完全一致的。通过对贝克测出的饱和磁化量记录的一瞥,我们可以发现他得出的数值比爱因斯坦和德哈斯的“估算值”要高出27%。这会使他们的g值获得相应的提高。[5]

系统性误差方面的解释并不会使我们依赖于格式塔图像或词义的全局性变化。巴奈特后来也对g值1这一判断进行了认真的思考:

因为长久以来疑似存在的系统性误差……1917年使用磁力计进行观察时,获得的结果同1914、1915年通过电磁感应方法获得的结果大不相同,这一点现在已经得到了完全证实。[6]

在爱因斯坦和德哈斯最初的测量结果中,g值2超出了巴奈特1917年的数据范围(g=1.1至1.4)。巴奈特指出了其他的系统性误差,其中包括一些看似无关的因素,如外部经过的电车、地球磁场的不完全补偿以及旋转过程中铁棒的膨胀等。其中并未包括统计学传播的零散答案。

前文引用的德哈斯和巴奈特的话表明,实验者们对系统性误差带来的误区有清楚的认识。在这些实验及后两章中将探讨的许多其他实验中,此类误差的消除在一开始就是实验工作的首要目标。对于实验家们而言,背景控制并非无关紧要,它是活动本身的一大要素。

将背景由前景中分离开来,需要重要的规模机械——旋磁探索一类实验花费不多且改造简易。后文的第4章中将谈及20世纪末期的大质量粒子探测器,与此不同的是该世纪早期的实验家们可以通过构建方式,在误差来源出现时轻而易举地进行改造。通过铁棒周围缠绕线圈的物理学方式,德哈斯确保了螺线管和铁棒间的对齐;通过增加补偿线圈的数量,斯图尔特更彻底消除了地球磁场;为了频率测量这一唯一目的,贝克建立起与基本装置几乎完全相同的另一台设备;为了检测涡电流,巴奈特使用铜质转子取代了铁质转子。

因此,预算量、装置规格和复杂程度都具有重要性。所有这些旋磁实验都是在大学物理实验室或物理研究所进行的,如卡内基研究所或帝国物理技术学会等。通过技术工人的帮助,实验设备在楼下的店铺中就能建造。[7]爱因斯坦、德哈斯以及巴奈特的实验装置都可以与麦克斯韦的计划方案得到精准契合。巴奈特使用了电动机(能量来源)推动机械齿轮系(传导机制),进而使铁棒产生旋转(见图2.13)。铁棒自转后开始被磁化。其磁场可以通过磁力计或磁通计(测量仪表)进行检测。爱因斯坦和德哈斯的实验装置较为简单,包含一台发电机(能量来源)、导线(传导机制)以及在悬浮铁棒中产生振荡磁矩的线圈。当铁棒绕其中轴旋转时,通过铁棒上安装的镜子(测量仪表)反射光束,检测到了运动情况。

两次实验的主要装置部件小巧,可以安放在一张桌面上。1918年至1922年间,巴奈特使用的仪器和其他开销为平均每年3300美元(4100美元)。[8](本书中括号内的金额数字表示符合标准普尔指数的、1967年发行的美元标准币值;针对美元之外的货币,该数额表示首先换算为美元,而后升高为标准币值。)[9]此外,卡内基研究所的商铺工作人员及巴奈特实验室助手的同期薪酬为平均每年2310美元,共计每年6610美元(8300美元)。[10]

爱因斯坦与德哈斯的实验以及斯图尔特、贝克和阿维德森等物理学家的相关工作均可以运用与巴奈特曾使用的同一等级的机电设备。一般而言,磁化旋转研究的花销较巴奈特的研究花费稍少一些。磁化作用引起的旋转属于大型效应,观察设备所需花费较少。查询1918年的标准商品目录后可以发现,相对较好的发电机需要200美元(250美元),电流计、电流表、电压表等分别需要50美元(60美元)左右,电磁铁也需要几美元。[11]贝克使用了照相设备,爱因斯坦和德哈斯使用了谐振器来测量频率,而贝克自己使用导线和线圈制造了谐振仪器;所有这些实验家们需要花费约2000美元(2500美元)进行旋磁实验的配备,其中人工成本甚至等同于硬件设备的花销。20世纪初期,对于前文所指的麦克斯韦一派大多数实验而言,这样的花销是相当有代表性的。比如,高性能电磁铁约需(2000美元),高压蓄电池花费在(4000至5000美元)不等,大型感应线圈需要(400美元)以上,X射线管花费(10至40美元不等),精密的光谱仪也要花费约(1500美元)。[12]

花费相对较少的这些装置,实验者们在核查旧的实验过程时可以进行重新设计,更改单个元件,以及迅速构建心中所想的特定仪器。当仪器花费增加时,这些决定的做出将面临相当大的困难。为消除背景效应,实验者将从机械装置本身部分性地转移至数据的约简。


注释

[1] Kuhn,“Function,”Isis 52(1961):161-193.

[2] Kuhn,“Caloric Theory,”Isis 49(1958):140.

[3] Kuhn,Essential Tension(1977),200-201.

[4] De Haas,“Le moment,”Atomes(1923),212.

[5] 贝克的铁杆中至少有一根看上去在约为1599 cgs的单位体积下实现了饱和磁化,而爱因斯坦和德哈斯使用的样本在1260 cgs下实现了明确的饱和磁化。(阿维德森也报告了一次比爱因斯坦和德哈斯的更高程度的饱和磁化现象。)当然,也许贝克并没有使用完全相同的那一种合金,但是在通往正确方向的过程中,这个偏差至少可谓导致误差的一个重要原因。参见Beck,“Molekularströme,”Ann.Phys.60(1919):109-149.on 131.

[6] S.J.Barnett and L.J.H.Barnett,“Improved Experiments,”Phys.Rev.20(1922):90.

[7] 参见Palmer and Rice,Modern Physics Buildings(1961).在本世纪初,关于物理学的材料状态的最佳历史成果是收集了大量的信息。参见Forman,Heilbron,Weart,“Personnel,”Hist.Stud.Phys.Sci.5(1975):1-185;关于物理建筑物的建筑风格参见第104至114页。

[8] Smith and Fleming,“Barnett Expenses”(1922),BP.

[9] 兑换率非常低。一美元的购买力是标准和贫困形成的时间函数,参见Basic Statistics(1982),79;瑞士法郎和美元之间的兑换率参见World Alamanac(1964-1968).

[10] Smith and Fleming,“Barnett Expenses”(1922),BP.此外,地磁学部门建造了一个特别的建筑,便于巴奈特和其他人员可以使用敏感的磁设备进行工作。1922年的费用为35000美元(70000美元)。

[11] Central Scientific Co.,Laboratory Apparatus(1918),205ff.

[12] Forman et al.,“Personnel,Funding,and Productivity,”Hist.Stud.Phys.Sci.5(1975):88-89.