友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
一世书城 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

女士品茶-第7章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



这种观念出发,费歇尔将格雷戈尔?门德尔 的工作大大地推进了,他指出如何估计两个相信基因的彼此影响。
存在着控制生命性质的基因,这一观念是科学中广义统计革命的一个部分。我们观察植物和动物的我,专业上称之为“表型”(phenotypes)。但我们假设这些表形是基因之间交互作用的结果,而这些基因的交互作用又具有不同的概率。我们寻求以这些主要的和不可见的基因方式,来描述“表型”的分布。在20世纪后期,生物学家识别出这些基因,以确定它们让细胞制造什么样的蛋白质,我们说起这类事就像真的一样,但我们所观察到的还只是概率的分布,我们所说的基因,即DNA链,正是来自于这些分布。
我们这本书说的是总的统计革命,费歇尔在这场革命中起了很重要的作用。他对自己作为遗传学家所取得的成就感到自豪,他的一半以上的成果是与遗传学有关的。现在,我们不再把费歇尔当作一个遗传学家,而主要看他在一般统计技术和观念方面取得的进展。这些观念的萌芽在他的早期作品中就可以发现,但这些观念的全面发展,却是他在工作期间的事,那发生在20世纪20年代到30年代。

《研究工作者的统计方法》
虽然费歇尔在这段时间被数学界忽视了,但他所发表的论文和著作极大地影响了农学和生物学界科学家的工作。在1925年,《研究工作者的统计方法》(Statistical Methods for Research Workers)第一版面世。之后,这本书仅英文版就出了14个,此外,还有法文、德文、意大利文、西班牙文和俄文的译本。
《研究工作者的统计方法》与这之前的数学著作不同,通常数学著作都有许多定理及其证明,并展开抽象的概念将之一般化,与其它抽象概念联系。如果说这类书中有什么应用的话,也只是放在完整的数学描述和证明之后。《研究工作者的统计方法》从如何利用数据制图及如何读图开始,第3页就出现了第一个实例,展示一个婴儿生命头13周每一周的重量,这个婴儿就是费歇尔自己的头生子——乔治(Gee)。接下来的各章描述如何分析数据:费歇尔给出一些公式,列举一些实例,解读这些例子的结果,然后再转到其它公式。书中没有对公式的数学推导和证明,却带有详细的技术说明,并交待如何在机械计算器上应用它们。
尽管,或者说正是因为缺少理论数学,这本书迅速地被科学界采用。它顺应了现实需求,可以把这本书直接交给只受过有限的数学教育的实验室的技工,让他们自己应用。使用这本书的科学家认为费歇尔的主张是正确的,而评论这本书的数学家则对书中未加证明的大胆论述持怀疑态度,许多人弄不明白他是怎么得出这些结论的。
第二次世界大战期间,瑞典的数学家哈拉尔德?克拉美(Harald Cramér)被战争隔绝于国际科学界外,他花了相当多的时间来费歇尔的这本书和所发表的论文,补充了原来缺失的证明步骤,并推导出原来没有的证明。1945年,克拉美出版了一本书,书名叫作《统计的数学方法》(Mathematical Methods of Statistics),对费歇尔的许多著述给出了正式的证明。不过,克拉美只能对这位多产天才的论述进行选择性的证明,费歇尔的很多著述在克拉美的书中都没有包括进去。克拉美的书被用来教授新一代数学家和统计学家,他把费歇尔著述的“修注”编写成一个标准范式。在20世纪70年代,耶鲁大学(Yale University)的L?J?萨维奇(Savage)阅读了费歇尔最初的论文,发现里面有很多东西都被克拉美遗漏了。他还惊讶地看到,费歇尔对后人的工作早有预见,并且已经解决了在20世纪70年代被认为还没有解决的问题。
但所有这些对1919年的费歇尔来说都是未来的事情,当时他正打算放弃不成功的学校老师职业。实际上他刚刚完成一项里程碑意义的工作:将高尔顿的相关系数与门德尔遗传学的基因理论结合在一起。但皇家统计学会和K?皮尔逊的《生物统计》都拒绝刊登这篇论文。费歇尔听说爱丁堡皇家学会正在寻找适于他们的《交流》(Transaction)上发表的论文,但期望由作者本人支付印刷成本,就这样,费歇尔自费将自己第二项伟大的成果交给这样一个当时并不起眼的期刊发表。
在当时,K?皮尔逊仍对年轻的费歇尔印象很深,他想聘请费歇尔到高尔顿生物统计实验室担任首席统计师,两个人之间的通讯来往是诚恳的,但对费歇尔来说,K?皮尔逊显然是一个主观意志很强并有支配欲的人,所谓首席统计师,充其量不过是在K?皮尔逊的指令下,从事细节的计算工作。

罗森斯特实验站与农业实验
当时,罗森斯特农业实验站(Rothamsted Agricultural Experimental Station)的所长约翰?罗素(John Russell)爵士也与费歇尔取得了联系。这个实验站是由一个英国的肥料制造商在一个旧农场里建立的。这个旧农场曾属于该肥料公司原来的主人。农场的粘土并不特别适于种植什么作物,但主人发现了如何将石头磨碎与酸混合,生产一种被称作“过磷酸石灰”(SuperPhosphate)的肥料的方法。从过磷酸石灰生产得到的利润用来建立一个实验站,以开发新的人工肥料。90年下来,这个站进行了许多实验,测试无机盐肥料与不同品第的小麦、黑麦、大麦和马铃薯的不同组合。这积累了一大仓库的数据,有雨量和温度准确的日记录、施肥追肥和土壤测量的周记录、收成的年度记录。所有这些都保存在皮面笔记本中。大多数这样的实验没有产生一致的结果,但这些笔记本被小心地存放在实验站的档案室中。
罗素先生看着积累下来这么多资料,想到也许应该雇个人来看看里边有什么东西,对这些资料进行一次统计整理。他四处询问,有的人推荐了费歇尔。罗素跟费歇尔签了一年的合同,给出了1000英磅的酬劳,他只能出这么多了,而且不能保证第二年续聘。
费歇尔接受了罗素的聘任,带着妻子、小姨子和三个孩子来到了伦敦北部的农区。他们租下了实验站旁边的一间农舍,妻子和小姨子打算在那里种种菜园,操持家务,而费歇尔则空上靴子,穿行在农业实验站的田间和90年的数据中,做起他后来称之为“在垃圾堆中寻觅”的工作。
第5章 收成变动研究
在我担任生物统计学家不久,一次去康涅狄格大学与休?史密斯教授讨论我所遇到的问题,他给了我一份礼物,那是一篇论文的复印件。论文有53页长,题目是《作物收成变动研究Ⅲ:降雨量对罗森斯特小麦收成的影响》(Studies in Crop Variation。 Ⅲ。 The Influence of Rainfall on the Yield of Wheat at Rothamted)。这是一组杰出的数学论文的第三篇,其第一篇1921年发表在《农业科学期刊》第11郑上。产量变化是实验科学家的大忌,但却是统计方法研究的基本素材。在现代科学文献中,“变动”(variation)这个词已经很少被用到了,它已经被其它术语代替,比方说“方差”(variance),这个术语与特定的参数分布有关。“变动”对一般的科学用途来说过于含混,但对费歇尔而言,却是合适的,作物产量在年份之间、地块之间的这种变动,正是作者研究的起点,借此,他可以推导出新的分析。
大多数科学论文在结尾都有参考文献目录,一个长长的单子,以确认对所讨论问题曾经有过建树的论文。费歇尔系列论文的第一篇却只有三篇参考文献:其一,指明了1907年一次不成功的尝试,打算探讨降雨量与小麦生长的相关性;其二,1909年以德文写成的,描述了一种计算复杂数学公式最小值的方法;其三,是由K?皮尔逊发表的一组数表。先前没有什么论文涉足过这一杰出研究系列所涵盖的题目。《作物收成变动研究》是自成一格的,署名的地方写着:罗纳德?A?费歇尔,文学硕士,罗森斯特农业实验站统计实验室,哈盆登(Harpenden)。
1950年,出版商约翰?威利(John Wiley)征求费歇尔的意见,看他是否愿意从所发表的论文中挑选一些最重要的,好单独形成一本文集。后来这本文集的名称叫做《对数理统计的贡献》(Contributions to Mathematical Statistics)。一打开书,就是费歇尔当时的照片,他一头白发,双唇紧闭,领带稍微有点斜,白胡子梳理得不大好,书中标明费歇尔当时在剑桥大学遗传学系工作。《作物收成变动研究Ⅰ》是该文集中的第一篇文章,作者在文章前面加了一个序言,以明确该文的重要性及其在他全部成果中的地位:
早期在罗森斯特的工作中,作者对研究站多年积累下来的大量观察数据,如天气、收成、收成分析等,给予了极大的关注。气象记录在多大程度上能够提供来年收成的预测?对于这类问题,上述数据是有独特价值的。现在这篇文章是用于此目的的系列研究的首篇。
这个系列研究最多有6篇论文,《作物收成变动研究Ⅱ》发表在1923年,而史密斯先生给我的那篇标号为“Ⅲ”,在1924年问世。《作物收成变动研究Ⅳ》则在1929年发表。标号为“Ⅴ”的论文没有出现在费歇尔的文集中。在科学史上还很少有这种事件:标题那么不起眼,而其内容却如此重要。在这些论文中,费歇尔开发了用于数据分析的原创性工具,建立了这些工具的数学基础,并描述了如何将它们应用到其它领域中去,包括如何应用到他在罗森斯特所遇到的“垃圾堆”上。这些论文表现了令人眩目的原创性,充满了奇妙的内涵,这足够理论家们在20世纪余下来的日子里忙乎的,也许那之后还会继续激发更多的研究。

《作物收成变动研究Ⅰ》
费歇尔系列研究的后两篇文章是有共同作者的,但《作物收成变动研究Ⅰ》却是他独立完成的,那需要大量的计算工作。他的唯一后援是一台名字叫“百万富翁”的计算器,那是一台原始的带有手摇曲柄的机械计算器。如果要算乘法,比方说算3342乘27;先要将转盘放在个位上,设定3342这个数字,摇动曲柄7次;再将转盘放在十位数上,设定3342这个数,摇动曲柄2次,计算方告结束。这架机械叫“百万富翁”,因为它的转盘大得足够容纳以百万计的数字。
为了体会到这篇论文所耗费的气力,我们来考虑一下《作物收成变动研究Ⅰ》中第123页的表7。如果完成一个多位数乘法需要1分钟,我估计费歇尔需要大概185个小时来完成这张表。这篇论文中有15张复杂程度相当的数表,还有4张更为复杂的图。只考虑体力劳动本身,准备这些图表至少需要耗去费歇尔8个月的时间,而且每天得工作12个小时!这还不包括其它工作所花费的时间。比方说:思考理论数学问题、整理数据、设计分析框架、修正不可避免的错误等等。

高尔顿回归思想的一般化
回顾一下高尔顿所发现的“向平均数回归”,他试图找到一个数学公式,将随机事件彼此联系在一起。费歇尔接过高尔顿“回归”(regression)这个词,建立了某个给定地块小麦收成与年份之间的一般数学关系,这个相当复杂分布的参数描述了小麦产量产业化的不同方面。要深入理解费歇尔的
返回目录 上一页 下一页 回到顶部 1 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!