Sir Ronald Aylmer Fisher(罗纳德.艾默尔.费舍尔先生)生于1890年,伦敦,东芬奇利。学成于英格兰剑桥大学,终其一生致力于统计学和基因学的研究。
费舍尔初出茅庐之时,小样本不被看重,尽管矩方法没有任何理论证明,仍被公认为是拟合任一频率分布的不二法门。费舍尔的女儿, Joan Fisher Box(琼.费舍尔.鲍克斯)作述如下(1978):
费舍尔另辟蹊径。在Bayesian(贝叶斯)公式中,后验分布由参数的先验分布和参数的任一概率乘积而得,这一概率由实测数据获得。后者即为Fisher所称的likelihood(似然性)。在他的第一篇数学论文中(刊于1912年),Fisher给出了学生氏分布公式的数学证明,证明了无需参照先验分布的前提下研究似然性的可能,表明籍由最大化似然性可使所获得的估计值具有所期望的性质。最大似然方法为已知形式的频率分布拟合问题提供了直接的解决方案,而无需引信任何假设。
Fisher在1914年给出相关函数的精确分布。 翌年又推导了其它分布,如回归系数、部分相关系数,和多重相关系数。他于1922年的论文“论理论统计学的数学基础”成为数学统计学发展的里程碑。文中,一致性、充分性、有效性、似然性等概念鱼贯而出,粉墨登场。他的女儿这样回忆:
他纠结于两个概念中,一个是hypothetical infinite population(假设无限总体)的定义,我们希望得到它的参数;另一个则是sample(样本),它的统计量是我们对参数值的估计…information(信息)首次成为技术词汇…他提出了样本中存在所谓amount of information(信息量),并认为统计学者的工作即要确保缩减数据中要将loss of information(信息量损失)达到最小。在1925年,费舍尔加工并扩展了1922年的成果。文中表明,在所有有效统计量中,由最大似然推导所得的统计量是信息损失渐近最小的。
琼称, 费舍尔是第一位冒险作出一般误差正态性假设的人,其结果就是在实用性上获得了较大进展,因为基于正态性假设的大多数结果对假设本身并不敏感。费舍尔还在tests of significance(显著性检验)和design of experiments(实验设计)方法做出了里程碑式的工作。对此琼的叙述恰如其分:
很难想象20世纪最初10年数学统计学的状态…整个领域如未曾探索的考古场地,其内在的结构很难由其表面堆积的砾石所察觉,这个领域的宝藏遍布文山书海之中…费舍尔发现了这个最本质的问题并肩负起求索的重任。在这个过程中,他定义了现代统计学的目的和范围,引入了许多重要的概念。
简言之,R. A. 费舍尔在20世纪前半叶的科学理论和方法发展中举足轻重,至今影响着研究领域中的每一个人。
上述引自Jerry M. Mendel所著的“Lessons in Esitmation Theory for Signal Processing, Communications, and Control”(pp. 85-86)。窃以为,最后一句评价疏于严谨,毕竟不管费舍尔怎样努力,总会有人这样回应:是这样吗?也许吧,不过至少我没感觉到他的东西有什么作用。—— 费舍尔先生天堂有知,请含笑面对彪悍的天朝学者们。我们生活在一个奇葩的职称研究时代。