书城科普数学教学的趣味名人设计
12369100000013

第13章 数学名人的趣味故事推荐(10)

1934年任北京大学数学系助教,担任正在访问北京大学的美国哈佛大学教授奥斯古德的助教,前后共两年,奥斯古德在他后来出版的书中,提到了许宝騄的帮助。奥斯古德是分析方面的专家,在这两年内许宝騄做了大量的分析方面的习题,也开始了一些研究,1935年他发表了两篇论文,其中一篇是与江泽涵合作的,都是分析方面的论文。那时芬布尔和阿蒂肯合写的《标准矩阵论》已出版,许宝騄熟练地掌握了矩阵的工具,尤其精通分块演算的技巧。所以这两年内他在分析和代数两方面都打下了扎实的基础。

1936年许宝騄再次考取了赴英留学,派往伦敦大学学院,在统计系学习数理统计,攻读博士学位。1938年许宝騄共发表了3篇论文。当时伦敦大学规定数理统计方向要取得哲学博士的学位,必需寻找一个新的统计量,编制一张统计量的临界值表,而许宝騄因成绩优异,研究工作突出,第一个被破格用统计实习的口试来代替。

1938年他获得了哲学博士学位。同年,系主任内曼受聘去美国加州大学伯克利分校,他推荐将许宝騄提升为讲师,接替他在伦敦大学讲课。1939年,许宝騄又发表了两篇论文,1940年又发表了3篇。其中两篇文章是数理统计学科的重要文献,在多元统计分析和内曼-皮尔逊理论中是奠基性的工作,因此他获得了科学博士的学位。

抗日战争爆发后,他决定回国效劳,终于在1940年到昆明,在西南联合大学任教。钟开莱、王寿仁、徐利治等均是他的学生。在1945年秋,他应邀去美国加州大学伯克利分校和哥伦比亚大学任访问教授,各讲一个学期,学生中有安德森,莱曼等人。

1946年到北卡罗莱纳大学任教。一年后,他决心回国,谢绝了一些大学的聘任,回到北京大学任教授。1948年他当选为中央研究院院士。回国后不久就发现已患肺结核。他长期带病工作,教学科研一直未断,在矩阵论,概率论和数理统计方面发表了10余篇论文。1955年,他当选为中国科学院学部委员。

1963年发现肺部有空洞,他的结核菌已有抗药性时,组织屡次安排他休养,他均谢绝,并且一个人领导3个讨论班(平稳过程、马氏过程、数理统计),带领青年人搞科研。

他在20世纪60年代中期,对组合数学有浓厚的兴趣,1966年初,与段学复教授联合主持组合数学的讨论班,因“文化大革命”而被迫中断。然而他自己不顾条件如何,始终坚持科研,在1970年12月逝世时,他床边的小茶几上还放着一支钢笔和未完成的手稿。1983年,德国施普林格出版社刊印了《许宝騄全集》,全集是由钟开莱主编的,共收集了已发表的、未被发表的论文40篇。1980年与1990年秋,北京大学两次举办纪念会,并出版了《许宝騄文集》。

许宝騄在内曼工作

1936年到1940年,伦敦大学学院统计系正处于鼎盛时期,皮尔逊退休后,由费歇任高尔顿实验室主任,皮尔逊当系主任。一些学者陆续前来访问,包括美国的多元分析专家霍太林,威尔克斯,频率曲线专家克莱格,概率专家费勒。教师中有内曼这样的教授,所以许宝騄很快就接触到数理统计方面科学前沿的情况。

20世纪30年代到40年代,正是N.P.理论(内曼-皮尔逊理论)的形成时期。对于点估计和假设检验,首次提出优良性的概念。如果说,N.P.理论形成以前,数理统计的研究主要是寻求解决问题的方法的话,那么N.P.理论就明确地提出了应该寻求优良的方法,而优良性有客观的标准。

于是,马上就会提出的问题是:现有的一些方法如t、F检验等是否具有优良性呢?也就是要问,它们的功效函数是否在一定范围内就是最大的。1938年许宝騄导出了霍太林提出的T2检验在一定意义下是局部最优的,主要的困难是在零假设不成立时,如何导出T2的分布,通常称为非零分布,有了非零分布才能讨论功效函数的大小。他的这一工作在N.P.理论和多元统计分析中都是占有重要地位的先驱性工作。许宝騄的另一项重要工作是在1943年完成的,在讨论检验方法的优良性时,对于线性模型的线性假设,第一次证明了似然比检验的优良性,是对多参数假设检验第一个非局部优良性的工作,如用λ表示似然比检验非零分布中的非中心参数,他证明了:如果功效函数只依赖于λ,那么似然比检验就是一致最强的。

后来的研究发现这个条件等价于要求检验具有某一种不变性——这种不变性的要求是问题本身很自然的、合理的要求,因而就相当于证明了似然比检验是一致最强不变检验。莱曼在纪念许宝騄的文章中写了如下的这一段话来论述这篇论文的意义:

“这篇文章开创了两个发展方向。一方面,他的学生席玛卡将许的方法用于多元问题(霍太林的T2及多元相关系数)……另一方面,在这篇文章中,许提供了获得全部相似检验的新方法。在许的建议下,席玛卡和莱曼将这个方法用于其他问题,后来莱曼和谢飞形成了完备性的概念。”

这足以说明许宝騄在这一方面的工作对后来的研究有多大的影响。

在参数估计方面,当时大部分人关心的是均值估计的优良性,寻找极小方差的无偏估计。1938年许在论文中第一个讨论线性模型中参数б2的优良估计问题。

在二次无偏的估计类中,如要求估计量的方差与期望值参数无关,他证明了通常的无偏估计S2具有一致最小方差的充分必要条件是4阶矩具有与正态相同的关系式(这一条件在现在的文献中称为准正态分布)。这个工作直到1952年,拉奥才从另一个角度——限定二次估计是非负的——重新讨论了这个问题,得出了另一种充分必要条件。到了70年代末期,方差分量的模型引起了统计界的广泛注意,许宝騄的工作是这个方向的起始点,而且他提出的方法仍然是处理更加复杂问题的有力工具,有的论文就用许氏模型这一名称来代表这类问题。

此外许宝騄在寻求统计量的极限分布,在次序统计量的极限律型方面,都有重要的贡献。在1949年的一篇论文中,他考虑了样本均值ū1……ūk的函数f(ū1……ūk),利用泰勒展开,就可以用线性函数或二次函数去近似。并且用许多例子说明,当零假设成立时,线性部分依概率收敛于零,极限分布是正态变量二次型的分布,在很多情况下,正好是x2分布;当零假设不成立时,线性部分是主要的,因此极限分布是正态。在这篇长达40多页的论文中,他给出了许多统计量(尤其是多元分析中常见的)的渐近分布。

20世纪60年代初,许宝騄领导了一个讨论班,带动一批学生用类似的方法,获得了次序统计量的各种情况下的极限律型,无论是单项的还是多项的,是固定名次的边项还是非固定名次的边项,是正则的还是非正则的中项,发表了几篇论文。这些文章都是用笔名或他的学生的名义发表的,而基本的方法和思想都是他提出的。

许宝騄的统计分析工作

安德森在纪念许宝騄的一文中,一开始就写道:

“从1938年到1945年,许所发表的论文处于多元分析数学理论发展的前沿……1945年后,他在哥伦比亚大学和北卡罗莱纳大学讲授多元分析,在那里他培养学生从事这一领域的研究。如同一个有高度素养的数学家那样,许推进了矩阵论在统计理论中的作用,同时也证明了有关矩阵的一些新的定理。”

这一段话对许的工作给出了明确的评价,也阐明了其研究工作的特色。多元统计分析中,相当于一元统计中x2分布的是正态总体样本协差阵的分布。

维希特在1928年导出这一分布时,用的是几何方法,证明中依赖于一些直觉的结论。这一工作被认为是多元分析历史的开始。如果能给出一个严格而清晰的证明,这在理论上是重要的。许宝騄解决了这一困难,他把矩阵演算融合于分析的积分计算之中,给出了一个漂亮的证明,得到了一个一般性的积分公式:当n≥p≥1时,有使用这一公式,只需在左端用正态密度及样本协差阵的函数代替函数f(.),右端就给出样本协差阵函数的期望值,从而导出相应的分布。这一公式现已称为许氏公式。从这个公式很方便导出着名的巴特莱脱分解。

多元统计分析中不少统计量都是与随机矩阵的特征根相联系的。20世纪30年代末,着名的统计学家费歇,劳(Roy),格尔希克等,都在寻求正态总体样本协差阵特征根的联合分布,许宝騄也参与了这一竞争,他们几乎同时都获得了预期的结果,各人的方法不同,以许宝騄的分析方法最漂亮,他用矩阵微分这一工具,严格而清晰地导出了联合分布。20年后,安德森在他的书中,专列一章,详细介绍这一工作,并说明这些复杂的雅可比行列式的计算主要是许宝騄的功绩。

后来,他在北卡罗莱纳大学讲课时使这一方法更为系统,技巧也更成熟。1951年,由当时听课的学生第默尔和奥肯根据笔记整理发表在《Biometrika》上。

许宝騄在学术研究上,一直是知难而进,积极参与重大问题的探讨,他力求问题的彻底解决。例如非中心维希特分布的随机矩阵W的全部特征根,它们的联合分布是很困难的,从大样理论来看,求得渐近分布就可处理实际问题,而极限情况依赖于总体的协差阵Σ和非中心参数阵φ,这些特征根的联合分布仅依赖于|φ-λΣ|=0的这些相对特征根λ1≥……≥λp≥0,这些λi可以是0,又可以是重根,他完美地处理了最一般的情况,这就充分显示了他在数学上的功力。

他不仅自己在多元分析方面有很多开创性的工作,他还培养了像安德森、奥肯等国际上多元分析学术带头人,所以许宝騄被公认为多元统计分析的奠基人之一。许宝騄的像片悬挂在斯坦福大学统计系的走廊上,与世界着名的统计学家并列。

许宝騄的概率论工作

许宝騄在伦敦大学学院攻读学位时,熟读了克拉美的《随机变量与概率分布》,掌握了特征函数的工具,所以他对极限理论很有兴趣。1947年他与罗宾斯合写的论文《全收敛和大数定律》,第一次引入全收敛的概念。

当时国际上在概率方面主要的兴趣是独立随机变量之和的极限分布,正在从古典的向近代结果转化。一些着名的概率论专家如科尔莫哥罗夫,辛钦,格涅坚科,莱维和费勒等人都在攻这难题。1947年,许宝騄已获得了主要的结果:每行独立的无限小随机变量三角阵列的行和,依分布收敛到一给定的无穷可分律的充分必要条件。

由于当时信息不通,他不知道别人的工作情况,当时他写信给钟开莱时说:“……我担心正在进行的工作会和别人相重……”后来,他知道了格涅坚科和科尔莫哥罗夫的工作,就没有再发表自己的研究。

实际上许的方法和俄国人还是不同的,许的方法更为直接。1968年,当格涅坚科和科尔莫哥罗夫合写的《独立随机变量之和的极限分布》英译本再版时,钟开莱用附录的方式第一次刊印了许宝騄的工作。然而许在生前并未看到这本书,他始终没有看到自己的这一部分工作的公开发表。

20世纪50年代中期,许宝騄对马尔可夫过程有相当的兴趣,他用纯分析的方法研究了跳过程转移概率函数的可微性,他曾做过一些马氏链的极限定理,但未发表,又因“大跃进”中断了讨论班。1959年以后,他的兴趣已转向组合设计。还应一提的是他于1945年完成的一篇论文。这篇文章第一次用特征函数方法来近似处理两个高度相关的随机变量的分布,给出了样本方差的渐近展开和余项的估计。这里的难点是要处理二维的分布,这是数理统计的问题,但方法和工具是概率论中常用的特征函数。这一工作在20世纪70年代以后引起了国际上许多深入的研究。

许宝騄晚年对组合数学的兴趣是由张里千三角方案的工作引起的。他感到可以把矩阵的方法系统地引入组合数学。从1961年起他就主持了一个试验设计讨论班,报告这一方面的工作,开展研究,用笔名班成在《数学进展》上发表的文章是这一讨论班的成果。文中用一条矩阵的引理,统一处理了υ=2的各种方案的唯一性和非唯一性(把张里千的结果包括在内)。后来在1966年初,他又在讨论班上系统报告了BIB的工作。

“文化大革命”中,他并未中断研究,当时看不到任何杂志,直到1970年,才允许他看杂志,那时他已瘫痪。在两个月内,他翻阅了1966年“文化大革命”以后的全部《数理统计纪事》,了解国际上的学术动态,写下了最后一篇关于BIB与编码的论文,并将这篇文章的手稿托付给段学复教授。

许宝騄的天赋很好,掌握外语的能力很强,中学时利用课余时间学习法语,两年后就能写短文与会话。除了课堂上学的英语外,他还自学了德语与俄语。