19世纪90年代 K·皮尔逊 Karl Pearson 统计模型 《科学的法则》The Grammar of Science
数理统计 美国国家标准局 the U.S. National Burean of Standards 邱吉尔·艾森哈特 Churchill Eisenhart
伦敦大学学院 University College, London 卡尔·马克思 维多利亚时代的英国
「P18」K·皮尔逊的主要兴趣还是在科学哲学和数学模型的性质上。19世纪80年代,他发表了《科学的法则》(The Grammar of Science)……它被视为关于科学和数学性质最伟大的著作之一,其中充满了闪光的、原创性的、最具洞察力的见解,这使该书成为科学哲学的一本重要著作。同时,它又是以流畅、简单的风格写成,任何人都可以接受,你不必懂得数学就可以理解《科学的法则》。引自 第2章 偏斜分布
英国 弗朗西斯·高尔顿 Francis Galton 高尔顿标识 Galton Marks 天才遗传研究
生物统计实验室 biometrical laboratory 生物学 数字模型
弟子K·皮尔逊 偏斜分布 Skew Distribution 参数 Parameters 平均数 The mean 标准差 The Standard Deviation 对称性 Symmetry 峰度 Kurtosis
|| 抛开已有的科学成见:科学就是测量,我们精心测量,并用它来寻找描述自然的数学公式。「P20」请别再相信,实验结果是精心测量出的数据。「P21」
|| 事实上,所有的实验都是草率的「P21」,并不真实,只是一种随机的映像「P23」。并且,即使是最精心的科学家,也很少得到确切的数值。我们从一个实验中得到的是散乱的数据,或者说是一组散布数据,一个数据分布中的样本。其中没有任何单个数据是确切的,但这些数据可以用来近似估计出确切值。「P21」类「P21-1」
|| 观测值固有随机性,大自然固有随机性。但过去18和19世纪,天文学家和物理学家认为观察值和预测值之间的误差是预料之中的,可忽略不计。认为其不确定性是由于简陋的测量工具造成的,并不是其固有的性质。
达尔文 进化论 适者生存 Survival of the Fitest 新物种出现 举例并不是证明 For Instance Is No Proof
《生物统计》 Biometrika “学生”的“t检验” 德国国家社会主义 the National Socialists 纳粹 Nazis 犹太种族 Jewish race 亚利安种族 Aryan race 拟合优度检验 Goodness of Fit test
|| K·皮尔逊给各种问题以复杂的数学解释。
「P28」K·皮尔逊运用数学研究了人类思想的许多领域,而很少有人将这些领域视为科学的正宗地盘。浏览生物统计上他所写的社论,你仿佛看到了一个兴趣十分广泛的人,他具有直切问题核心的惊人能力,并能用数学模型去加以处理。还有浏览这些社论,你就像遇上一个意志坚定、主见鲜明的人。
「P28」K·皮尔逊从这些工作中发展了一种被称为“拟合优度检验”(Goodness of Fit test)的基本统计工具,这是现代科学所不可缺少的。它使科学家能够确定一组给定的观测值是否适合于某一特定的数学分布函数。在第10章我们会看到,K·皮尔逊的儿子E·皮尔逊(Eqon Pearson),是如何用这种拟合度检验否定他父亲所完成的许多项工作的。
「P29」K·皮尔逊的革命所留下来的是这样一个观念:科学的对象并不是不可观测事物本身,而是数学分布函数,以描述与所观测事物相联系的概率。
「P30」有的科学家宣称,概率分布的使用只是一时的权宜之计,最终我们会找到一种途径回到19世纪科学的决定论。爱因斯坦有句名言,他不相信上帝在和宇宙玩骰子,就是这种观点的例子……不管一个人的基本哲学是什么,事实仍然是,K·皮尔逊关于分布函数和参数的思想统治了20世纪的科学,并在21世纪初仍保持着优势。引自 第2章 偏斜分布