《统计会犯错》的原文摘录

  • 通常来说,我们观测的是由于巧合或随机变化导致的差异,所以当观测差异大于随机产生的差异时,统计学家称之为“统计意义上的显著区别” (查看原文)
    [已注销] 2017-04-08 11:58:45
    —— 引自第1页
  • 译者注:p值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率。 (查看原文)
    [已注销] 2017-04-08 12:00:27
    —— 引自第3页
  • 简而言之,统计显著性不意味着任何实际意义的显著性。统计显著性并不会给出太多信息。一个统计显著性的区别可能只是噪声,或者体现了真实的影响,但是这一影响需要更多的数据才能确定。 (查看原文)
    [已注销] 2017-04-08 12:02:22
    —— 引自第4页
  • 没有数学工具可以判断假设是真是假; (查看原文)
    [已注销] 2017-04-08 12:02:22
    —— 引自第4页
  • 译者注:套套逻辑:是指一些言论,在任何情况下都不可能是错的。说的更严谨一些,套套逻辑不可能被想象为错。 (查看原文)
    [已注销] 2017-04-08 12:02:22
    —— 引自第4页
  • 假设运气是实验中的唯一因素,p值是获得结果等于或者大于观测值的概率。这就意味着p值迫使你去质疑从未发生过的结果--也就是比你的结果更极端的结果。获得这样的结果的概率有赖于实验设计,这使p值具有“心理暗示特征”:两种不同的实验设计可以产生相同的观测数据,但会得到不同的p值,因为为观测的数据是不同的。 (查看原文)
    [已注销] 2017-04-08 12:06:28
    —— 引自第5页
  • 在科学研究中,控制假设检验的两类错误至关重要的:第一类错误(false positives):就是将无效说成有效(取伪);第二类错误(false negatives):则是将有效判断成无效(弃真)。 (查看原文)
    [已注销] 2017-04-08 12:09:57
    —— 引自第6页
  • 奈曼和皮尔逊发现虽然不能同时完全消除两类错误,但是可以给出一种规范的决策过程来确保犯第一类错误的可能性只在预先确定的比率下发生。他们将这个比率成为显著性水平alpha(false positives rate)。 (查看原文)
    [已注销] 2017-04-08 12:09:57
    —— 引自第6页
  • 为了比较哪种检验过程是最好的,我们可以考察给定alpha的情况下,哪一种检验过程犯第二类错误的比率是最低的。 (查看原文)
    [已注销] 2017-04-08 12:09:57
    —— 引自第6页
  • 这种解释存在问题。仅仅通过一次试验不能得到第一类错误率。它是由检验过程决定的,而不是由一次试验的结果得出的。所以当你用一个检验过程来获得一个长期的第一类错误率alpha,不管结果是怎么样的,你都不能说每一次试验都会有一个真实的p值和对应的第一类错误率。 (查看原文)
    [已注销] 2017-04-08 12:18:15
    —— 引自第8页
  • 有三种因素可以影响检验的功效。 偏差大小。一枚硬币越不均匀,越容易被检测出来。 样本容量。如果收集足够多的样本,那么即使是细微的偏差也可以检测出来。 测量误差。在上面的例子,你能非常容易地数出正面向上的次数,但有一些试验的指标测量非常困难,如医学研究中的疲劳感和沮丧感。 (查看原文)
    [已注销] 2017-04-08 12:26:21
    —— 引自第14页
  • 如果一个试验不能有效地识别出某种效应,那么我们就说这个试验低功效。 (查看原文)
    [已注销] 2017-04-08 12:31:00
    —— 引自第16页
  • 为什么我们经常忽视功效计算?原因之一是样本大小和功效结果给我们的直观感受不一样。 (查看原文)
    [已注销] 2017-04-08 12:33:31
    —— 引自第18页
  • 因为小规模、低功效研究的结果变异性很大,所以产生了真理膨胀的问题。 (查看原文)
    [已注销] 2017-04-08 12:40:57
    —— 引自第25页
  • * 请铭记“统计上不显著”并非以为着“0”。即使你的结果是不显著的,该结果也代表基于你所收集的数据所得到的估计。“不显著”与“不存在”并不等价。 * 请使用置信区间作为最后的答案,不要过分关注统计上的显著性。 * 当比较规模不同的组时,请计算置信区间。置信区间可以反映估计的精确程度:规模较大的组置信区间窄,估计更精确。 (查看原文)
    [已注销] 2017-04-08 12:45:50
    —— 引自第29页
  • 这是因为,随机分配可以避免研究者在试验组和对照组之间引入系统偏差。 (查看原文)
    [已注销] 2017-04-08 12:49:03
    —— 引自第31页
  • 设计试验时注意消除变量之间相关性。如果不能,最好记录混杂因素,然后在统计上进行调整。但如果从试验一开始就不考虑相关性,最后进行分析时可能发现数据已经无可救药。 (查看原文)
    [已注销] 2017-04-08 12:56:27
    —— 引自第40页
  • 但正如上文所述,单个变量通过显著性检验并不足以说民该变量较其他变量有更大的影响。 (查看原文)
    [已注销] 2017-04-08 17:19:51
    —— 引自第65页
  • * 用统计方法直接在两试验组之间做检验,而不要将各个试验组分别与对照组比较后简单地说:“与对照组相比这个是显著的而另一个不是。” * 不要单靠眼睛观察置信区间来判别试验效果之间是否有显著差异,要用统计检验。 * 如果要同时对比多个组,需要使用多重比较的方法。 (查看原文)
    [已注销] 2017-04-08 17:25:08
    —— 引自第70页
  • 一定要小心可能引起误导或者背道而驰的结果的混杂变量,就像在辛普森悖论中一样,无论何时,尽量使用随机分配消除它们。 (查看原文)
    [已注销] 2017-04-08 17:51:21
    —— 引自第103页
<前页 1 2 后页>