第246页
- 页码:第246页
在只有一个因素的方差分析(称为单因素方差分析)中,涉及到两个变量:一个是分类型自变量,一个是数值型的因变量。当我们研究分类型自变量对数值型因变量的影响时,所用的方法就是方差分析。例如,在上面的例子中,我们要研究”行业“对投诉次数是否有影响,这里的”行业“就是自变量,它是一个分类变量,零售业、旅游业、航空公司、家电制造业就是”行业“这个自变量的具体取值,这里称为”行业“这个因素的水平或处理。”投诉次数“是因变量,它是一个数值型变量。方差范希所要研究的问题就是分类型自变量对数值型因变量的影响。在我们的例子中,也就是研究”行业“对”投诉次数“的影响。 我们怎样判断行业对投诉次数是否有显著影响呢? 从散点图上可以看出,不同行业被投诉的次数是有明显差异的,而且即使是同一个行业,不同企业被投诉的次数也明显不同。但是,仅仅从散点图上观察还不能提供充分的证据证明不同行业被投诉的次数之间有显著差异,也许这种差异是由于抽样的随机性所造成的。因为我们需要有更准确的方法来检验这种差异是否显著,也就是方差分析。 方差分析是通过对数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有影响。因此,进行方差分析时,需要考察数据误差的来源。 首先,在同一行业(同一个总体)下,样本的各观测值是不同的。它们之间的差异可以看成是由随机因素的影响造成的,或者说是由于抽样的随机性造成的,我们称之为随机误差。 其次,在不同行业(不同总体)下,各观测值也不同。这种差异可能是由于抽样的随机性造成的,也可能是由于行业本身造成的,后者所形成的误差是由系统性因素造成的,我们称之体统误差。 组内误差只包括随机误差,而组间误差既包括随机误差,也包括系统误差。 因此,判断行业对投诉次数是否有显著影响这一问题,实际上也就是检验被投诉次数的差异主要是由于什么原因引起的。如果这种差异主要是系统误差,我们就说不同行业对投诉次数有显著影响。在方差范希的假定前提下,这一问题实际上也就是检验4个行业被投诉次数的均值是否相等的问题。 引自第246页
49人阅读
说明 · · · · · ·
表示其中内容是对原文的摘抄