摘录&笔记
这篇书评可能有关键情节透露
对上负责与对上负责两种逻辑的冲突,是“欺上瞒下”、“上有政策、下有对策”现象的可能性。
>> 首先,从中央到地方,中国政府的作用和影响力非常强大。
>> 其次,与上述特征相关,企业和政府结成联盟,并分享共同利益。
>> 最后,中国长期的层级式家长统治(layered paternalism)传统不仅在家庭、血缘关系和社会网络中根深蒂固,而且延伸到工作单位和政府机构中。
四方的特征
>> 西方社会的演变建立在两大支柱的基础之上:一是作为唯一合法政治体制的民主制度;二是作为唯一可行经济体制的自由市场。
社会科学的三个原理,似乎有实践转向的倾向。
>> 我将这种独特性总结为三个原理,即变异性原理、社会分组原理和社会情境原理。
两种逻辑的类型,有没有普遍性的社会规律
>> 总体逻辑思维区别于类型逻辑思维,是社会科学与自然科学的本质区别。这一思维意味着社会科学研究应该以经验为基础、以量化为导向去概括总体变异的系统模式,而不是去追求“普适法则”。
真是如此吗,对贫富差距的再讨论。
>> 我对中国的社会不平等提出三点看法:中国社会的不平等很大程度上要归因于集体因素(如单位、城乡、区域等);中国传统的政治意识形态助长了以业绩为基础的不平等;中国人对不平等有较高的容忍度,认为不平等是国家经济发展不可避免的后果。
>> 自然科学的实证研究方法应当是在社会研究领域发现知识、论证知识的基础方法,所以社会学与社会哲学之间,有着本质性的区别。
◆ 方法篇
社会学研究具体的对象:
>> 现代社会学应当以研究变异为己任。
>> 定量工具不应用于发现可以描述或解释所有个体的行为的普遍规律;相反,定量分析概括组间(between-group)差异的实证模式,而暂时忽视组内(within-group)的个体差异
>> 如何才能避开统计至上主义的陷阱?Duncan提出了两种可能的途径:一是改进社会学的测量工具,二是专注于对社会过程以及揭示社会过程的研究设计进行概念化。
◆ 2 奥迪斯·邓肯的学术成就——社会科学中用于定量推理的人口学方法
>> 类型逻辑思维将偏离平均值的偏差视为“误差”,认为只有平均值才接近真实原因。
>> 在总体逻辑思维中,偏差是具有重要意义的现实存在。平均值只是总体的一种属性而已;变异则是另外一个同等重要的属性。
类型逻辑与总体逻辑的统计模式:
>> 高斯方法(类型逻辑思维):
观测数据=固定模型+测量误差
加尔顿方法(总体逻辑思维):
观测数据=系统差异(组间差异)+残余差异(组内差异)
>> 观测值是一系列围绕真实值的量,而统计量则是同一总体内的不同量
>> 路径分析旨在强调如何解释结果,而非提供寻找原因的方法”(Duncan, 1966: 1)
>> 最重要的是记载和理解现实中人口的实证形态。
人口学的方法
(1)以实证为基础。
(2)量化的,利用调查或人口普查,搜集数据的层次来自最小分析单位(通常是个人)。
(3)涉及回归技术的统计分析,强调实证的规律性,即组间差异,但并不一定要对其研究结果进行因果解释。
(4)要求研究者重视所研究的人口。最理想的选择是运用全国性(以人口为基础)的调查进行社会科学研究。布劳和邓肯(Blau and Duncan, 1967)的研究开创了这一新准则。
统计模型不太能够解释因果关系,显示的多是描述与相关。量化研究的目的在于加深认识,而未必是发现真理。
>> 社会科学的统计模型最终是简约形式而非结构形式。将结构解释强加于统计模型是危险的
>> 量化方法绝不应该成为发掘普遍规律,从而描述和解释所有个体行为的工具
>> 量化分析所能做的就是总结组间差异的实证形态,同时暂时忽略组内个人差异。社会科学家可以逐步将分析复杂化,从而增强我们对社会世界的理解。
>> 从模型的角度来讲,社会学家最感兴趣的似乎是归纳法,希望有可能通过数据分析“发现”正确的模型,尽管这个希望很渺茫
经济学的特征
>> 经济学家更坚信自己的理论,他们认为理论和模型相比,理论是优先考虑的信息
社会学与经济学的差异在哪里?
>> 首先,即使知道存在真正的潜在模型,个体的回答(态度或行为方面)也仍然具有不确定性。其次,潜在模型实际上会因总体中个体的不同而发生变化。
>> ①每个研究对象对每道测试题的回答是概率性的;②每道测试题的真实难度值对于任何一个研究对象而言都是恒定的;③每个研究对象对于所有测试题答对的趋势是一致的。
>> 以经验为基础、以量化为导向,并不探寻普适的法则。
>> 经济学家从错误的假设中正确地推理;而社会学家却从正确的假设中错误地推理。因此,他们成了两个无知的互补体。
再次提到:
◆ 3 社会科学研究的三个基本原理
>> 第一个原理叫变异性原理(Variability Principle)。变异性是社会科学研究的真正本质。我们不是研究类型的,而是研究变异和差异的。
>> 社会分组原理(Social Grouping Principle)。为什么要分组?因为社会分组可减少组内差异。
>> 社会分组只有根据社会结果(social outcomes)来分才会是有意义的。
>> 第三个原理是社会情境原理(Social Context Principle)。群体变异性的模式会随着社会情境(social context)的变化而变化,这种社会情境常常是由时间和空间来界定的。
量化研究的若干事项。现在有一种倾向是在大数据时代抽样似乎可以被取代,但回到抽样本身就是为了节约成本,一旦涉及到人力的使用,抽样还是比较经济的,更重要的事情是,在做研究、调查以前可以先看看抽样的效果,避免白忙一场。
>> (1)抽样很重要。因为我们只能讨论总体特征,我们不能讲个体,所以要抽样。
>> (2)描述性研究是很重要的。
>> (3)随机实验不能完全解决我们的问题。
>> (4)统计学虽然不完美,但却是社会科学刻画异质性唯一可靠的工具。
>> 没有定量的方法就没有科学的东西。
(5)只有当解释涉及所研究的总体时,统计结果才会有意义。
重要:我们只能研究原因的结果,不能研究结果的原因
>> (6)因果关系总是概率性的。比如吸烟会导致癌症,但并不是说每个人吸烟都会导致癌症。
>> (7)我们只能研究原因的结果(effects of causes),而不是结果的原因(causes of effects)。
>> 理论有两个要点:一个是对以前经验的总结概括,这是一个积累的过程
>> 另一个要点是,理论是一个逻辑的思维过程。
◆ 4 社会科学与自然科学的关系
知识、理论、方法。社会学的方法显然比社会学知识更加重要,这一点与历史学相反,历史侧重于描述,社会学侧重于分析。
>> 我认为社会学的核心并不是关于社会的知识,而是得到知识的手段和方法。
>> 社会学的学习是培养一种批判性的思维。
本体论
>> 本体论是研究世界本质的一个哲学分支,研究什么是世界的本质,什么是世界上最重要的东西。换句话说,哲学也好,科学也好,我们到底要研究什么。
李约瑟之问的一种回答
>> 因为科学是偶然产生的,科学的产生受到很多因素的影响;而技术是人人都需要的,要生存、要发展都需要技术。
being and becoming
>> 自然科学是以“发掘”本质的世界中的真理为最终目的,这也是其精华所在。而社会科学是以“了解”形成的世界为最终目的。
研究认知的局限性与可能性?
>> 认识论是探索人类知识的起源、本质、方法及局限的一个哲学分支。你到底能知道什么,你怎样认识世界,这是认识论的命题。
相关与因果
>> 而社会科学则不同,社会科学的关注点在于所有个案组成的总体的状况。
>> 统计上有两个东西很重要:一个是平均值,一个是差异。
>> 所以,相关与回归似乎是矛盾的。因为相关是讲前者对后者的影响,可能是一种因果关系;而回归是把这种关系往回拉,实际上是弱化这种关系。
>> 理论是知识的全部内容,理论应该超越事实,但它必须包含已知的信息。
不知道为什么自从我读布尔迪厄时,就经常看到人骂他。。。
>> 一个是吉登斯(Anthony Giddens),他写了一本关于美国社会分层的书,书里对美国分层的描述根本不符合美国社会的真实情况。第二个是研究文化社会学的一本书,书名为《心灵的习性》,该书认为社会参与性在降低,但这个结论是建立在猜想的基础上的。另外一个就是布尔迪厄(Pierre Bourdieu),他提出一个品位阶级差异理论。
◆ 5 因果推理
因果关系与相关关系:有关条件、相关条件、嵌套原因、回归与相关
>> 第一个是有关条件(relevance condition),就是你忽略的变量要能对因变量产生影响,也就是你忽略的变量要与结果有关系。第二个是相关条件(correlation condition),就是你忽略的变量要与主要的自变量相关。
>> 概率性的因果关系决定了我们只能做相对的平均值分析,做趋势的分析,而不能做绝对的分析
>> 概率性原因有两层含义:一个是有原因不一定有结果,比如子女多的家庭未必子女的受教育水平就低;另外一层含义是结果可以在没有某个原因的情况下发生
>> 第二个要讲的是嵌套原因,嵌套原因是必要条件而不是充分条件,这事实上是一个风险问题。
>> 第三个要讲的是相关和回归,它们是发现因果关系的工具,这个我在以后的讲座中还会着重讲。
◆ 6 研究设计和抽样理论的基础
分析单位的选择
>> 一般的研究设计是从分析单位讲起,再讲分析单位的层次问题,最后讲分析单位的总体和几种重要的分析单位。
>> 第一个分析单位是个体,个体在社会学中基本上是指个人。
>> 第二个分析单位是人群,人群作为分析单位时它的很多特征是由个人的特征汇总而成的,对人群的测量是通过对个体的测量汇总而来的
>> 第三个分析单位就是组织,组织不仅仅是个人的集合,它重在组织成员之间的关系
>> 第四个分析单位是社会艺术品,比如书籍、建筑、绘画等。
时间性的概念:历时性研究
>> 时间从方法论角度来讲是一种信息;从理论角度来讲是研究的对象。
>> 根据时间性,可以把研究设计分成两大类:一类是横向分析,另一类是纵向分析。
>> 纵向分析有助于推导因果关系,因为从纵向分析中你会很清楚地看到什么事情先发生,什么事情后发生。
>> 纵向分析有两种类型:一种是趋势分析(trend analysis),一种是追踪分析(longitudinal analysis)。
概念化与维度:
>> 概念化是建立并澄清概念的过程,也就是用语言和例子来说明一个概念,以获得一个准确的定义。
>> 维度是为了量化某个概念,为了对概念的总体(而不仅仅是部分)进行分类或区分,而从概念中分解出来的,可以被具体指标衡量的次级概念。
测度:
>> 测度的类型有四种:名义测度(nominal scale)、次序测度(ordinal scale)、间距测度(interval scale)和比率测度(ratio scale)。
>> 名义可以任意赋值,这些数字不代表任何数学意义
>> 一个是穷尽性,就是每个个体都必须归到其中一类;另一个是互斥性,就是一个个体不能归到两个或多个类别中。
>> 在次序测度中,赋值只是表示样本取值在一个维度上的排序位置
>> 间距测度假设数字间有相同的距离或间隔,间距测度的数据不仅表示排序位置,也表示数值
>> 名义测度只告诉你分类;次序测度不仅告诉你分类,还告诉你各个类型之间的排序;间距测度不仅告诉你分类、次序,还告诉你间距大小;而比率测度则既告诉你分类、排序、间距大小,还告诉你绝对零值。
大数据的时候,似乎只需要描述统计?不过总体的维度的非常复杂,不得不以数字来诠释。
>> 首先要知道我们做统计是迫不得已的,如果我们可以直接研究总体的话,就不需要样本,也就不需要统计了。
>> 样本统计量是可以计算出来的,通过样本统计量来估计总体参数就叫做统计推论(statistical inference)。统计推论是用来评价样本统计量的可靠性的一种方法。
抽样的方法:
>> 简单是指总体中每一个元素被抽到的概率是一样的;随机是指按机遇抽取样本;回置就是指抽中的元素要被重新放回总体。
>> 第二种抽样方法是系统抽样(systematic sampling)或叫等距抽样,步骤是先根据总体的规模和样本的规模计算抽样间距,然后对总体的所有元素进行排序,根据抽样间距把总体分成等距的若干部分,在第一个部分中随机抽取一个元素,然后按照抽样间距依次在每个部分中抽取一个元素,这些元素的集合就构成了样本。
>> 在对总体进行排列时,排列顺序不能与自然排列有关,否则抽出来的样本就不具有代表性。
抽样的注意点:
>> 一个是总体差异,这种差异是客观存在的;另一个是抽样差异,是在对样本进行选择时造成的差异。
>> 我们可以把总体差异分解成两部分,即组间差异(between-group variance)和组内差异(within-group variance)。组间差异是指各组平均值之间的差异
>> 组内差异是同一组中各元素相对于组平均值的差异
◆ 7 忽略变量偏误和生态学分析
伪相关、时间先后与因果关系、忽略变量与选择性偏误
>> 真正的因果关系是很难找到的,它有几个潜在的危险:一个是伪相关(spurious correlation);一个是表面上的时间顺序,不要以为知道了事情发生的前后顺序就能找到因果关系,发生在前面的不一定是原因,发生在后面的也不一定是结果;另外一个是忽略变量偏误(omitted-variable bias);最后一个是抽样选择性偏误(selection bias)。
>> 第四个是抽样选择性偏误。假如你所得到的样本对总体没有很好的代表性,就会造成抽样选择性偏误
>> 生态学谬误是这样一个错误,即你把高层次的信息、经验、发现应用到低层次的分析单位上。
>> 一个是忽略的变量要和因变量有关系,另一个是忽略的变量要与主要的自变量有关系
◆ 9 流动表比较研究的对数可积层面效应模型
>> 在用单一参数来检验垂直流动(vertical mobility)差异的研究中,为了比较流动表(mobility table),Yamaguchi(1987)提出了一个相当有用的模型,在本文中将该模型称为“统一层面效应模型”(uniform layer effect model)。该模型的特点是使用单一参数来描述不同流动表之间起源与终点关联的一致差异。在流动问题的比较研究中,统一层面效应模型因其简单与可解释性而具有相当的吸引力(Wong, 1990)。但是,该模型本身也存在某些不足:首先,该模型隐含的假设条件是,起源与终点的分类是经过正确排序的,并且起源、终点以及表格之间的三项交互是等间距的。其次,它缺乏Hauser(1978, 1979)的层次模型(levels model)[插图]所具有的灵活性。再次,它不适用于Goodman(1979)行列效应关联模型Ⅱ(RC模型)的比较,因为对于不同的列表将产生结构上截然不同的模型(Yamaguchi, 1987: 484)。
针对流动表的比较研究,我提出对数可积层面效应模型。
◆ 研究篇
以族裔的分层
>> 第一,普遍为人们所接受的是,种族代表了外貌特征的不同,而民族是根据文化标记,如民族起源、语言、宗教和饮食等方面来进行区分的;第二,种族对个人的生活机遇有着巨大的影响,而在当代美国,民族充其量只是一个可随意选择的特征;第三,个人选择种族身份的自由是很有限的,因为区分种族需要外界其他人的认同,而民族身份却不同,它可以由民族内部决定。
亚裔有什么新教伦理……许倬云说美国白人现在也没什么新教伦理了
>> 自20世纪60年代,亚裔在教育上获得的成功以及对工作的认真态度被大众媒体广为报道。亚裔的价值观被认为与美国的新教工作伦理是一致的。
亚裔比白人更倾向于主修科学、数学和工程,是天赋的差异还是社会条件的差异,比如相关的领域对待族裔更加宽容?人文教育领域亚裔不太容易进入?
>> 亚裔比白人更倾向于主修科学、数学和工程,不像白人更倾向于选择人文和教育领域。
>> 社会经济背景 社会经济解释强调了家庭社会经济资源在亚裔子女教育成功上所起的作用。
>> 能力 对亚裔较高学习成就的第二种解释集中在他们的能力上
>> 社区与身份 对亚裔教育成功的另一种解释考虑了社区层面的支持、鼓励以及学生可获得的信息,因为亚裔对受高等教育的期望值都很高
>> 关于教育的态度、价值观和信念 亚裔不同于白人的态度、价值观和信念可能源于亚洲文化或者移民的自身选择。
机遇的不平等与结果的不平等
>> 机遇的不平等 机遇不平等的观点和以上后两种解释很接近,它认为亚裔是以教育作为克服障碍、提高社会地位的手段。
>> 美国出生的亚裔男性中,38%与非亚裔女性结婚,而在美国出生的亚裔女性中则有49%与非亚裔男性结婚
亚裔人分布的特征,及其解释:
>> (1)历史原因。因为亚裔移民作为劳动力首先来到了加利福尼亚和夏威夷。(2)距离原因。夏威夷和西海岸比起其他地方离亚洲更近。
>> 一旦亚裔定居并建立起自己的社区,就开始吸引其他亚裔移民,特别是初来乍到者。
>> 亚裔的居住模式明显不同。他们生活在这个国家的不同地区,集中在夏威夷、加州,以及少数一些大城市区域。在城市里,他们也倾向于集中在能吸引其他亚裔的社区。亚裔的家庭观念强。他们的结婚率很高,离婚率很低,保持着传统习俗,比如世代同堂。·亚裔受教育水平很高。·自1950年以来,亚裔显著改善了他们的就业情况,比如收入和职业。
◆ 11 下乡给知青带来了好处吗?——对中国“文化大革命”期间城乡人口流动的社会后果的再评价
简而言之,下乡没有带来好处,知青的境况不太差的原因在于城市里的年轻人也没什么机会,而人类本身也有复原能力。
>> 因果关系的方向并不是从短期下乡到接受大学教育,而是接受大学教育导致短期下乡。
>> 毫无疑问,一部分原因要归结于没有下过乡的年轻人同样也缺乏生活机会。
>> 下乡没有带来持续的负面影响亦可以被视作人类复原能力的一个证明。
◆ 12 改革时期中国城市居民收入不平等的地区差异
差异形成的原因:让一部分人先富起来,与特区开放。
>> 但是以前的研究通常没有注意到的是,地区差距的扩大从一开始便是中央政府“蓄意”而为的。
>> 其一,中央政府认为“在偏远地区(如广东省)进行改革试验的危险性比在天津、上海等工业中心地带进行的危险性要小些”
>> 域内进行,万一失败了也不会引起整个国民经济的混乱。
其二,根据一贯做法,中国的改革者们希望树立几个工业改革的典型做示范,把政府资源和外资投入到有限的地区会大大加强这些示范成功的可能性。
>> 中国领导人已经在农村改革中认识到权力下放的价值,现在在工业改革的起步阶段加以运用,允许各地方政府运用各地的相对优势来“取长补短”
身份因素对收入的重要性。
>> 党员身份是决定收入的因素之一,这是对我们修正这一模型的有力支持
>> 党员身份与收入高低不见得有因果关系。党在发展党员时会挑选具有某些品质的个人,而这些品质可能会与工作效率有联系。
关于经济不平等的影响因素
>> 经济增长总是伴随着生产力的提高和技术的改进,因此往往为受教育程度高的人提供更多的机会。
>> 在经济增长快的城市中,人们有较高的收入是因为收入中奖金和补贴的比重较大。
>> 教育和工作经历的回报率,在经济增长快的城市中比在经济增长慢的城市中低
>> 尽管存在着商品和劳务的自由或半自由市场,劳动力市场却是几乎不存在的。
>> 与此相关的一个特点是产权模糊,这导致了如何分配名义上是全民所有制企业的利润的混乱
>> 集中体现经济改革的以奖金和补贴形式存在的额外收入比基本工资更不受市场的调节
◆ 13 市场回报、社会过程和“统计至上主义”
>> 只有对社会过程有实质性的理解,统计方法才能够产生富有成效的研究。
>> 在社会变革中,个人基于预期的结果来选择他受到的干预,而这些预期的结果在个体之间并不是相同的。
◆ 14 认识中国的不平等
不平等的原因与认识(社会的感受)
>> 第一,中国的不平等很大程度上可以归因于集体的因素,
>> 第二,中国传统的政治意识形态助长了以业绩为基础的不平等。此
>> 第三,可能是因为官方的宣传以及中国近年来自身的经历,有一种观点认为不平等是中国经济发展不可避免的后果和代价。
中国政府的特殊性:
>> 第一,在中国,政府的角色非常显著,从中央到地方,政府都是非常强的。
>> 第二,企业利益和政府利益是结合在一起的,也就是说,企业(商业)和政府(政治)在经济利益上是一致的,私人关系也是密切的
>> 第三,中国有多层次的家长式的管理传统。
收入差距的集体原因:
>> 在中国影响收入最重要的因素,不是个人因素,而是区域差异。
>> 中国的不平等程度是很大的,但中国的不平等主要是区域之间或群体之间的不平等
>> 与区域相似,单位也是产生、维护不平等的一个重要的中介集体力量。
中国的政治特征:
>> 第一个特征,中华帝国在理想的情况下是统一的,即一个天下只能有一个君主
>> 第二个特征,中华帝国地广人多,所以,它面临的最大的问题是管理。
>> 第三个特征,中国的文官官僚制
>> 第四个特征,除了皇帝,中国的贵族和权贵阶层是很不稳定的。
重要的差别,欧洲的长子继承制
>>中国重要的官僚不是世袭的,这和欧洲很不一样,欧洲的官职是可以由上一代传到下一代的。欧洲贵族的财产也只传给一个儿子——长子,所以他们的家族可以一直保持财富和影响力。
>> 第五个特征,在中国的政治体系里,意识形态的作用是非常强大的。
中国研究不能只看西方与苏联的脉络,而应该多重视历史
>> 更进一步讲,中国现在的政治体系在一定程度上是中国文化2000多年遗留下来的产物。
集权与动力
>一方面,地方官员是受中央政权指派和控制的,以后的提升也要靠中央的决定;另一方面,地方官员又必须为地方做事情,这样才有升迁的机会
唯上,为民的张力
>县一级以上的官员都由朝廷任命,所以官员的权力来自中央,而他们做事情主要又是为了下面。这是个矛盾,需要平衡,
中国不平等的特征:
>> 第一,中国的不平等在很大程度上是通过集体行为来实现的。因为有了集体作为产生不平等的机制,不平等的界限是结构性的而不是个人化的,不平等程度在日常生活中也得以淡化,这样不容易造成不满。
>> 第二,从意识形态来看,虽然中国有着很强的、要求平等对待的道德呼吁(Wu, 2009),但中国的传统文化实际上还是接受不平等的。条件是:这些不平等会给一般劳动人民带来实惠,并且一般的劳动人民有得到权贵地位的可能性,
>> 第三,有些中国民众认为经济发展本身可能会带来不平等:因为我们要发展,为了改进大家的生活,就很难避免不平等,所以,一些对不平等不满的人也能被动地和勉强地接受中国现在的不平等状况。
◆ 16 人口模型
>> “(人口学)是对人口规模、地域分布、人口构成和人口变迁以及这些变迁的要素的研究。”
◆ 词汇表
>> 方差分析(analysis of variance或ANOVA):主要研究变量分布的离散属性及其来源,用于两个及两个以上样本平均数差别的显著性检验。方差分析在统计中的重要作用在于:一方面它提供了一种分析与检验多个变量间复杂关系的重要方法;二是这种分析方法适用面广,可用于各种测量层次的自变量。根据自变量的个数,方差分析可分为一元方差分析、二元方差分析、三元方差分析,等等。
贝叶斯方
>> 贝叶斯统计(Bayesian statistics):是一种基于先验概率和不断积累的经验数据来推断未知量的概率的统计方法。是统计学的两个流派之一,另一个学派是经典统计学。经典统计学与贝叶斯统计学的主要区别在于它们对概率的理解不同。在经典统计推断中,概率定义为相对频率的极限、估计及检验在重复的样本下评估。在贝叶斯推断中,概率定义为个人对事件发生可能性的一种信念。
>> 分类变量(categorical variable):只能由有限的数值或者类别来衡量的变量称为分类变量,也叫做定性变量、属性变量(qualitative variable),比如性别、观点。这些定性变量也可以由随机变量来描述,比如男性和女性的数目,同意某政策人数的比例等等。
>> 中心极限定理(Central Limit Theorem):是一种统计理论,解释了为什么实际中遇到的许多随机变量近似服从于正态分布。设{Xn}为独立同分布随机变量序列,若E [Xk] =μ<∞, D [Xk] =σ2<∞, k=1, 2, …,则{Xn}满足中心极限定理,当n充分大时,。
>> 卡方检验(chi-square test):是一种统计假设检验方法,可用于列联表内两个分类变量之间关系的统计推断。已知总体均值μ0,检验总体方差σ2是否等于(或小于或大于)已知常数σ02。
>> 因变量(dependent variable):又称应变量或依变量,它是随着自变量的变化而变化的。即被试的反应变量,它是自变量造成的结果,是主试观察或测量的行为变量。
>> 生态学谬误(ecological fallacy):由于生态学研究是由情况不同的个体“集合”而成的群体为观察、分析单位,将汇总层次上的信息判断应用到组成这个汇总层次的低一级分析单位上而造成其研究结果与事实不相符。
>> 内生性偏误(endogeneity bias):由于变量的内在关联,因果关系可能倒置过来,从而产生的偏误。
>> F检验(F-test):是一种统计检验,两总体的平均值和方差未知,比较两总体方差。如果假设成立的话,被检验的统计量具有F分布。
>> 自变量(independent variable):在一项研究中被假定为原因的变量,能够预测其他变量的值,并且在数量或质量上可以改变。
>> 大数定律(Law of Large Numbers):在多次重复试验中,频率有越趋稳定的趋势。设{Xk, k=1, 2, …}为独立的随机变量序列,且有相同的数学期望μ,及方差σ2>0,则当n趋向于无穷大时,Xk的均值趋向于它的期望μ。
>> 最大似然估计法(maximum likelihood estimation):一种广泛的估计方法,通过最大化对数—似然函数来选择参数估计值。
>> 普通最小二乘法(ordinary least square, OLS):用来估计多元线性回归模型中的参数的一种方法。最小二乘估计值通过最小化残差的平方和得到。