第187页 4.8复习题
1.2x2列联表,从两总体中各抽取一个样本n1,n2,分别归入两类c1,c2。
T=√ ̄N(O11O22-O12O21)/√ ̄n1n2c1c2
用标准正太分布Z0.05和Z0.95检验。
2.从总体中抽取n个样本,其中有Y属于一类(剩下的属于其他类),这个问题就是有n样本其中Y属于关心类,那么总体中有p的比例属于关心类的95%置信区间是多少。
本题中我选用了Y=111(候选人B),由于n>30无法查表需要近似,则区间为
Y/N ± Z0.975 √ ̄Y(n-Y)/n^3,
最后得到大约是(0.51,0.59),即总体中投票给候选人B的比例p的95%置信区间,于是得出结论候选人B以95%置信率胜出。
3(1).有N个样本数据,分别属于r类(政党)和c类(大码合法化),检验统计量
T=∑∑(Oij-Eij)^2/Eij,其中Eij=RiCj/N,
服从自由度为(r-1)(c-1)的卡方分布。
3(2).基本同上,但是数据是连续型的需要划分区间。
3(3).首先把样本观测值次序尺度排列,得到样本中位数x*(p*=1/2),然后检验它是否为总体中位数,
统计量T1为观测值中小于等于x*的个数,T2为观测值中小于x*的个数,当n较小时使用二项分布检验,当n较大时近似适用标准正太分布。
t1=np+z0.05√ ̄np(1-p),
t2=np+z0.95√ ̄np(1-p)。
当T1<=t1或T2>t2,则拒绝x*为总体中位数,否则无法拒绝。
3(4).女生的比例就是估计一个p的置信区间,由数据得n=28,Y=5,同第2题的公式相同,求出
L=28/5-z0.975√ ̄5(28-5)/28^3,
U=28/5+z0.975√ ̄5(28-5)/28^3。
所以女生百分比的95%置信区间为[0.0369,0.3203]。
3(5)(6).都是非固定行列总和数据的分类类型独立性问题,解题方法参考(1)。
4(1).符号检验,(X1,Y1),……,(X10,Y10),同学与同学的成绩之间是相互独立的,(Xi,Yi)是内部相容的。+代表Yi>Xi,T=“+”的总个数,在表格中查询n=10(非结点个数),p=1/2的二项分布近似显著性水平的对应值即为t,当T<=t时,拒绝H0:P(+)>=P(-),即考试成绩显著大于平时成绩,否则接受。
【这题(在“同一个学生群体的平时成绩和考试成绩是两个独立总体”的前提下)其实可以用秩检验,检验考试成绩的分布函数是否显著大于平时成绩的分布函数。
但是这是3,4章复习题,所以也可以用中位数检验。先计算联合样本的总中位数,再用2x2列联表进行检验,
 ̄ ̄ ̄ ̄ ̄
| a | b | a+b
 ̄ ̄ ̄ ̄ ̄
| c | d | c+d
 ̄ ̄ ̄ ̄ ̄
a+c|b+d
T=(ad-bc)^2/(a+c)(a+b)(b+d)(c+d)。
统计量T服从自由度为1的卡方分布,超过显著性水平所指示的临界域时,说明考试成绩和平时成绩的中位数显著不同。】
4(2).用二项分布表,p(+)的99.99%的置信区间是(0.35,1),50%左右的置信区间是(0.75,0.9)。
4(3).查表again,先按次序尺度排序,然后查表,n=10,p*=1/2,按所需置信水平查出上下限的两个序号,序号对应的值就是置信区间的上下限。
4(4).同上,略。
5(1).中位数检验或秩检验。
5(2).同上。
5(3).略。
5(4).把数据对按含硫一方的次序尺度排序,并检验按此次序排序后的不含硫一方数据的趋势性,如果没有趋势,就是不相关,否则相关。(cox-stuart趋势性检验)。
6(1).中位数检验。
6(2).略。
7(1).这里的随机变量应该是X1,X2……Xm的随机变量列,因为如果是同一随机变量的m个观测的话,同分布是默认的。
既然有“3个相邻数”这个概念,说明n和随机变量是有初始次序尺度的。
一共有单调和非单调两用情况,所以T的分布应该是p=1/2,n=m/3的二项分布。
(瞎猜的)
7(2).查表or近似。
8.2x2列联表。
9.容忍限。
10.cox-stuart趋势检验。
11(1).应该是可以用中位数检验,即把所有数据排序,再按中位数前后分为2行,5次试验分为5类,列联表2x5。
按5次试验讨论识别能力,即是看5次试验是不是存在一个逐渐能力上升的趋势,可以检验5次试验是否有相同的中位数。如果没有的话再逐个比对。(其实仍然不能检验趋势,最多检验出没有趋势)。
但是这道题做c-s趋势检验的数据体量实在是太少了。感觉做了也没有说服力。
11(2).同上。
11(3).检验分布函数,卡方拟合优度检验。
12.cochran检验。
13.分位数检验和xp的估计。
14.(也许可以用卡方拟合优度检验?)不会。
15.是2x2列联表且不给定行列总和,只给定N=50。
男孩分为吸烟的和不吸烟的,其中每类又分别分成父亲吸烟的和父亲不吸烟的,然后检验两类的独立性。
16.给定行列总和,用Fisher精确检验2x2列联表。
17.给定期望值与观测值,用卡方拟合优度检验。
18.容忍限
(1)求n,如果n>60则不接受原假设。
(2)求q。
19.c-s趋势检验(其实这题只靠这两章的内容根本没法测,因为所谓「使用方式」解释可多了,每种卡的使用次数,全部卡的使用结构,两种维度同时测才叫使用方式,单测趋势其实不算)。
20.Phi系数是带正负关联的系数,本题中phi系数为正,代表正相关。适用2x2列联表不知行列总和,求独立性。
21(1).符号检验。
21(2).符号检验的零假设的统计量所属自由度的卡方分布的95%范围。查表。
21(3).分位数检验。
22.中位数检验。
23(1).分位数检验。
23(2).分位数检验。
23(3).同17题。
24.McNemar检验。
25.2x2不固定行列总和列联表,2种分类的独立性检验。
Présence对本书的所有笔记 · · · · · ·
-
第172页 4.5卡方拟合优度检验
在卡方拟合优度检验中,Ej=pj*N,而在rxc列联表的诸多应用中Eij的通用公式是Eij=ri*cj/N。 其...
-
第165页 4.4相依性度量
T取最大值时需要在Oij很大时又使Eij很小,根据Eij=ri*cj/N,所以需要ri与cj很小。 所以同时保...
-
第187页 4.8复习题
-
第194页 第五章 秩检验
1.把数据「简化为名义型数据」的处理,会损失一些信息,从而造成对应功效的缺失。 2.数据的结...
-
第196页 5.1两个独立样本
与参数检验t检验相比,大多数情况下,秩检验更受欢迎。 1.很多时候,数据的数字本身没有什么...
说明 · · · · · ·
表示其中内容是对原文的摘抄