独立样本t检验公式非参数检验中的秩均值大小反映什么问题

SAS:两独立样本均值检验 - CSDN博客
SAS:两独立样本均值检验
T检验是平均值的比较方法。
T检验分为三种方法:
1. 单一样本t检验(One-sample t test),是用来比较一组数据的平均值和一个数值有无差异。例如,你选取了5个人,测定了他们的身高,要看这五个人的身高平均值是否高于、低于还是等于1.70m,就需要用这个检验方法。
2. 配对样本t检验(paired-samples t test),是用来看一组样本在处理前后的平均值有无差异。比如,你选取了5个人,分别在饭前和饭后测量了他们的体重,想检测吃饭对他们的体重有无影响,就需要用这个t检验。
注意,配对样本t检验要求严格配对,也就是说,每一个人的饭前体重和饭后体重构成一对。
3. 独立样本t检验(independent t test),是用来看两组数据的平均值有无差异。比如,你选取了5男5女,想看男女之间身高有无差异,这样,男的一组,女的一组,这两个组之间的身高平均值的大小比较可用这种方法。
t检验会计算出一个统计量来,这个统计量就是t值,
spss根据这个t值来计算sig值。因此,你可以认为t值是一个中间过程产生的数据,不必理他,你只需要看sig值就可以了。sig值是一个最终值,也是t检验的最重要的值。
sig值的意思就是显著性(significance),它的意思是说,平均值是在百分之几的几率上相等的。
一般将这个sig值与0.05相比较,如果它大于0.05,说明平均值在大于5%的几率上是相等的,而在小于95%的几率上不相等。我们认为平均值相等的几率还是比较大的,说明差异是不显著的,从而认为两组数据之间平均值是相等的。
如果它小于0.05,说明平均值在小于5%的几率上是相等的,而在大于95%的几率上不相等。我们认为平均值相等的几率还是比较小的,说明差异是显著的,从而认为两组数据之间平均值是不相等的。
总之,只需要注意sig值就可以了。
以上来自:
是sPSS中T检验的例子,可以参考下。
=============================================================================================
下面是SAS的例子:
1 1 173 120
5 1 179 135
8 1 168 131
10 1 175 125
12 1 171 119
14 0 166 100
16 0 155 94
20 0 165 102
proc ttest data =
两独立样本的t检验用于两个独立样本的均数比较。
前提条件:两独立样本都来自正态分布
运行结果以及解释如下:
第一个表格给出两组数据的描述性统计量以及描述两组差值的若干指标。
第二个表格给出t检验的结果,分别给出方差齐和不齐两种情况下的t检验结果和近似结果。要看的第二个表。假设:两组数据的平均值不相等。有差异t-test的p-value = 0.0200,说明假设成功。
最后一个表格给出方差齐性检验(f检验)的结果。要看的第一个表。假设:两组方差不等。P-value
= 0.4642& &0.05说明假设失败,也就是说不可以承认方差相等,于是可以用Pooled method处理两组方差。
上面的检验中对立假设是两组的均值不等,所以检验是双边的,p值的计算公式为Pr(t 分布随机变量绝对值&计算得到的t统计量的绝对值)。如果要进行单边的检验,比如对立假设为女生分数高于男生分数(右边),则p值为Pr(t分布随机变量&计算得到的t统计量) ,当计算得到的t统计量值为正数时(现在t=4.0)此单边p值为双边p值的一半,当计算得到的t统计量为负数时肯定不能否定零假设。检验左边时恰好相反。(没试过)
===============================================================================
当两独立样本不全满足”正态分布“时:
使用使用非参数检验。检验两独立样本的位置是否相同的非参数检验有Wilcoxon秩和检验。我们用NPAR1WAY过程加Wilcoxon选项可以进行这种检验。见下例:
proc npar1way data=sasuser.
其CLASS语句和VAR与TTEST过程相同。结果如下:
N P A R 1 W A Y
P R O C E D U R E
Wilcoxon Scores (Rank Sums) for Variable GPA
Classified by Variable SEX
463.429146
110.810345
463.429146
115.601266
Average Scores Were Used for Ties
Wilcoxon 2-Sample Test (Normal Approximation)
(with Continuity Correction of .5)
Z = 0.527589
Prob & |Z| = 0.5978
T-Test Approx. Significance = 0.5983
Kruskal-Wallis Test (Chi-Square Approximation)
CHISQ = 0.27949
Prob & CHISQ = 0.5970
结果分为四部分:两样本的秩和的有关统计量,Wilcoxon两样本检验的结果,t检验的近似显著性,Kruskal-wallis检验结果。我们只要看Wilcoxon检验的p值Prob & |Z| = 0.5978 ,检验结果不显著,可认为男、女生的GPA分数在0.05水平下无显著差异。
SAS/INSIGHT中未提供两独立样本检验的功能。
本文已收录于以下专栏:
相关文章推荐
单样本t检验,首先检验其总体分布是否服从正态分布,对于符合相应条件的数据运用相应的检验。仅举一例:调查一生产车间的刹车装置,直径为322millimeters为合格,生产车间有8个生产小组,每组抽的1...
原文地址:U 秩和检验)& style=&text-decoration: color:rgb(6,65,131)&&SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney ...
指两个样本之间彼此独立没有关联,两个独立样本各自接受相同的测量,主要目的是分析两个独立样本的均值是否有显著差异。前提
独立性两个样本相互独立,即从一总体中抽取一批样本对从另一总体中...
简介两独立样本检验可以判断两个独立的样本是否来自相同分布的总体。这种检验过程是通过分析两个独立样本的均值、中位数、离散趋势、偏度等描述性统计量之间的差异来实现的检验类型
Mann-Whitney U检...
t-test是一种很好的可以用来跟踪活动实施效果与状态的值,程序演示了如何计算可重复或者独立样本的t-test值!
Table of Contents
1. 列联表检验2. 检验两属性变量相互独立的一般情况
1 列联表检验
一个实际例子
杀人犯的种族是否会影响判处死刑的问题。 对 ...
他的最新文章
讲师:吴岸城
您举报文章:
举报原因:
原文地址:
原因补充:
(最多只允许输入30个字)您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
第13章 有序分类变量的统计推断——非参数检验.ppt免费全文阅读 37页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
需要金币:40 &&
第13章 有序分类变量的统计推断——非参数检验.ppt
你可能关注的文档:
··········
··········
第13章 有序分类变量的统计推断——非参数检验
(续) 第13章有序分类变量的统计推断——非参数检验 (续) 13.4 多个独立样本的非参数检验 13.5 多个相关样本的非参数检验 13.6 秩变换分析方法 13.7 本章小结
13.4? 多个独立样本的非参数检验 13.4.1? 方法原理 13.4.2? 分析实例 13.2.3? 多个样本的两两比较 13.4.1? 方法原理 多个独立样本的非参数检验是通过分析多组独立样本数据,推断总体的中位数或者分布是否存在明显的差异。 SPSS提供的多独立样本非参数检验主要有中位数检验(Median),Kruskal-Wallis检验,Jonkheer-Terpstra检验。 13.4.1? 方法原理 中位数检验可以通过对多独立样本的分析,检验它们来自的总体的中位数有无显著差异。 其基本思想是如果各个总体中位数相同,那么每组样本中,大于中位数和小于中位数的样本个数应该大致相同。 13.4.1? 方法原理 中位数检验的基本步骤: 将样本混合后按升序排序,得到混合样本的中位数。 分别计算每组样本大于和小于这个混合中位数的样本的个数,形成列联表。 利用卡方检验法分析各组样本来自的总体对于上述中位数的分布是否一致,显然,如果各组样本大于小于中位数的样本基本相同,那么就认为有相同中位数,否则就是显著差异。 13.4.1? 方法原理 多独立样本的Kruskal-Wallis检验(克氏检验)实质是两独立样本的曼-惠特尼U检验在多样本总体下的推广,也用于检验多个总体的分布是否存在显著差异; 13.4.1? 方法原理 Kruskal-Wallis检验的基本步骤: 首先,将多组样本混合后按升序排序,计算各个样本值的秩。 考察各组变量秩的均值是否有显著差异,如果多组样本秩的均值没有显著差异,则可以认为是总体的分布没有显著差异,否则,就认为数据无法混合,认为总体有显著差异。 13.4.1? 方法原理 Kruskal-Wallis检验的数学原理: 假定有k个总体,先把从这个k个总体来的样本混合起来排序,记各个总体观测值的秩之和为Ri,i=1,…,k。显然如果这些Ri很不相同,就可以认为它们位置中心位置相同的零假设不妥(备选假设为各个中心位置不全相等)。 记N为各个样本量之和(总样本量). 13.4.1? 方法原理 Kruskal-Wallis检验统计量为(R上面一杠表示平均)
公式中ni为第i个样本量,在原假设成立时,当各组样本数较大时,H近似服从自由度为k-1的卡方分布。 13.4.1? 方法原理 Jonkheer-Terpstra检验的基本思想与两独立样本的曼-惠特尼U检验类似,也是计算一组样本观测值小于其他组观测值的个数,以此来构造统计量,进而计算p值,得到检验方法。 13.4.2? 分析实例 例13.3 某电信公司从3所大学招聘管理人员,从而来源于3所不同大学的雇员组成了3个独立的样本。半年试用期满了以后,人力资源部门对他们进行考核,并评出了这些雇员的表现成绩,人力资源部门想就此评价雇员的管理业绩在3个总体间是否存在差异。 数据见npara3.sav 13.4.2? 分析实例 Analyze? Nonparametric Tests ?K independent Samples
Test Variable: score(考评成绩) Grouping:school(所毕业大学) Minimum:1,Maximum:3 Test type: Kruskal-Wallis 13.4.2? 分析实例 13.4.2? 分析实例 此表给出了3所大学雇员表现的频数和平均秩。可以看出成绩最低的是A大学毕业的人员。 13.4.2? 分析实例 由表可以看出p=0.036&0.05,拒绝原假设,得出:毕业于不同大学的雇员在管理工作上的业绩表现存在显著性差异。 13.5? 多个相关样本的非参数检验 13.5.1? Friedman检验 13.5.2? 分析实例 13.5.4? Kendall协和系数检验与Cochran检验 13.5? 多个相关样本的非参数检验 如果多个(大于2个)样本是按某种或某些条件匹配的,则属于多个相关样本的检验。 例如,某药治疗吸虫病患者,在治疗前和治疗后一周、二周和四周测定7名患者血清SGPT值的变化,以观察该药对肝功能的影响。结果见下表,问患者四个阶段的血清SGPT值有无不同? 13.5? 多个相关样本的非参数检验 这里有四个样本(治疗前,治疗后1、2、4周) 观察的都是相同的7为患者,故为4个相关样本 问题相当于4个总体的分布是否相同 13.5? 多个相关样本的非参数检验 一般地,假定第一个因子有k个水平(称为处理,treatment),第二个因子有b个水平(称为区组);因此一共有k
正在加载中,请稍后...君,已阅读到文档的结尾了呢~~
独立样本t检验 spss独立样本t检验 独立样本检验 非参数检验的优缺点 spss 非参数检验 两独立样本t检验 非参数检验 非参数检验的特点 非参数检验方法 属于非参数检验的是
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
多个独立样本非参数检验
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口当前位置: >>
第四讲――非参数检验
非参数检验方法?第一节 非参数检验的一般问题 ?第二节 单样本非参数检验 ?第三节 列联表与 ? 的独立性检验 ?第四节 等级相关分析 ?第五节 两个相关样本的非参数检验 ?第六节 两个独立样本的非参数检验 ?第七节 多个相关样本的非参数检验 ?第八节 多个独立样本的非参数检验2 第一节 非参数检验的一般问题? 在统计学中,如果总体的精确率分布形式已知,而只是其中的某些参数未知时,通常是从总体中 随机取样本,根据样本信息对总体参数进行估计 或假设检验,这就是一般所说的参数检验。 但在许多实际问题中,我们对总体分布的具体形 式是未知或知之甚少的,只知道总体为连续分布 还是离散分布,也不能对总体的分布形式作进一 步的假定(如假定总体为近似正态分布等),这 时要对总体的某些性质进行统计估计或假设检验, 就要采用非参数检验。? ? 从参数检验的前提条件看,仅要求观察值是独立的、变 非参数检验方法的特点??量是连续的等简单假设,不要求确保样本所属的总体符 合某种理论分布。非参数检验不受总体分布形状的限制, 使得其应用范围更为广泛。 从非参数检验对原始数据的要求看,它部要求有精确的 计量值,可以使用分类数据和顺序数据,非参数检验的 处理方法都基于低精度数据,因而它几乎可以处理任何 类型的数据。 从非参数检验的效率看,虽然非参数检验的计算方法种 类繁多,有时对某类数据的算法就有多种,但其表现形 式一般比较简单并易于理解,依照不同类型数据的不同 算法,效率也不同。研究表明,非参数的检验精度大约 是参数检验的95%。也就是说,非参数检验需要更大 的样本容量来保证所要求的检验精度。 2 非参数检验的常用方法 ?? 拟合优度检验 ? K-S检验 ? 符号检验 ? 游程检验 ? 列联表与 ? 的独立性检验2 第二节 单样本非参数检验? 2 拟合优度检验 ?? 单样本K-S检验? 符号检验? 单样本游程检验(二分类) ? 2拟合优度检验(适应性检验) 一、? 分布在参数统计中可用于方差估计检验,但在非参数统计领域,它有更加广泛的应用。在单样本情况 之下,它主要用于检验客观现象是否服从于某种理 论分布(称为吻合性或适应性检验),或者检验某 种理论分布是否正确(称一致性检验或同质性检 验)。我们将两者合称为“拟合优度检验”。原假 设及备择假设为: H0:观察值的频数Oi与期望(理论)频数Ei相吻合 Hi:观察值的频数Oi与期望(理论)频数Ei不相吻合? ? ? 2 拟合优度检验原理以及计算类别 观测频数 1O12 …. K总和O2OKn假设检验问题:H0 : F(X) ? F0 (X) ? H1 : F(X) ? F0 (X)观测频数 O 和理论频数 E 的差别作为检验总体分 布和理论分布是否一致的标准,定义Pearson ? 2 统计量: 2 2ii?2 ? ?(Oi ? Ei ) O ? ? i ?n Ei Ei ? 拟合优度检验原理以及计算2? 2值越小,根 ? 如果观察频数与设定频数越接近,则 ? 2统计量渐近服从于 据皮尔逊定理,当n充分大时, ? 2分布。我们可以计算出 ? 2 统计量, k-1个自由度的??判断有以下两种方法: 2 依据 ? 的分布表,给出所对应的概率值,如果该概 率值&给定的显著水平α ,则拒绝Ho,即样本所属 的总体分布形态与设定的分布存在显著差异;反之 则不能拒绝Ho。 2 依据 ? 的分布表,给出α 所对应的临界值 ? ,如 果 统计值&临界值,则拒绝Ho;反之则不能拒绝 Ho。2? ? [例12.1] 某企业开发了一种新型的食品,初步设想出五种不同的包装方式(每种包装方式的含量 相同),现欲了解消费者对这些不同包装方式的 偏好是否有差异,经过市场实验,得到如表12-2 所示的销售数据。表12-2 各种包装方式的饮料销售量包装方式单位:瓶 戊 345 合计 1700甲 325乙 384丙 320丁 326销售量 ? ? ? ? ?H0:对不同包装方式的偏好无差异 H1:对不同包装方式的偏好有差异 在H0成立之下,应有: E1=E2=E3=E4=E5=故统计量值为:?2 ? ?i ?1 5? Oi ? Ei ?2Ei 2 2 2 2 2 ? 325 ? 340 ? ? ?384 ? 340 ? ? ?320 ? 340 ? ? ?326 ? 340 ? ? ?345 ? 340 ? ? 340 340 340 340 340? 8.18242 ? 2 ? 8.1824 ? ?? (4)故不拒绝 H 0 ,即不能认为五种不同包装方式之间销 售有显著差异。 二、单样本K-S检验单样本K-S检验,也称Kolmogorov-Smirnov正态性检 验。K-S检验也是一种拟合度检验,研究样本观测值的 分布和设定的理论分布间是否吻合,通过对两个分布 差异的分析确定是否有理由认为样本的观测结果来自 设定的理论分布总体。 假设样本的经验分布函数为 Fn (x) ,定义D ? max | Fn (x) ? F(x) |当D ? D?n时,拒绝零假设。Ho: F ( X ) ? F ( X ) H1: F ( X ) ? F ( X )n ? [例12.3] 某茶叶公司的产品灌装生产线在灌装过程中,会出现重量(份量)的偏差。根据质量要 求,一定范围之内的误差是允许的。质量标准是 :平均盒重(净)500g,允许极限误差(99.73% 的可靠性)为12g。现随机抽取1000盒产品进行检 验,结果重量资料如表12-3所示(已分组)。现 欲想证明该灌装生产线所包装的产品重量是否服 从于均值500g,方差为16g的正态分布。 表12-3 灌装产品重量的样本资料按重量分 组 以下 486-488 488-490 490-492 492-494 494-496 496-498 498-500 500-502 502-504 504-506 506-508 508-510 510-512 512-514 以上 合计 盒数 1 1 4 16 47 86 137 205 210 141 82 46 18 4 1 1 1000 累计盒数 1 2 6 22 69 155 292 497 707 848 930 976 994 998 999 1000 累计频数 0.001 0.002 0.006 0.022 0.069 0.155 0.292 0.497 0.707 0.848 0.930 0.976 0.994 0.998 0.999 1.000 按正态分 理论累计频数 布计算Z值 -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 0.3 0.8 0.7 0.0 0.3 0.2 0.7 0.0 绝对差异 0.7 0.8 0.7 0.3 0.7 0.2 0.7 0.0 ? 此列原假设H0为:产品包装净重服从均值为500g,标? ?准差为4g的正态分布。有关中间过程列在表12-3中。 因本例理论分布的总体参数μ与σ均已知,故可计算出 每一组上限为止的“理论频率”。 D统计量值为: D=max{|Sn(x)-Fn(x)|}=0.0165 查D分布表。因本例n大大超过40,我们采用近似的公 式计算临界值,即:D0.05 ?1000 ? ? 1.36 ? 0.?? 由于D=0.(01故不能拒绝H0,即可认为该生产线产品的包装净重服从正态分布。 三、符号检验符号检验是一种利用正、负号的数目对某种假设做出 判定的非参数检验方法。它部要求知道被检验量的分布 规律,仅依据某种特定的正负号数目多少来对某种假设 做出检验。常用于检验总体的均值、中位数等参数是否 为某一数值,或判断总体分布有无变化。 有配对样本(x1,y1), (x2,y2) ,… (xn,yn)x 将 x i ? yi 记为“+”, x i ? yi 记为“-” , i ? yi记为“0”,记P+ 为“+”比例, P- 为“-”比 例, 那么假设检验问题:H0:P+=P- ??H1:P+=P可以用符号秩检验。 ? [例12.7] 某企业生产一种月饼,有A、B两种口味,为确定哪种口味更加适合消费者青睐,此前特作 一次市场研究。经市场实验,被调查者对两种月 饼的的偏好如表12-6所示。表12-6 月饼口味偏爱情况调查表 被调查者(评价者) 序号 1 2 3 4 5 6 7 8 9 10 合计 更喜欢A口味 (+) √ √ √ 更喜欢B口味 (-) √ 无所谓√√ √ √ 7√ √21 ? 显然,若评价者对两种口味无显著偏好,则+号与-号个数应该是相近的。本例中 n+ =7,n- =2, n =9,l=min(n+ ,n-)=2,结点舍去,则由二项 分布,可计算出“-”号小于等于2的概率P,即P ? ? C9x 0.59 ? x ? 0.0898x ?0 2? 若取显著性水平为0.1,则拒绝H0 ,认为消费者更喜欢A种月饼的口味。 四、单样本随机游程检验? 随机性是抽样调查方案设计中的一条重要原则。但在现实生活中,我们经常会遇到一些非随机的序列 。游程检验(也称连贯检验)就是为了检验样本观 察值出现次序的随机性而发展起来的一种非参数统 计方法,有着十分广泛的应用。例如检验股票价格 波动的随机性,检验样本的随机性,检验生产过程 是否处于随机控制状态等等。 如果一个变量的取值只有两种情况(如记为M与F) ,即是非标志(若不是“是非标志”,我们可以将 之转化成“是非标志”)。变量值按一定次序出现 (即有顺序的),则就可能有如下形式的序列:MMM FFF M FF MM FF M FFF MMM FFFF? ? 所谓游程,就是由同类事物(符号,如M)连续构成的一个子序列,它的前面和后面有另外的事物( 符号,如F),或前后根本没有别的事物。显然, 上面列出的变量值序列就有十个游程。第一个游程 是由3个M构成,第二个游程是由3个F构成,第三 个游程则由一个M构成,第四个游程由两个F松成 ……? 游程检验中最常用的方法是游程个数检验。其原假设及备择假设为: H0:现象(序列)是随机的 H1:序列是非随机的 ? [例12.4] 在证券价格理论中,有一种叫“随机漫步”理论,认为股市价格变化是随机的。人们经常采 用游程检验来验证这一理论。设某种股票在过去的 38个交易日中价格变动情况如下(+表示价格上升, -表示价格下降): +++--+---++-+--++++---++++-++--++-+--计算得 n1=20, n2=18, R=18。查游程总数临界值表, a a R , ? 13 R , ? 25 在0.05显著性水平下, 2 , 2 ,显然 R , a ? R ? R , a , 2 2 即实际序列中游程个数“不多也不少”,故不能拒 绝 H0 ,即认为该股票价格变化是随机的。1212 第三节 列联表与 ? 的独立性检验2连列表又称交互分类表,指抽自某一总体的样本同时按照两个或两个以上标志进行分类,一下以量个分类标志位例。[例]下表是一个由220名饮酒者组成的随机样本,对饮酒者 进行酒的类型偏好的调查。横向看,反映了再固定性别 的条件下,对白酒与啤酒的偏好;总向看,反映了再固 定酒类型的条件下,各性别的人数。性别 男性 女性 合计饮酒偏好 白酒 啤酒 60 50 40 70 100 120合计 110 110 220直观看似乎饮酒偏好 与性别有关,是这样 吗?利用 统计量可 以完成对分类数据或 顺序数据之间是否独 立的检验。 ? 建立假设:Ho:两个分类变量之间独立(性别与饮酒偏好无关);H1:两个分类变量之间不独立(性别与饮酒偏好有关)? 计算与列联表中实际次数相对应的期望次数:每一个条件次数的理论次数 f (i ? 1,2,?; j ? 1,2?) 即期望次数记作ijeij则 e ?ij? 构建统计量:实际次数 f ij 与理论预期次数 eij 有差异,这是可以用其差值的大小来度量两个变量相关程度,相差越大,表明HO 为真的可能性就越小;反之则HO为真的可能性就越大。为避免f ?f ni??j? 差值的正负抵消,可以采用差值的平方和,这就是2统计量:(f ?e ) x ? ?? e2 r c ij ij i ?i j ?1 ij2? 检验判断:若 x不能拒绝Ho。2? x 则拒绝假设Ho,2?即认为性别与饮酒偏好有关系;反之则 第四节 等级相关分析有时候我们在研究的两个变量中得到两组顺序数据,如 学生的考试成绩与老师为学生排出的工作能力大小顺序。要研 究学生的学习能力与工作能力是否一致,就要用啊等级相关分 析。对等级数据的相关性的测度主要用等级相关系数,它是把 相关的两个变量按等级次序排列,形成 Rx 与 R 两个等级序列, R 然后测定 与Rx 这两个等级序列之间的相关程度。y y Spearman等级相关系数学生 编号 考试 总分 工作能 力排名R R d dxy2 ii12 3 4 5350360 358 369 37898 6 7 1107 8 4 398 6 7 11-1 2 -3 211 4 9 4d=R -R ixiyi6 78 9 10 11395 388354 368 3662 510 3 41 29 5 62 510 3 4-1 -3-1 2 2 合计1 91 4 4 38 Spearman等级相关系数Spearman等级相关系数是历史上最早(1904)测定两个样 本相关强度的重要指标,记为:rs ?cov(Rx , R y ) s Rx ? s R y?? (Ri ?1 n i ?1nxi? Rx )( R yi ? R y )n( Rxi ? Rx ) 2 ? ( R yi ? R y ) 2 ?i ?1n ?1 R ?R ? 2x yr ? 1?s6? ?dn i ?1 22 in(n ? 1) Spearman等级相关系数Spearman等级相关系数检验的步骤 1.建立假设: Ho:两样本相关程度无统计意义,即两样本不相关 H1:两样本相关程度有统计意义,即两样本相关r ,差表确定 r 3.比较 r r 4.若 r & r ,则拒绝H ,两样本相关程度有统计意义,两2.计算sn?ns?nos?样本相关,学习能力与工作能力有关。反之则学习能力与工作 能力无关。 第五节 两个相关样本的非参数检验? 麦克勒玛检验? 威尔克逊配对符秩检验 一、麦克勒玛检验基本原理? 麦克勒玛(McNemar)检验是适用于研究现象“?前后”情况有无显著变化的一种非参数统计方法。 设n个样本单位在某一条件下(即变化前)的观察 值为第一个样本(观察值为“是非标志”),在另 一个条件下(即变化后)的观察值为第二个样本, 则可以得到如表12-4所示的频数统计表。 表12-4麦克勒玛检验频数表变化后变化 前 0 1 0 A C 1 B D? 这里,A是前后均为“非”的次数。D为前后均为“是”的次数,B是从“非”变为“是”的次 数,C是从“是”变为“非”的次数。显然,前 后情况有无变化,就是指C、B 两格子内次数的 变动情况。麦克勒玛检验关心的也正是这一点, 故统计假设为: H0 :事件在两个方向上的变化可能性相同 H1:事件在两个方向上的变化可能性不同 ? [例12.6] 某高校欲研究某系学生专业态度的变化情况,以验证新生入学专业教育的效果。从整个专业 的100名新生中随机抽取80名学生进行态度调查: 在刚入校时,记载学生们对所学专业的态度(喜欢 或不喜欢),经过一段时间的专业教育,在新生入 学后第三个月对这80名学生的专业态度再次作访问 调查,两次专业态度整理成下表12-5。表12-5 大学生专业态度变化频数统计表 入学三个月后的专业态度 不喜欢 喜欢 不喜欢 20(A) 40(B) 入学初的专业态 度 喜欢 6(C) 14(D)合计 26 54合计 60 20 80 ? 计算卡方统计量值为:?2 ?( B ? C ? 1) 2 B?C ? ( 40 ? 6 ? 1) 2 40 ? 6 ? 23.674? 在显著性水平 0.05时 。因为2 ? 2 ? 23.674 ? ?0.05 (1) ? 3.841? 故拒绝H0 ,认为学生专业态度有明显变化(即更多的学生培养起了专业兴趣)。 二、Wilcoxon符号秩检验对称分布的中心一定是中位数,在对称分布情况 下,中位数不唯一,研究对称中心比中位数更有意义例:下面的数据中,O是对称中心吗?0 Wilcoxon符号秩检验原理以及性质 首先,设样本绝对值| x |,| x |,?,| x | 的顺序统计 量 | x | ,| x | ,?,| x | ,如果数据关于0点对称,那么对 称中心两侧的数据疏密程度应该一样,整数在取绝对 值以后的样本中的秩应该和负数在绝对值样本中的秩 和相近。1 2 n1 (1)2 (2)n (n )用R 表示| x |在绝对值样本中的秩,反秩 D 由| X |?| X | 定义。W ? S(X ) 表示 X 的符号,R S(X ) 称为符号秩统 计量。Wilcoxon符号秩统计量定义为:? jjjDj( j)jDjDj? jjW ? ? jWj ? ? R ?S(X j ) j? j?1 j?1nn 表12-7 方案设计效果调查表达式消费 者 A B C D E F G H I J K L M N O P Q R S T 老方案评 分?i新方案评分 前后评分差yi didi符号还原后 正秩 6.5 15 1.5 16 1.5 6.5 3 10.5 -6.5 6.5 -6.5 负秩的秩次 6.5 14 15 1.5 16 1.5 6.5 3 10.5 6.5 6.5 6.5 6.5 13 10.5 20 12 19 17.5 17.580 70 85 86 60 70 90 65 70 80 60 85 95 80 92 50 70 55 40 9085 60 96 88 76 72 95 68 76 75 65 80 90 88 98 80 77 80 60 70+5 -10 +11 +2 +16 +2 +5 +3 +6 -5 +5 -5 +5 +8 +6 +30 +7 +25 +20 -20-146.5 13 10.5 20 12 19 17.5-17.5 [例12.8] 某房地产公司为了验证其新的设计方案 是否有效,在新设计方案之前与新设计方案之后 作了一次对比调查,从消费者中随机抽取20名进 行了解,记录了他们在设计方案前后对该公司房 产产品的评分,如表12-7所示。要求检验: H0 :新设计方案有效; H1 :新设计方案无效。? 有关中间过程的表12-7所示。 ? Wilcoxon-T统计量值为T=44.5。查表(双侧):? 0.05 ? T? , 20 ? ? 52 ? 44.5 ? 2 ? ? 0.05 ? K? , 20 ? ? 9 ? 2 ?? 拒绝H0 ,即认为设计方案是显著有效的。 第六节 两个独立样本的非参数检验? 曼―惠特尼U检验? 中位数检验? 斯米尔诺夫检验 ? 双样本游程检验? 独立双样本卡方检验 一、曼―惠特尼U 检验? 这是检验两个独立样本是否来自具有相同均值的总体的非参数检验方法,又称秩和检验法。它与 配对Wilcoxon检验相类似,要考虑到每一个样本 中各观察值所处的次序(秩),故为一种功效较 强的检验方法。 设第一样本n1个观察值为xi,i=1,2,…,n2 ;第二样 本n2个观察值为xj, j=1,2,…,n2 。则其基本步骤为 (1)将两个样本合并成一个样本再评秩。可 以按升序评秩,也可按降序评秩。若多个观察点 数值相同,则取其平均秩次。? (2)计算每个样本观察点所得的秩和。记为 TR1与TR2。 (3)计算U统计量。如果两个样本的确抽自 同一个总体(H0),则可以设想样本1所得到的 平均秩次与样本2所得到的平均秩次大致相同。故 定义统计量U为:U ? min{U 1 ,U 2 } n2 (n2 ? 1) n1 (n1 ? 1) 其中 U 1 ? n1n2 ? 2 ? TR1 U 2 ? n1n2 ? 2 ? TR2 (4)查U统计量分布表。若 U ? U 临 (? , n1 , n2 ), 则拒绝H0 ,认为两个样本的均值有显著差异,即 抽自不同的总体。 [例12.10] 对两所大学入学新生的智能进行 测验,结果如表12-8所示。现要检验这两所大学 新生的智能水平是否有显著差异。表12-8 两所大学新生智能抽样测验分数甲大学学生编号 1 2 3 4 5 6 7 8 9 10 11 12智能分数 75 81 87 95 90 86 65 78 92 97 86 82乙大学学生编号 1 2 3 4 5 6 7 8 9 10 11智能分数 90 97 82 79 86 87 94 91 80 84 88 ? ? ? ?取显著性水平0.05。则统计假设为: H0:两校新生智能水平无显著差异 H1:两校新生智能水平有显著差异 n1=12,n2 =11。将这两个样本混合之后评秩,结 果如表12-9所示。表12-9 两所大学新生智能分数抽样评秩秩次 1 2 3 4 5 6 7.5 7.5 9 10.5 10.5 12.5 分数 65 75 78 79 80 81 82 82 84 86 86 87 学校 甲 甲 甲 乙 乙 甲 甲 乙 乙 甲 乙 甲 秩次 12.5 14.5 14.5 16.5 16.5 18 19 20 21 22.5 22.5 分数 87 88 88 90 90 91 92 94 95 97 97 学校 乙 甲 乙 甲 乙 乙 甲 乙 甲 甲 乙 可计算知TR1 ? 136,TR2 ? 140。U 统计量为: n1 ( n1 ? 1) U1 ? n1n2 ? ? TR1 ? 210 ? 136 ? 74 2 n2 ( n2 ? 1) U 2 ? n1n2 ? ? TR2 ? 187 ? 140 ? 47 2 U ? min{U1 , U 2 } ? 47 查曼 ― 惠特尼U 检验表,临界值 U 临 (0.05 2 ,12,11) ? 30 U ? 47 ? 30 故不拒绝H 0,即没有充分理由认为两所大学新生智能分数 有显著差异 二、中位数检验(一)基本原理 ? 这是检验两个彼此独立样本是否来自有相同中位 数的总体。由于在社会经济统计中,我们遇到的 变量可能是“定序变量”,若检验两个样本在该 变量值上的“一般水平”(统计平均数)是否相 同,采用参数统计中“两个均值差异性”的 检验 可能行不通,这时可采用中位数检验法,因为中 位数也是一种平均数。 中位数检验的原假设及备择假设为: H 0 :两个独立样本来自有相同中位数的总体 H 1 :两个独立样本来自的有不同中位数的总体 ? [例12.14 ] 设有两批不同厂家的灯泡,经质量检验,它们的寿命如下(小时): 甲厂家:,,1326, ,,,1462, , 乙厂家:,,1685, ,,,1479, ,,1581 要求检验两厂该灯泡寿命的中位数是否相同。 ? 此例若假定该灯泡的寿命服从正态分布,则就可 ?用参数统计中的t检验法进行检验。我们现在采用 中位数法进行检验。 由所给资料可计算知,n1=16, n2=17,混合中位数 的中数为Me=1465小时。则x(甲厂灯泡寿命超过 混合中位数的个数)为5,y(乙厂灯泡寿命超过 混合中位数的个数)为11。于是可计算出累积的 一伴随概率为:5 11 4 12 3 13 2 14 1 15 0 16 C16C17 ? C16C17 ? C16C17 ? C16C17 ? C16C17 ? C 16C 17 P? 16 C37? 0.51832%? 显然,P&α=0.01 。故我们认为两个厂的灯泡寿命中位数显著不同。 三、斯米尔诺夫检验(一)基本原理 ? 这是在柯尔莫洛夫检验(单样本,见第二节)的基础之 上推广到两个独立样本之间的比较,判断两个总体分布 是否相等的方法。有时也称 K-S 双样本检验。第一个样 本有 n 1 个观察值,随机抽自某一分布函数为 F ( x )(但 未知具体形式)的总体,第二个样本有 n 2 个观察值,随 机抽自另一分布函数为 G ( y )(也未知其具体形式)的总 体。现要通过两个样本的比较,对以下假设进行检验 H 0 : F ( x ) =G ( y ), 即两总体分布相同 ( -∞&x , y&∞ ) H 1 : F ( x ) ≠G ( y ),即两总体分布不同 ( -∞&x , y&∞ ) ? [例12.16] 设男、女两类消费者对某餐厅风味的评分(10分制)资料如下表12-11所示。现欲知 两类消费者的评分分布是否相同。表12-11 男、女两类消费者的评分女消费者评分 序号 评分 1 7.5 2 6.5 3 6.0 4 6.0 5 7.5 6 8.0 7 8.5 8 9.0 9 8.5 10 6.5 11 7.0 12 9.0 13 9.5男消费者评分 序号 评分 1 8.0 2 10.0 3 9.0 4 9.0 5 8.5 6 9.5 7 7.5 8 7.0 9 8.5 10 6.5 11 6.0 12 9.5 13 6.0 ? 先将上述样本资料混合编制单项式分布数列,如表12-12所示。表12-12 斯米尔诺夫检验计算过程按评分 值分组 6. 0 6.5 7.0 7.5 8.0 8.5 9.0 9. 5 10.0 合计 累计频率 (经验分布) D? 男 女 0..................000000消费者人数男 2 1 1 1 1 2 2 2 1 13 女 2 2 1 2 1 2 2 1 0 13累计人数男 2 3 4 5 6 8 10 12 13 女 2 4 5 7 8 10 12 13 13偏差Fn1 ( x) ? G n2 ( y )0.........000000Dmax ? max{ D} ? 0.153847D0.05 (13,13) ? 6 / 13 ? 0.461538 , D ? D0.05 (13,13)故不拒绝 H 0 ,即认为男女两类消费者对该餐厅 ? 四、双样本游程检验(一)基本原理和和步骤 ? 这是单样本游程检验的推广,用来检验两个独立样本是否有相同的总体分布,也称“瓦尔德沃夫维茨”的检验(Wals-Wolflwitz检验,简记 W-W游程检验)。其基本步骤如下: (1)将两个样本的观察值混合,并按大小顺 序从小到大排列。并以符号 表示第一样本的元素 ,以符号y表示第二样本的元素。 (2)计算 ,y序列中的游程总数,方法与单 样本游程检验完全相同。? ? ??(3)查游程总数检验临界值表。在单样本情 况下,游程个数太多太少都表示 不成立。但在双 样本情况之下,游程个数越多,表示两个样本值 的混合越理想, 越不能拒绝。故此时要查游程总 数检验的下限临界值 。若 ,则拒绝 ,认为游程 个数太少,从而两个样本来自不同的总体。值得 指出的是,当 或 超过20时,可用正态分布来检 验。 [例12.17] 假设要比较两个医院满月新生儿重量 是否有显著差异,从两个医院抽得的满月新生儿 重量分别为(单位:KG): 医院1:4.97 5.21 4.30 4.78 5.09 4.83 4.52 5.34 4.90 4.94 医院2:4.88 4.55 5.36 4.43 4.93 4.70 5.28 4.53 5.46 4.95 4.98 ? 要求检验这些新生儿的重量分布是否来自同一总?体(或来自有相同分布函数的两个总体)。 先将上述两组数据混合排序,并在第二样本的数 据之下划一横线: 4.30 4.43 4.52 4.53 4.55 4.70 4.78 4.83 4.88 4.90 4.93 4.94 4.95 4.97 4.98 5.09 5.21 5.28 5.34 5.36 5.46 可见,游程总个数R=14。由所给 n2 ? 11 ? ? 0.05, n1 ? 10 得游程总数临界值(下限)为 R0.05 (10,11) ? 6 ,因 为 R ? 12 ? 6 ,故不否定 H 0 ,认为两个总体有 相同的分布。 五、独立双样本卡方检验该法是单样本卡方检验的推广,也是列联表分析 的应用。主要用于检验两个彼此独立的样本的频 率分布是否有差异,或是行变量与列变量之间是 否具有相关性。检验步骤如下: (1)独立随机抽取两个样本,将全部可能观 察值进行分组,得到如表12-13所示的频数资料 (分布数列)。表12-13样本观察值样本频数分布?1O11 O21?2?3…?rO1r O2 r lr合 计样本1频率 样本2频率合 计O12 O13 O22 O23 l2l3……n1l1n2 n (2)计算期望频数。若两个样本对应于具体观 察值的出现概率是相同的(即H 0 为真,两个总体 无差异),则在实际的调查中,全部n个样本单位 n 中属于第i 样品的估计概率为 n (i ? 1,2) ,全部n个样 l 本单位中,出现第j个观察结果的估计概率应为 n 。按联合概率,即可推知在全部的n个单位中,出 现上述表格每一格子中的期望次数 E ij为:ijni l j ni ? l j Eij ? n ? ? ? n n n(3)计算卡方统计量: ? ? ??2 i ?1 j ?12r?Oij? Eij ? Eij22 (4)作检验。若 ? 2 ? ? ? ?r ? 1? ,则拒绝 H 0 ,认 为两个总体有显著差异。 [例12.18] 某市场研究公司对某国际体育产品公司 生产的A、B两种品牌产品的消费群进行了一次体 育节目收视情况调查,以了解他们喜欢收看哪些 体育节目,从而为该企业提供选择广告时段的参 考资料。调查结果如表12-14所示。表12-14 电视节目 足球 网球 乒乓球 篮球 羽毛球 排球 赛车 合计 样本中A、B两品牌消费者观看不同电视节目的人数 A品牌 160(139.9..4..4.. B品牌 120(140.0..5.5.5.5. 合计 280 300 170 250 230 250 210 1690 表中括号内为期望频数(即人数)。可计算得卡 ? ? 方位计量值为: 2 ? 62.241 。由于 , 02.05 ?7 ? 1? ? 12.592 ? , 2 ? ? 02.05 (6) 故拒绝 H 0 ,认为这两种品牌消费者 在电视节目收视方面是有差异的。 第七节 多个相关样本的非参数检验? 柯克伦 Q 检验 ? 费里德曼双向评秩方差分析 一、柯克伦Q检验(一)基本原理 将麦克勒玛检验推广到两个以上样本,就得 到K个相关样本的柯克伦(Cochran)Q检验,它 是用来检验配对的三组或三组以上的频率彼此之 间有无显著差异的一种方法。例如,我们研究k种 不同优惠策略的效果时,请N个消费者对K种策略 作出态度回答(赞同、不赞同),然后就可研究 消费者对K种优惠策略的反应是否有差异。 柯克伦Q检验的原假设及备择假设一般为: H0: k个样本的频率没有差异 H1: k个样本的频率有显著差异 (二)检验步骤(1)取得如表12-15所示的原始资料:表12-15 样 本 观察点 样本1 样本2 … 样本k 合计 柯克伦Q检验调查表1 2 3 … n合计G1G2L1 L2L3 … Ln…Gk注:表中取值为“0”或“1” 每个观察点可以是一个单位,也可以是包含k 个小组的匹配值。例如,在研究n种不同教学方法 的效果时,同一个受试者(学生)显然不能同时 接受k种方法进行教学。这时,某个观察点内就应 该有k个各方面条件完全相同(如智力水平、年龄 、性别等)的学生组成一个“匹配组”,对这k个 “基础”相同的学生实施不同教学方法,如该组1 号学生实施第一种教学方法,2号学生实施第二种 教学方法,…,第k种学生实施第k种教学方法。 每个观察点都是由k个学生组成的“匹配组”。 完成教学任务之后,进行测试,如通过考核 者为1,未通过考核者为0,填入表中。例如,样 本1登记的就是各观察点阵为所有1号学生的考核 结果,样本2登记的就是各观察点所有2号学生的 考核结果,其余类推。 (2)计算Q统计量:Q? k (k ? 1)? (G1 ? G ) 2i ?1 kk ? li ? ? li2i ?1 i ?1nnG 其中 G ? ? G j k ,j 及 Li 的含义见表12-15。 j ?1 可以证明,Q~ (k-1)。 (3)查 ? 2分布表,作出检验。若 Q ? ? 2 (k ? 1) ,则 拒绝 H0。认为k个样本的反应有显著差异。k [例12.9] 某公司为了提高生产工人的技能,尝试 了四种不同的培训方法。经过一段时间的培训,参 加行业技能考试的通过情况如表12-16所示(配对 点有20个。每个点内由4名技工组成)。 显然,k=4,n=20,?LI? 46 ? ? G j , G ? 11.5, ? (G ? G ) 2 ? 13, ? L2 ? 116 i统计量值为:Q? 4 ? 3 ? 13 156 ? ? 2.2941 4 ? 46 ? 116 682 ? 0.05 (4 ? 1) ? 7.815 由于, 故不能拒绝H0 ,即不能认为 这四种培训方法的行业技能考试通过率之间有显 著差异。 表12-16 不同培训方法之下行业技能考试通过情况配对组 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 合计 方法1 1 1 0 1 0 1 1 0 1 1 1 1 0 1 0 1 1 1 1 0 14 方法2 0 1 1 0 1 0 0 1 1 1 1 0 1 0 1 0 0 1 0 1 11 方法3 1 0 1 1 0 0 1 0 1 0 1 0 0 0 1 0 0 1 0 1 9 方法4 0 1 1 1 1 1 0 1 1 1 0 0 1 1 0 1 1 0 0 0 12 合计 2 3 3 3 2 2 2 2 4 3 3 1 2 2 2 2 2 3 1 2 46l i24 9 9 9 4 4 4 4 16 9 9 1 4 4 4 4 4 9 1 4 116 二、费里德曼双向评秩方差分析(一)基本原理这也是检验K个相关样本之间差异性的一种非参 数统计方法。但它与Q检验不同,它要求变量值至少 是有顺序的。如上面行业技能考试通过率的例子,Q 检验只在乎“有没有通过”而不在乎分数的高低。 费里德曼(Friedman)双向评秩方差分析则不同, 它更关心分数的高低。其待检假设为: H0: k个样本的频率没有差异 H1: k个样本的频率有显著差异 (二)检验步骤(1)与Q检验相类似,取得如表12-17形式的调 查表。但此时表中的数值不是0~1变量值,而是 秩次或具体数值。若是具体数值,则将之评秩。表12-17 费里德曼检验调查表观察点 样本1 样本2 … 样本k1 2 … n 合计R1R2…Rk注:表中数值为“秩次” 由于这一表格是按横向(样本之间)评秩,又按 纵向求秩次总和的,故称为“双向评秩”。 ? r2: (2)计算统计量k 12 12 2 ? ? ? ? R j ? 3n?k ? 1? nk?k ? 1? S13 Nk ?k ? 1? j ?1 2 r其中:S1 ,可以证明 ? r2 ~ ? 2 ? k ? 1? 上式中,Rj为第j样本得到的秩次和,显然,若不 同样本之间没有差异,则它们所得到的秩次和Rj 之间应该很接近,若Rj之间差异越大,说明各样 ? r2值越大,H 也越 本得到的秩次差别越远,从而 0 难成立。 (3)作出检验结论。在给定的显著性水平α之 下,查 ? 2分布表。若 ? r2 ? ? ?2 (k ? 1) 则拒绝H0。k 2n ? k ? 1? ? ? ? ? ?Rj ? ? 2 j ?1 ? ? [例12.20] 根据[例12.19]行业考试通过率的例子,若研究者 关心的并不是“通过”与否,而是成绩的高低,则就等于 检验下面的假设: H0:四种不同培训方法之下职工考分无差异 H1:四种不同培训方法之下职工考分有差异 我们将原始资料列于表12-18中。? r2 统计量值为:12 ? ? ?   2 ? 56 2 ? 59.52 ? 48.52 ? 3 ? 20 ? 5 ? 9.375 36 20 ? 4 ? 52 r2 ? 0.05 (3)=7.815 取α=0.05时,??? r2 = 9.735 & ? 02.05 (3) = 7.815故拒绝H0,认为四种不同培训方法的效果是有显著差异的 。这个结论与前面的Q检验结论之间之所以不同,是因为 它们所关心的问题不完全相同。在实践中,可以通加增加 样本容量来作进一步的验证与研究。 表12-18 四种不同技能培训方法的考分及名次配对组 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 合计 考分 80 86 58 79 55 81 78 58 68 90 87 85 50 66 50 76 75 84 75 51 方法1 评秩 1 1 4 1 3 1 1 3 2 1 2 1 3 1 3 1 2 1 1 3 36 方法2 考分 55 62 68 47 60 50 55 70 64 68 72 46 60 57 61 50 57 79 58 62 评秩 3 3 2 4 2 4 3 1.5 3 3 3 4 2 3 2 3.5 3 3 2 2 56 方法3 考分 75 57 65 76 48 55 68 50 62 58 90 55 57 54 65 50 56 81 54 64 评秩 2 4 3 2 4 3 2 4 4 4 1 3 4 4 1 3.5 4 2 4 1 59.5 方法4 考分 45 65 72 64 62 78 54 70 82 86 55 58 62 64 47 68 76 54 55 50 评秩 4 2 1 3 1 2 4 1.5 1 2 4 2 1 2 4 2 1 4 3 4 48.5 第八节 多个独立样本的非参数检验? 多个独立样本的卡方检验 ? 克鲁斯卡尔―瓦利斯 H 检验 一、多个独立样本的卡方检验(一)基本原理和步骤将独立双样本 ? 检验进一步推广,可得到多个 ? 2 检验,或称“k个总体齐一性检验”。它 总体的 2 ?2 与独立双样本? 检验之下的做法基本相同,也是 列联表分析技术的应用。它可用来检验 k 个总体 的分布是否相等的原假设。 检验步骤如下: (1)将调查数据按样本及观察点取值情况进 行分组,得如表12-19所示的二维列联表,表内 为实际观察频数Oij。2 表12-19观察值 X1 X1 … XR 合 计 样本1样本实际观察频数表… ? ? ? … 样本k 合 计 n 1. n 2. ? n R. n样本2O 11 O 21 O R1 n.1O 12 O 22 O R2 n.2O 1k O 2k O Rk n.k(2)计算期望频数Eij:Eij ?ni.. j n? Eij ?(3)计算卡方统计量。由皮尔逊定理,卡方统计量为? 2 ? ??i ?i j ?i R K?O2ijEij它服从自由度为(R-1)(K-1)=RK-R-K+1的卡方分布 (4)作出检验结论。若 ? 2 ? ??2 ? RK ? R ? K ? 1? , 则拒绝H0,认为这K个总体的分布不尽相同。 [例12.21] 某女士美容公司为了了解客户对旗下三 个子公司服务质量的评价,从各家公司的全部固 定客户中随机抽取部分(共950户),经调查,评 价意见如表12-20所示。 本例采用 检验,即 H0:客户对三家子公司服务质量评价无差异 H1:客户对三家子公司服务质量评价有差异 我们将期望次数及(Oij-Eij)2/Eij列入下表12-21中。 表12-20 客户对三家子公司服务质量的评价评价等级 优 良 中 差 极差 合计 X 公司 60 160 100 40 20 380 Y公司 20 100 120 50 10 300 Z 公司 10 70 160 20 10 270 合计 90 330 380 110 40 950表12-21 期望次数及(Oij-Eij)2/Eij评价等 级 优 良 中 差 极差 期望次数Eij X公司 36 132 152 44 16 Y公司 28.5 120 34.6 Z公司 25.5 108 31.4 X公司 36.4 17.6 1.0000 (Oij-Eij)2/Eij Y公司 2.1 0.6 0.5483 Z公司 9.2 15.8 0.16472 ? 2 = 115.7948 & ? 0.05 (8) = 15.507, 所以H0被拒绝,即三家子公司 由于的服务质量显著不同。 二、克鲁斯卡尔―瓦利斯H 检验(一)基本原理 ? 这是一种非常有用的非参数统计方法。在参数统计中,对方差分析是采用F检验进行的,以检验 推断多个正态总体均值是否相等。但当总体并不 服从正态分布时,F检验就受到了限制。这时通 常可用克鲁斯卡尔―瓦利斯的H检验法。它可以 看作是Wilcoxon-W检验或曼―惠特尼U检验的推 广。待检验假设为: H0:k 个样本来自不同一总体 H1:k 个样本不全来自同一总体 (二)检验步骤(1)把k个样本的观察值混合评秩。如果若干 个观察值相等,则用它们的平均秩赋值。 (2)计算每个样本所得到的秩次和Rj及平均秩 R Rj : Rj ? nj 式中,nj为第j样本(j=1,2,…,k)的容量 。 记n=n1+n2+…+nk,则 的平均值 (即混合 R R 样合总的平均秩次)为:jjR ?1 ?nj?nj Rj ?1 1 ?1 ? n ?n 1 ? n Rj ? X ? ? n n 2 2 (3)计算H 统计量。显然,如果H0成立,则 之 Rj 间的差异就很小,因此考虑用平均等级 的离差平方 Rj 和作为测度H0的核心。因为各样本容量不等,故需采 用加权平均方式计算样本平均等级之间的离差。即:12 H? ?nj R j ? R n?n ? 1???2为了使于计算,通常将此式展开成:5 Rk2 ? 12 ? R12 R2 H? ? ??? ? ? ? 3?n ? 1? n?n ? 1? ? n n2 nk ?k R 1 j ? ? n ? 3?n ? 1? n?n ? 1? j ?1 j2可以证明,H 的抽样分布近似服从于自由度为k-1的 卡方分布,即 H ? ? 2 ? k ? 1。 ? (4)作出检验结论。在给定的显著性水平 a 之 下,若 H ? ? 2 ? k ? 1?,则拒绝H0,认为k个样本来自不同 的总体。 [例12.22] 某教学研究者欲知道不同专业学习后的 统计学考试成绩有无显著差异,在一次统考之后 ,分别从会计、企管、信息、金融四个专业的学 生中随机抽取部分学生统计其成绩,结果如表1222所示,表中名次为学生在全部样本中的总名次。 我们将40学生的成绩按低到高顺序评名次(秩),结 果也列入表12-23中。 n=n1+n2+n3+n4=40 ?R 2j / n j ? = 190.4+9 120.4+2592 ? = H?12 × - 3 ×41 = 9.8717 40 ? 412 2 ? 0.05 (3) = 7.815。因 H = 9.8717 & ? 0.05 (3) = 7.815,故拒绝 H0 ,认为不同专业学生的统计学考试成绩 是有显著差异的。对于研究者而言,下一步的工作 就是寻找这种差异的真正原因。 表12-22样本单位序 号 1 2 3 4 5 6 7 8 9 10 11 12 名次和Rj 样本容量nj 2 会计专业 成绩 名次四个专业统计学考试成绩及名次企管专业 成绩 名次 信息专业 成绩 名次 金融专业 成绩 名次85 90 82 75 60 56 67 79 78 79 80 8129.5 36.5 25.5 15.0 4 3 9 15.0 20 21.5 23 2474 75 76 79 82 45 88 64 68 6113 15.0 18.0 21.5 25.5 1 31.5 7.5 10 592 88 94 76 85 89 90 72 84 8939 31.5 40 18.0 29.5 34.0 36.5 12 27.5 34.076 91 84 55 64 89 71 6238 27.5 2 7.5 34.0 11 6Rj R 2 /n j jR1=226 R2=148 R3=302 R4=144 n1=12 n2=10 n3=10 n4=8 2 2 2 R3 =2 R1 =5 = /n1 =4 256.3333 R2 /n 2 =
/n 3 =9120.4 R 2 /n =25924 4 本章小结1、非参数统计方法,又称为自由分布的方法,它 适用于总体分布形式未知或对总体分布形式知之 甚少的情况下,对总体的某些性质进行统计估计 或假设检验。非参数统计方法的优点在于:可以 广泛地利用各种尺度的变量,不需要参数统计那 么严格的假定,不需要检验总体的参数,且在样 本不大的情况下使用方便。 2、按照样本(变量)的多少及样本之间相关情 况,非参数统计方法可分为:单样本非参数统计 方法、两个相关样本非参数统计方法、两个独立 样本非参数统计方法、多个相关样本非参数统计 方法、多个独立样本的非参数统计方法。单样本 非参数统计方法主要研究某一变量的分布或水平 是否与某一总体的分布或水平一致;两个相关样 本非参数统计方法主要研究某一现象在两种不同 情况下的差异情况,往往通过对两个经过“配对 ”而设置样本;两个独立样本非参数统计方法主 要检验两个独立抽取的样本,是否来自某同一分 布总体(如同一中位数、均值或分布形式等); 多个相关样本非参数统计方法主要研究经过“配 对”的两个以上的变量(样本)的差异情况。多 个独立样本的非参数统计方法主要检验两个以上 的变量(样本)是否来自同一总体。
更多搜索:
All rights reserved Powered by
文档资料库内容来自网络,如有侵犯请联系客服。}

我要回帖

更多关于 两独立样本t检验 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信