当χ2=3.243时,spss怎么统计p值x2值是多少

【图文】3、χ2检验_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
3、χ2检验
上传于||文档简介
&&统​计​学​分​析
大小:2.19MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢如何用spss 计算χ2值及P值-医学统计 急急急!!!_计算吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0可签7级以上的吧50个
本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:339贴子:
如何用spss 计算χ2值及P值-医学统计 急急急!!!
挂机一个月得百万,你还蓝瘦香菇么?
谁会?请帮帮忙
贴吧热议榜
使用签名档&&
保存至快速回贴小木虫 --- 500万硕博科研人员喜爱的学术科研平台
&&查看话题
【求助】求助关于χ2和P值的计算方法
下面这种表的卡方和P只如何计算啊??? 括号里是期望值,外面是观测值
白底的表χ2=122.1; d.f. = 4; P < 0.005,请教计算χ2和P值的详细步骤,多谢!
望大家出手相助,不甚感激。。。
假设两个位点不连锁,那么四个角上的数值应该相当,下面的表四个角上的数左下和右上明显大于其余两个数,可以看出Est1和Ihh2是连锁的,但需要显著性检验,如果P<0.05,说明连锁。下面的表χ2=122.1; d.f. = 4; P < 0.005,能告诉我χ2=122.1是怎么算出来的吗?还有P值?请指教多谢了!
谢谢啊,我按照你的方法算了一遍也是108.4,想再问下计算χ2 值不用括号里的期望值吗?P值怎么算出来呀?
不好意思,这里的不连锁我理解为原假设是Est1和Ihh2是独立的了, 在这种原假设为两个变量独立,并且理论未知的情况下,上面得出108.4的那个统计量是对的.
但就像我刚开始猜的原假设是观测值的分布与理论值(这里的期望值)的分布一样,这种情况下,统计量应为
X=(0-1.9)^2/1.9 + (13-18.2)^2/18.2 + (14-1.9)^2/1.9
Y=(2-8.2)^2/8.2 + (92-77.6)^2/77.6 + (0-8.2)^2/8.2
Z=(8-1.9)^2/1.9 + (9-18.2)^2/18.2& &+ (0-1.9)^2/1.9
X2=X+Y+Z= 122.1
P 值的计算可以根据定义,p-value =1-F4(X2),F为累积函数,见 http://en.wikipedia.org/wiki/Chi-square_distribution中的Cumulative distribution function
这次对了呵呵,但是P值我还是不会算,统计学的太烂了,能给我举例算一下吗?太谢谢你了,是不是算起来很麻烦啊金币要少我可以再给你,多谢了!
兄弟帮帮忙吧,小弟实在是不会用卡方和自由度计算P值。。。先拜谢了~
公式太复杂了看不懂,能帮我算个P值吗?卡方值等于17.3,自由度是4,P值等于多少啊? 再谢兄弟!
研究生必备与500万研究生在线互动!
扫描下载送金币
浏览器进程
打开微信扫一扫
随时随地聊科研常见疾病:
您的位置:
  X2(称卡方)检验用途较广,但主要用于检验两个或两个以上样本率或构成比之间差别的显著性,也可检验两类事物之间是否存在一定的关系。
  一、两个率的比较
  (一)X2检验的基本公式 下页末行的例3.1是两组心肌梗塞病人病死率的比较,见表3.5,其中对照组未用抗凝药。两组病人的病死率不同,抗凝药组为25.33%,对照组为40.8%。造成这种不同的原因可能有两种:一种是仅由抽样误差所致;另一种是两个总体病死率确实有所不同。为了区别这两种情况,应当进行X2检验。其基本步骤如下:
  1.首先将资料写成四格表形式,如表3.6。
  将每个组的治疗人数分为死亡与生存两部分,各占四格表中的一格,这些数字称为实际频数,符号为A,即实际观察得来的数字。
  2.建立检验假设 为了进行检验,首先作检验假设:两种疗法的两总体病死率相等,为35%(即70/200),记为H0:π1=π2。即不论用或不用抗凝药,病死率都是35%,所以亦可以换一种说法:病死率与疗法无关。
  上述假设经过下面步骤的检验后,可以被接受也可以被拒绝。当H0被拒绝时,就意味着接受其对立假设即备择假设H1。此例备择假设为两总体病死率不相等,记为H1:π1≠π2
  因为我们观察的是随机现象,所以无论是接受或拒绝H0都冒有一定风险,即存在着错判的可能性。一般要求,当错误地被拒绝的概率α不超过一定的数值,如5%(或0.05),此值称为检验水准,记为α=0.05。
  3.计算理论频数 根据“检验假设”推算出来的频数称理论频数,符号为T。计算方法如下:假设两总体病死率相同,都是35.0%,那么抗凝血组治疗75人,其死亡的理论频数应为75×35.0%=26.25人,而生存的理论频数为75-26.25=48.75人。用同样方法可求出对照组的死亡与生存的理论频数,前者为43.75人。后者为81.25人。 然后,把这些理论频数填入相应的实际频数格内,见表3.6括号内数字。
  计算理论频数也可用下式(3.4)
  TRC=nRnC/N (3.4)
  式中,TRC为R行与C列相交格子的理论频数,nR为与计算的理论频数同行的合计数,nC为与该理论频数同列的合计数,N为总例数。
  例如;表3.6第一行与第一列相交格子的理论频数(T11)为
  T11= 75×70/200=26.25
  用两种方法计算,结果是相同的。
  4.计算χ2值,计算χ2值的基本公式为:
  X2=∑(A-T)2/t  (3.5)
  式中,A为实际频数,T为理论频数,∑为求和符号。
  将表3.6里的实际频数与理论频数代入式(3.5)即求得χ2值。此例χ2=4.929。
  从式3.5中可看出,实际频数与理论频数之差(A-T)愈小,所得的χ2值就愈小,理论频数是根据检验假设推算出来的,若与实际频数相差不大,说明假设与实际情况符合,于是就接受H0,认为两病死率无显著差别;反之,若(A-T)大,则χ2值亦大,说明假设与实际不符,就拒绝假设,认为两病死率有差别。但χ2值大还是小,要有一个比较的标准,要查χ2值表(附表1),查χ2值表前先要定自由度。
  5.求自由度 自由度是数学上的一个名词。在统计中,几个数据不受任何条件(如统计量,即样本特征数)的限制,几个数据就可以任意指定,称为有几个自由度。若受到P个条件限制,就只有n-p个自由度了。例如在四格表中有四个实际频数,如没有任何条件限制,则4个数字都可任意取值,有4个自由度,当a+b,,c+d,a+c,b+d都固定后,在a、b、c、d四个实际频数中,只能有一个频数可任意指定了,因此,四格表的自由度为1。其计算公式为:
  ν=(R-1)(C-1) (3.6)
  式中,ν为自由度,R为横行数,C为纵列数。
  四格表有2行和2列(注意:总计与合计栏不算在内)。因此ν=(2-1)(2-1)=1。
  6.求P值,作结论 根据自由度查χ2值表(附表1)。此表的左侧ν为自由度,表内数字χ2值,表的上端P是从同一总体中抽得此样本χ2值的概率。三者关系是:在同一自由度下,χ2值越大,从同一总体中抽得此样本的概率P值越小;在同一P值下,自由度越大,χ2值也越大。χ2值与概率P呈相反的关系。χ2检验的常用界值为:
  χ2&χ20.05()P&0.05 在α=0.05水准处接受H0,差别不显著
  χ20.05≤χ2&χ20.01()0.05≥P&0.01 在α=0.05水准处拒绝HO,接受H1,差别显著
  χ2≥χ20.01()P≤0.01 在α=0.01水准处拒绝HO,接受H1,差别显著
  这里α是预定的检验水准。χ20.05()是当自由度为ν时与P=0.05相对应的χ2 值,简称5%点,χ20.01()是与P=0.01相对应的χ2 值,简称1%点。
  当ν=1时,χ20.05(1)3.84,χ20.01(1)=6.63。本例自由度为1,求得χ2=4.929,介于3.84与6.63之间,或写成χ20.05(1)&χ2&χ20.01(1)。由于与3.84对应的纵行P=0.05,与6.63对应的纵行P=0.01,因此与样本χ2=4.929相应的概率介于0.05与0.01之间,写成0.05&P&0.01。在α=0.05水准处拒绝H0,接受H1,两总体率不等。对照组的病死率较抗凝血组高。
  在α=0.05水准处拒绝H0,说明若在同样情况下作100次判断,将有5次或不到5次的机会,将原没有差别的两总体率错判为有差别,或说这样判断犯I型错误的概率不超过5%。
  下面将实例的检验步骤集中列出。
  例3.1 两组心肌梗塞病人的病死率可见于表3.5,其中对照组未用抗凝药。抗凝血组病死率为25.33%,对照组为40.80%,问两组病死率有无显著差别?
表3.5 两组心肌梗塞病人病死率比较
病死率(%)
  检验步骤如下:
  1.将资料列成四格表形式,如表3.6。
表3.6 四格表式样
51(43.75)
  2.H0:两疗法的总体病死率相同,即π1=π2
  H1:两疗法的总体病死率不同,即π1≠π2
  α=0.05
  3.求理论频数
  抗凝血组:
  死亡人数为75×35.0%=26.25人
  存活人数为 75-26.25=48.75人
  对照组:
  死亡人数为125×35.0%=43.75人
  存活人数为 125-43.75=81.25人
  把理论频数填入相对应的实际频数格内,见表3.6括号内数字。
  4.求χ2值 将表3.6里的数值代入式(3.5)得,
  5.求自由度,确定P值,作结论
  ν=(2-1)(2-1)=1,χ2 0.05(1)=3.84,χ2 0.01(1)=6.63,
  本例χ2 =4.929,χ2 0.05(1)&χ2 &χ2 0.01(1),则0.05&P&0.01,在α=0.05水准处拒绝H0,接受H1,即两总体病死率不等,对照组病死率较抗凝血组高。
  上例告诉我们,两个样本病死率一大一小,在未作检验之前,很难说它们两总体率是否有差别,为了作出正确判断,作X2检验。先假设两总体病死率相同,推算理论频数,由实际频数与理论频数计算χ2值,二者相差越大,χ2值也越大。本例得χ2=4.929,根据自由度为1时的χ2分布推断,从同一总体内抽样,出现χ2值等于或大于4.929的概率较小,每一百次中在5次以下,1次以上,因此检验假设被拒绝,而判断为有显著差别。你真的懂p值吗?&#160;| 说人话的统计学
你真的懂p值吗?&#160;| 说人话的统计学
有些东西,完美诠释了「少壮不努力,老大方恨少」(咦好像不是这么背的…),比如统计学知识。更无奈的是,当你意识到统计学的重要想再去自学的时候,已经看不懂书上在说什么了。别担心,一起来看“说人话的统计学”~授权媒体声明:本文为 协和八(微信号pumc08)原创作品,转载请注明来源。作者:张之昊
编辑:粉条儿菜  你真的懂P值吗?  面对文献里五花八门的统计学名词、层出不穷的测试和模型,你是否后悔当年的统计课上不该睡大觉?  辛辛苦苦做了实验收了数据,正想大步迈向SCI高分文章,你是否不知数据分析该如何下手?  投出了文稿,却等来了审稿人对统计方法似是而非的挑刺,你是否不清楚该如何应对?  别担心,你不是一个人在战斗! 
在本系列中,我们将和你一起,探讨最实用、最关键的统计学知识和方法。我们将指出常见的统计学误区和陷阱,回答那些你一直想问但不好意思问的问题。还会在统计学表面的芜杂之中为你阐明最本质的思维方法。我们的目标是,让你拥有一双善用统计学的巧手,和一双能辨清滥用统计学的慧眼。你会发现,成为统计达人也可以很轻松!  1. p值到底是个啥? 
有人说:「统计学就是个p!」此p可不像彼「屁」,可以一放了之。作为假设检验的核心工具,它经常决定着一个发现的价值、一篇论文的成败。你一定忘不了做课题时为p欢喜为p忧的经历:得到p小于0.05时欣喜若狂,得到p大于0.05时灰心丧气。可以,你真的懂p值吗?它到底是什么?  随便翻开一本统计学课本,我们会看到这样的定义:  p值是在假定原假设为真时,得到与样本相同或者更极端的结果的概率。  你的反应多半会是:「说人话!」 
好好好,那咱们来举个例子:假设明天就要宿舍卫生检查了,可同住一屋的蓝精灵和格格巫都不想搞卫生,在一番谦(si)让(bi)之后,格格巫掏出一块看起来很无辜的钢蹦儿,提议这事儿交给老天爷决定:正面蓝精灵做,反面他做。被格格巫坑过或试图坑过不止一次的蓝精灵心想,这钢蹦儿会不会不太对劲,抛出来正反面的可能性不一样大?于是蓝精灵拿到钢蹦儿,跑到墙角自己先抛了五遍,结果傻眼了——五遍都是正面!格格巫的阴谋就这样再一次被挫败了……  这事儿跟p值有半毛钱关系吗?有!  回到刚才你读过的定义上,咱们来细想一下,蓝精灵同学如果学过统计学的话会是怎么考虑的。  首先,本着疑罪从无的原则,善良的蓝精灵假定格格巫的钢蹦儿是均匀的,也就是抛出来正面和反面的概率都是0.5。这就是定义里的「原假设」。  而蓝精灵的「样本」是,抛5次钢蹦儿,得到了5个正面。由于只抛了5次,不可能得到比5次更多的正面了,因此在这个例子里不存在比样本「更极端的结果」。 
那么,什么是「与样本相同」的结果?这取决于蓝精灵是否对这枚钢蹦儿偏向某一边有特定的假设。蓝精灵想起,格格巫提出的办法是如果反面就由他搞卫生,那就应该没有钢蹦儿偏向反面的可能性。所以他认为,要是这块钢蹦儿不均匀,就只可能偏向正面。在这种情况下,「与样本相同的结果」就只有5次正面这一种。 
所以,如果钢蹦儿是均匀的,连抛5次得到都是正面的概率就是0.5的5次方,也就是0.03125,这就是我们所说的p值。换句话说,这种结果得玩儿32次才会出现1次。即使不做这样的计算,蓝精灵从日常生活的经验中,也能感觉到,对于一块均匀的钢蹦来说,得到这样的结果实在不太可能了。与其相信这样的小概率事件真的发生了,我们觉得更合理的解释是这块钢蹦儿根本就不是均匀的。多小的p值算是小?在统计学中,最常用的界线是0.05,因为这个样本对应的p值小于0.05,所以蓝精灵拒绝了原假设,也就是人们常说的「具有统计学意义上的显著性」,认为格格巫拿出了一块偏向正面的钢蹦儿。  好了,现在我们再念一遍p值的定义:  p值是在假定原假设为真时,得到与样本相同或者更极端的结果的概率。  是不是更像一点儿人话了?  之所以费半天劲来解释这一句话,是因为p值的定义中蕴含了显著性检验的基本思维方法,这种思维方法几乎被运用在所有主流的统计学分析之中。对它的准确理解,不仅是通向掌握各种具体的统计学测试的大门,更影响着我们对统计分析结果的解读。  如果你还是觉得有点绕不过来,不妨回忆一下高中数学证明题的大杀器——反证法。在反证法中,为了证明某个命题是错误的,我们首先假设它成立。在这个前提下,我们根据已知条件推导出与此前提或者其他公理、定理相矛盾的结论。由此我们认为,我们的假设一上来就错了。  根据p值进行统计推断的思想跟反证法是一脉相承的。但是,两者有一个关键的区别。由于随机性的存在,在统计推断中,我们无法像在反证法中一样斩钉截铁地认定原假设是错误的,我们只能根据「小概率事件在一次随机实验中不会发生」的原理做出能否推翻原假设的决策。 
回到蓝精灵和格格巫掷钢蹦儿的例子,即便是一块真正均匀的钢蹦儿,也有0.03125的概率连续出现5个正面。蓝精灵之所以能够拒绝认为钢蹦儿均匀,并非因为他确切地知道钢蹦儿有问题,而是他所拥有的数据非常不支持钢蹦儿均匀的假设。换言之,蓝精灵是有可能错怪了格格巫的,只是错怪的可能性足够小而已。 
所以p值到底是个啥?它是基于特定假设和实际样本进行统计推断的一个工具。某种意义上说,p值体现了如果原假设成立,一个人看到样本时的奇怪程度。p值越小,我们获得的样本在原假设成立的前提下越不可能出现。而当p值小到一定程度时,我们不得不认定,我们的前提是错误的,因为可能性这么小的事件实在是太难发生了。  2. p值不是什么? 
如果你看完了上面这个部分,觉得已经看懂了p值的定义,可以把文章关掉了的话,我要高呼一声:且慢!p值是目前科学界广泛使用的主流统计学方法中最重要的一个概念,同时也可能是被误读最多的一个概念。翻开各学科的文献,很容易就发现对p值的错误理解和表述,即便是发表在Nature、NEJM之类最顶级期刊的文章偶尔也不能免俗。所以,弄清楚p值是什么和p值不是什么同样重要。下面,我们就来一起认清楚这些个大坑:  p值不是原假设为真的概率,也不是备选假设为假的概率 
神马?刚才不是说p值很低的时候,拒绝原假设,认为备选假设是真的吗?那难道不是说p值代表原假设有多真吗?不是。这个问题最简单的解释是,对于任何一个假设,它为真的概率都是固定的。然而,我们已经知道p值是根据具体的样本数据计算得出的,同样的实验重复做几次,每次得到不同的样本,p值也自然会有区别。因此,p值不可能是原假设为真或备选假设为假的概率。  如果我们想得再深一点儿,回忆之前我们描述的显著性检验的思维框架,p值越低,样本提供的证据越不支持原假设,低到一定程度的时候我们认为原假设是假的,而备选假设是真的。p值只描述样本与原假设的相悖程度,原假设的真与假是我们以此为根据做出的一个判断。p值并不能描述原假设和备选假设本身为真的概率。  那么说,我们做实验收数据做分析忙活儿了半天,却依然不能知道我们的假设具体有多大可能是真的?很遗憾,对这个问题的回答是肯定的。我们今天所广泛使用的一整套统计推断和假设检验方法及其思想体系(被称为「频率学派」),是由活跃于上世纪的英国统计学家费希尔开创的。p值能做的,就是在特定的零假设条件下对数据特征进行分析。但是,我们如果要对这些假设本身作出判断,光凭数据本身还不够,我们还需要了解现实世界中除了我们感兴趣的假设以外其他假设存在的概率。实际上,假设成立与否的概率是统计学科中另一个近年来日渐受到重视的流派——贝叶斯学派——试图解决的问题,也有不少统计学家呼吁科学界应当用贝叶斯方法补充甚至替代如今以p值为中心的方法。这些已经远远超出今天的主题,我们暂时就不展开讨论了。  p值并不能代表你所发现的效应(或差异)的大小 
正如我们说过的,p值只关心数据与原假设之间有多不一致。但是,如果某种效应或差异存在,p值并不能准确地告诉我们效应的大小,更不能告诉我们这效应是否具有实际意义。比如说,我们开发了一种降血压药物。在临床试验中,我们比较受试者在服药前后血压的降低,得到了p值小于0.05的显著结果。这意味着什么呢?我们可以有信心地认为,这种药物能够降低受试者的血压。但是,光从p值中,我们无法知道药物到底能使血压降低多少。事实上,也许药物仅仅能够使受试者的血压降低微乎其微的程度(如2mm/Hg),如果我们有足够多的受试者,我们同样能够得到很小的p值,但是这样的效应并没有显著的临床意义,也没有实际的商业价值。  因此,在科学文献中,当我们报告统计测试的结果时,不能仅仅给出p值,还需要给出相应的效应大小(取决于具体的测试,比如均值的差、回归系数、OR值等)及其置信区间,这样才能使读者更全面、准确地评估研究发现的意义。  为什么是0.05? 
我们前面提到,在显著性检验中,当p值小到一定程度时,我们就认为原假设不成立。可是为什么这条线就划在了0.05这里?这个问题有一个很无趣的答案:这是费希尔老爷子随口一说的。为了避免像错怪格格巫一样的错误,我们希望尽可能保守一些,因此显著性的界限也应该比较小。但是另一方面,这个界限也不能太小,不然社会投入到科研的资源无法满足能得到显著性结果的样本量。  费希尔的随口一说之中似乎也包含了某种神奇的直觉。有学者提出,对于过去近百年中生物医学和社会科学(运用统计学方法最普遍的学科)研究中常见的效应大小和样本量而言,0.05这个界限恰好在任何实验都做不出显著性结果和假阳性发现满天飞之间找到了一点微妙的平衡。当然,科学研究在不断地发展,当代的许多新领域(如基因组学)中的海量数据和测试已经对0.05这条金标准作出了挑战,统计学家也发展出了新的对策。这里我们先按下不表,在后续文章中将会一一道来。  另外,0.05的存在也是「前计算机时代」的一个历史遗留产品。九十年代以前,计算机和统计软件还没有被广泛使用,人们进行统计学分析时,往往需要借助统计学表格,把根据样本算出的统计量与表格中的临界值进行比较。由于篇幅所限,表格自然不能列出所有的p值,因此当时的人们都倾向于报告p&0.05的结果。随着统计软件的流行,如今获得精确的p值已不是难事,人们也不再采用这样模糊的表述了。但是0.05这个门槛儿却成为了一种文化,被科学界保留了下来。  参考资料:  1. Reinhart, Alex. 'Statistics done wrong.' (2014).  2. Nuzzo, R. (2014). Statistical errors. Nature, 506(7487), 150-152.  3. Anonymous. “Why P=0.05?” /lhsp/p05.htm 
发表评论:
TA的最新馆藏}

我要回帖

更多关于 outreg2 p值 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信