二元logistic回归实例,关于结果的求助

对于分类变量,我们知道通常使用卡方检验,但卡方检验仅能分析因素的作用,无法继续分析其作用大小和方向,并且当因素水平过多时,单元格被划分的越来越细,频数有可能为0,导致结果不准确,最重要的是卡方检验不能对连续变量进行分析。使用线性回归模型可以解决上述的部分问题,但是传统的线性模型默认因变量为连续变量,当因变量为分类变量时,传统线性回归模型的拟合方法会出现问题,因此人们继续发展出了专门针对分类变量的回归模型。此类模型采用的基本方法是采用变量变换,使其符合传统回归模型的要求。根据变换的方法不同也就衍生出不同的回归模型,例如采用Logit变换的Logistic回归模型,采用Probit变换的Probit回归模型等,相比之下,Logistic是使用最为广泛的针对分类数据的回归模型。Logistic回归模型的适用条件1.因变量为二分类变量或是某事件的发生率2.自变量与Logit变换后的因变量呈线性关系3.残差合计为0,且服从二项分布4.各观测值之间独立由于Logistic回归模型的残差项服从二项分布而不是正态分布,因此不能使用最小二乘法进行参数估计,而是要使用最大似然法。和其他回归分析一样,Logistic回归也放在分析&回归过程下面,下面我们通过一个例子来说明具体操作收集了一组数据,希望通过这些数据分析出低出生体重儿的影响因素,数据如下
可见,数据集中变量比较多,且数据类型丰富,因变量为二分类变量Low,有两个水平:0-正常体重,1-低出生体重,我们先做一个最简单的单变量Logistic回归,只考虑smoke这个因素分析&回归&二元Logistic回归前面我们只引入了一个自变量,可以看到模型的效果并不理想,而且Logistic回归和传统回归模型一样,也可以引入多个自变量并且可以对自变量进行筛选,尽量引入对因变量存在强影响的自变量,下面我们继续加入自变量并进行筛选
阅读(...) 评论()logistic二元回归分析结果中没有模型的参数拟合结果那个表格,求指教啊就是在结果中缺少分类表和方程中的变量这两个表,求指教哦
韩国棒子3247
可能是你操作有问题我替别人做这类的数据分析很多的
为您推荐:
其他类似问题
扫描下载二维码小木虫 --- 500万硕博科研人员喜爱的学术科研平台
&&查看话题
【求助】关于二分类变量logistic回归分析的预测问题
有高手知道怎么做吗?下图的方程该怎么写呢?
知道的话请加本人QQ
数学建模。。
研究生必备与500万研究生在线互动!
扫描下载送金币
浏览器进程
打开微信扫一扫
随时随地聊科研点击“一起学SPSS”可以订阅哦!“一起学SPSS”原创首发。在医学科学研究中,经常会遇到因变量为二进制(二分法)数据(binary,dichotomous data),如疾病的发生或不发生、治愈或未愈、生存或死亡、取0和1的值等。同时,可能有多个自变量对因变量(或结果变量)产生影响,就可用二元Logistic回归进行分析,这一方法在医学流行病学研究中具有极广泛的应用。例题某医生收集到一些血液病患者的资料,共包含11个变量,各变量的具体含义依次为:sex(性别,1-男,0-女)、age(年龄)、diag(诊断,1-CML,0-非CML)、pilot(预处理,1-TBI、0-非TBI)、gvhd(1-GNHD III~VI,0- GNHD 0~II)、igm(1-IgM阳性,0-IgM阴性)、trans(移植类型,1-P型,0-B型)、yufang(是否采取预防,1-预防,0-未预防)、xz(血症,1-有血症,0-无血症)、JB(疾病,1-患病,0-未患病)、sw(死亡与否,1-死亡,0-存活),试分析是否采取预防措施和巨细胞病毒病的关系。(说明:CML代表慢性粒细胞白血病;TBI代表照射;GVHD代表移植物抗宿主病;JB代表巨细胞病毒病)。1建立数据文件注:在二元Logistic回归中,因变量必须为二进制变量(0,1),阳性结果(如患病、死亡、复发、转移等)为1,阴性结果为0。详见《SPSS 常用统计分析教程 (SPSS 22.0中英文版)(第4版) 》例题数据文件:hemopath.sav2二元Logistic回归结果解释1 模型系数综合检验(Omnibus Tests of Model Coefficients)表,模型卡方值为9.678,P=0.002&0.01,按α=0.05水准,认为yufang(是否采取预防)与因变量jb(巨细胞病毒病)的Logistic回归方程有统计学意义。结果解释2 模型摘要(Model Summary)表,Cox & Snell R方以及Nagelkerke R方检验是回归方程的拟合优度检验,类似于线性回归的R方统计量,其数值大小反映方程对被解释变量变异解释的程度。这两个统计量常用于不同模型之间的比较,R方越大表明模型拟合效果越好。本例的Nagelkerke R方为0.129,Cox & Snell R方为0.173。结果解释3 分类表(Classification Table)列出了观测值(Observed)与预测值(Predicted)的交叉表,参加建模的数据中,结局为“未患病”的判断正确率为77.4%(特异度),结局为“患病”的判断正确率为59.0%(灵敏度),对建模数据总的回判正确率为67.1%,这说明模型的预测效果不错(如果预概率大于50%,预测为良好,反之预测为不好)。结果解释4 1、yufang(是否采取预防)的Wald值为8.758(P=0.0.03<0.01),按α=0.05水准,认为yufang(是否采取预防)与因变量jb(巨细胞病毒病)间的联系有统计学意义B=-1.595,表明的yufang是一个保护因素。2、估计优势比OR(EXP(B))及其95%CI为0.203(0.071,0.584)其95%CI小于1,可认为yufang是一个保护因素,采取预防措施的研究对象患巨细胞病毒病的优势是未采取预防措施的研究对象的0.203倍。小贴士何时需要加权?在四格表中,假如总样本100,四个格子转成SPSS四行即可。但按照软件的要求,每行代表一个样本,需要100行的。也就是说,我们转置四格表的4行,要代表100行的功效。那么就要给每一行加一个权重,看看这4行中的每一行,本来可以代表多少行,权重就是多少。这样加权之后,虽然是4行,却还是起到了100行的效果。@小T《SPSS常用统计分析教程(SPSS 22.0中英文版)(第4版)》已完成印刷,将于2015年8月底上市,可在亚马逊、当当、京东等网上书城购买,大量购买可直接与电子工业出版社发行部联系,广州片区:吴迪,010-;上海片区:魏华,010-。一起学SPSS本订阅号由电子工业出版社2015年8月出版《SPSS 常用统计分析教程 (SPSS 22.0中英文版)(第4版) 》(全国统计教材编审委员会推荐使用教材(2003年第1版))编委会创办,欢迎网友们提出问题、建议、命题作文、提供实例素材、投稿以及统计咨询,我们将不定期推送使用技巧文章,敬请留意!邮箱:共享网盘:/s/1bnDDh2R订阅号:lizh_SPSS医学统计微信群请扫二维码电子工业出版社《SPSS 常用统计分析教程 (SPSS 22.0中英文版)(第4版) 》简介点击下方“阅读原文”查看更多一起学SPSS(lizh_SPSS) 
 文章为作者独立观点,不代表大不六文章网立场
lizh_SPSS本订阅号由《SPSS常用统计分析教程(第4版 22.0中英文版)》(电子工业出版社2015年8月待出版)编委会创办,欢迎提出问题、建议、命题作文、提供实例素材以及投稿,将不定期推送使用技巧文章,敬请留意!热门文章最新文章lizh_SPSS本订阅号由《SPSS常用统计分析教程(第4版 22.0中英文版)》(电子工业出版社2015年8月待出版)编委会创办,欢迎提出问题、建议、命题作文、提供实例素材以及投稿,将不定期推送使用技巧文章,敬请留意!&&&&违法和不良信息举报电话:183-
举报邮箱:
Copyright(C)2016 大不六文章网
京公网安备78文档分类:
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,
下载前请先预览,预览内容跟原文是一样的,在线预览图片经过高度压缩,下载原文更清晰。
您的浏览器不支持进度条
下载文档到电脑,查找使用更方便
还剩?页未读,继续阅读
播放器加载中,请稍候...
该用户其他文档
下载所得到的文件列表SPSS-二元Logistic回归案例分析【参考】.docx
文档介绍:
二元Logistic回归案例分析二元Logistic,从字面上其实就可以理解大概是什么意思,Logistic中文意思为“逻辑”但是这里,并不是逻辑的意思,而是通过logit变换来命名的,二元一般指“两种可能性”就好比逻辑中的“是”或者“否”一样,Logistic回归模型的假设检验——常用的检验方法有似然比检验(likelihoodratiotest)和Wald检验)似然比检验的具体步骤如下:1:先拟合不包含待检验因素的Logistic模型,求对数似然函数值INL02:再拟合包含待检验因素的Logistic模型,求新的对数似然函数值InL13:最后比较两个对数似然函数值的差异,若两个模型分别包含l个自变量和P个自变量,记似然比统计量G的计算公式为G=2(InLP-InLl).在零假设成立的条件下,当样本含量n较大时,G统计量近似服从自由度为V=P-l的x平方分布,如果只是对一个回归系数(或一个自变量)进行检验,则v=1.wald检验,用u检验或者X平方检验,推断各参数βj是否为0,其中u=bj/Sbj,X的平方=(bj/Sbj),Sbj为回归系数的标准误这里的“二元”主要针对“因变量”所以跟“曲线估计”里面的Logistic曲线模型不一样,二元logistic回归是指因变量为二分类变量是的回归分析,对于这种回归模型,目标概率的取值会在(0-1),但是回归方程的因变量取值却落在实数集当中,这个是不能够接受的,所以,可以先将目标概率做Logit变换,这样它的取值区间变成了整个实数集,再做回归分析就不会有问题了,采用这种处理方法的回归分析,就是Logistic回归设因变量为y,其中“1”代表事件发生,“0”代表事件未发生,影响y的n个自变量分别为x1,x2,x3xn等等记事件发生的条件概率为P那么P=事件未发生的概理为1-P事件发生跟”未发生的概率比为(p/1-p)事件发生比,记住Odds将Odds做对数转换,即可得到Logistic回归模型的线性模型:还是以教程“blankloan.sav&数据为例,研究银行客户贷款是否违约(拖欠)的问题,数据如下所示:上面的数据是大约700个申请贷款的客户,我们需要进行随机抽样,来进行二元Logistic回归分析,上图中的“0”表示没有拖欠贷款,“1”表示拖欠贷款,接下来,步骤如下:1:设置随机抽样的随机种子,如下图所示:选择“设置起点”选择“固定值”即可,本人感觉200万的容量已经足够了,就采用的默认值,点击确定,返回原界面、2:进行“转换”—计算变量“生成一个变量(validate),进入如下界面:在数字表达式中,输入公式:rv.bernoulli(0.7),这个表达式的意思为:返回概率为0.7的bernoulli分布随机值如果在0.7的概率下能够成功,那么就为1,失败的话,就为&0&为了保持数据分析的有效性,对于样本中“违约”变量取缺失值的部分,validate变量也取缺失值,所以,需要设置一个“选择条件”点击“如果”按钮,进入如下界面:如果“违约”变量中,确实存在缺失值,那么当使用&missing”函数的时候,它的返回值应该为“1”或者为“true&,为了剔除”缺失值“所以,结果必须等于“0“也就是不存在缺失值的现象点击”继续“按钮,返回原界面,如下所示:将是“是否曾经违约”作为“因变量”拖入因变量选框,分别将其他8个变量拖入“协变量”选框内,在方法中,选择:forward.LR方法将生成的新变量“validate&拖入&选择变量“框内,并点击”规则“设置相应的规则内容,如下所示:设置validate值为1,此处我们只将取值为1的记录纳入模型建立过程,其它值(例如:0)将用来做结论的验证或者预测分析,当然你可以反推,采用0作为取值记录点击继续,返回,再点击“分类”按钮,进入如下页面在所有的8个自变量中,只有“教育水平”这个变量能够作为“分类协变量”因为其它变量都没有做分类,本例中,教育水平分为:初中,高中,大专,本科,研究生等等,参考类别选择:“最后一个”在对比中选择“指示符”点击继续按钮,返回再点击—“保存”按钮,进入界面:在“预测值&中选择”概率,在“影响”中选择“Cook距离”在“残差”中选择“学生化”点击继续,返回,再点击“选项”按钮,进入如下界面:点击继续,再点击确定,可以得出分析结果了分析结果如下:1:在“案例处理汇总”中可以看出:选定的案例489个,未选定的案例361个,这个结果是根据设定的validate=1得到的,在“因变量编码”中可以看出“违约”的两种结果“是”或者“否”分别用值“1“和“0”代替,在“分类变量编码”中教育水平分为5类,如果选中“为完成高中,高中,大专,大学等,其中的任何一个,那么就取值为1,未选中的为0,如果四个都未被选中,那么就是”研究生“频率分别代表了处在某个教育水平的个数,总和应该为489个1:在“分类表”中可以看出:预测有360个是“否”(未违约)有129个是“是”(违约)2:在“方程中的变量”表中可以看出:最初是对“常数项”记性赋值,B为-1.026,标准误差为:0.103那么wald=(B/S.E)2=(-1.026/0.103)2=99.2248,跟表中的“100.029几乎接近,是因为我对数据进行的向下舍入的关系,所以数据会稍微偏小,B和Exp(B)是对数关系,将B进行对数抓换后,可以得到:Exp(B)=e^-1.026=0.358,其中自由度为1,sig为0.000,非常显著1
内容来自淘豆网转载请标明出处.}

我要回帖

更多关于 二元logistic回归 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信