哑啥分为什么书

百度拇指医生
&&&普通咨询
您的网络环境存在异常,
请输入验证码
验证码输入错误,请重新输入关注今日:4 | 主题:177615
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
【求助】Logistic回归中在什么情况下需要定义分类协变量(哑变量)
页码直达:
丁香园荣誉版主
这个帖子发布于3年零120天前,其中的信息可能已发生改变或有所发展。
进行Logistic回归时(实际Cox回归同样存在类似问题)SPSS中可以用categorical...来定义分类协变量(哑变量),但是是否所有的属分类变量的协变量都需要在这里进行定义,在网上查了,有些人说只是三个以上的哑变量才需在这里进行定义,两项的不需要定义,那么问题是:1、为什么两项的不需要定义,如有无淋巴结转移,无为0,有为1,处理时如果不按分类协变量处理,是否会不妥?2、将两项的协变量以分类协变量进行logistic回归和不以分类协变量进行logistic回归分析,得出了OR会有较大差异,如何解释,哪个OR值更可靠?请各位老师,高手多多指教,谢谢尤其请 兄们多多指点
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
收起全部有料回复
理论上,分类变量都需要设置哑变量。如地域:江苏、浙江、上海。这时需要设置2个哑变量(n-1,n=3)。“地域(1)”=1,浙江;0,非浙江。“地域(2”)=1,上海;0,非上海。从而得到:
江苏= 0 ,0;
浙江 =1, 0;
上海 =0 ,1。从中可以看出是以江苏作为参照水平,这样进入logistic回归会产生3个变量的参数:地域,地域(1),地域(2)。如图(数据为编造):其中“地域”是地域这个变量的总体参数估计(注意没有B和OR),只有P值。“地域(1)”代表模型中浙江对比参照水平(江苏)的系数,“地域(2)”代表上海相比参照水平的系数。而“地域(1)”和“地域(2)”的差就代表浙江与上海的差异。&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&分割线&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&如果我们不设置哑变量,而是单纯地赋值:江苏=1,浙江=2,上海=3。SPSS 默认将所有的自变量均视作连续性的,如本例,不同地域的变量赋值为1 、2 、3 ,但这仅仅是一个代码而己,并不意味着地域间存在大小次序的关系,即并非代表概率logit (p) 会按此顺序线性增加或减少。即使是有序多分类变量,如家庭收入分为高、中、低三档,各类别间的差距也是无法准确衡量的,按编码数值来分析实际上就是强行规定为等距,这显然可能引起更大的误差。&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&分割线&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&两分类变量也要进行哑变量的设置。只不过两分类是分类变量的特例。因为n=2,故只需设置一个哑变量,在0和1之间。如性别有男女,那么需要设置1个哑变量,“性别”=1,男;0,女。我想,如果我们用二进制的概念去理解哑变量可能会更好一点。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
一个迷途小书童 edited on
从理论上讲,绝对要!!哑铃变量(也就是名义变量)和定量性质的变量是完全不一样的!!!前者指从两个数值出现概率之间的差异为OR倍,后者反而是指两概率之间的差异是OR大小,显然不能完全对等!!!不信,以淋巴结是否转移为例,0 是无转移,1 是有;实际上如果是连续性计数资料,那么反而 0.5 算什么情况,还有理论上都有可能存在的 0.1、0.2、0.3……所以,这就完全不能混用。实际上,个人理解,为什么要把结果变量转变为阿拉伯数字,这主要是早期计算机功能很差,只能这样简化,结果就一直把这个习惯留下来。说真的,对于SPSS来说,直接用实际数值来进行分析,也是完全可以的!!!上述内容,和计算机基础课中数值变量与字符变量两者关系,有点点类似。可以参考联想一下。最后,我所见过的书中,就是两个结果的变量,也必须也设置“哑铃变量”!我想,再看一点logistic原理的书,可能会理解的更好一点的。以上大部分内容是个人理解,若有不对,请指明,多谢。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
理论上,分类变量都需要设置哑变量。如地域:江苏、浙江、上海。这时需要设置2个哑变量(n-1,n=3)。“地域(1)”=1,浙江;0,非浙江。“地域(2”)=1,上海;0,非上海。从而得到:
江苏= 0 ,0;
浙江 =1, 0;
上海 =0 ,1。从中可以看出是以江苏作为参照水平,这样进入logistic回归会产生3个变量的参数:地域,地域(1),地域(2)。如图(数据为编造):其中“地域”是地域这个变量的总体参数估计(注意没有B和OR),只有P值。“地域(1)”代表模型中浙江对比参照水平(江苏)的系数,“地域(2)”代表上海相比参照水平的系数。而“地域(1)”和“地域(2)”的差就代表浙江与上海的差异。&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&分割线&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&如果我们不设置哑变量,而是单纯地赋值:江苏=1,浙江=2,上海=3。SPSS 默认将所有的自变量均视作连续性的,如本例,不同地域的变量赋值为1 、2 、3 ,但这仅仅是一个代码而己,并不意味着地域间存在大小次序的关系,即并非代表概率logit (p) 会按此顺序线性增加或减少。即使是有序多分类变量,如家庭收入分为高、中、低三档,各类别间的差距也是无法准确衡量的,按编码数值来分析实际上就是强行规定为等距,这显然可能引起更大的误差。&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&分割线&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&两分类变量也要进行哑变量的设置。只不过两分类是分类变量的特例。因为n=2,故只需设置一个哑变量,在0和1之间。如性别有男女,那么需要设置1个哑变量,“性别”=1,男;0,女。我想,如果我们用二进制的概念去理解哑变量可能会更好一点。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
一个迷途小书童 edited on
从理论上讲,绝对要!!哑铃变量(也就是名义变量)和定量性质的变量是完全不一样的!!!前者指从两个数值出现概率之间的差异为OR倍,后者反而是指两概率之间的差异是OR大小,显然不能完全对等!!!不信,以淋巴结是否转移为例,0 是无转移,1 是有;实际上如果是连续性计数资料,那么反而 0.5 算什么情况,还有理论上都有可能存在的 0.1、0.2、0.3……所以,这就完全不能混用。实际上,个人理解,为什么要把结果变量转变为阿拉伯数字,这主要是早期计算机功能很差,只能这样简化,结果就一直把这个习惯留下来。说真的,对于SPSS来说,直接用实际数值来进行分析,也是完全可以的!!!上述内容,和计算机基础课中数值变量与字符变量两者关系,有点点类似。可以参考联想一下。最后,我所见过的书中,就是两个结果的变量,也必须也设置“哑铃变量”!我想,再看一点logistic原理的书,可能会理解的更好一点的。以上大部分内容是个人理解,若有不对,请指明,多谢。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 从理论上讲,绝对要!!哑铃变量(也就是名义变量)和定量性质的变量是完全不一样的!!!。。。。。。。。。。。。。以上大部分内容是个人理解,若有不对,请指明,多谢。你的观点我很同意。但是有一点有点狐疑:哑变量(Dummy variable)又称虚拟变量、名义变量、哑元变量。好像没听说过“哑铃变量”,请问哑铃变量有没有这个名词?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
一个迷途小书童 你的观点我很同意。但是有一点有点狐疑:哑变量(Dummy variable)又称虚拟变量、名义变量、哑元变量。好像没听说过“哑铃变量”,请问哑铃变量有没有这个名词?。。。。。这只是一个翻译问题。。。我所见过的资料里,写的就是“哑铃变量”。。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
一个迷途小书童 理论上,分类变量都需要设置哑变量。如地域:江苏、浙江、上海。这时需要设置2个哑变量(n-1,n=3)。“地域(1)”=1,浙江;0,非浙江。“地域(2”)=1,上海;0,非上海。从而得到:
江苏= 0 ,0;
浙江 =1, 0;
上海 =0 ,1。从中可以看出是以江苏作为参照水平,这样进入logistic回归会产生3个变量的参数:地域,地域(1),地域(2)。如图(数据为编造):其中“地域”是地域这个变量的总体参数估计(注意没有B和OR),只有P值。“地域(1)”代表模型中浙江对比参照水平(江苏)的系数,“地域(2)”代表上海相比参照水平的系数。而“地域(1)”和“地域(2)”的差就代表浙江与上海的差异。&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&分割线&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&如果我们不设置哑变量,而是单纯地赋值:江苏=1,浙江=2,上海=3。SPSS 默认将所有的自变量均视作连续性的,如本例,不同地域的变量赋值为1 、2 、3 ,但这仅仅是一个代码而己,并不意味着地域间存在大小次序的关系,即并非代表概率logit (p) 会按此顺序线性增加或减少。即使是有序多分类变量,如家庭收入分为高、中、低三档,各类别间的差距也是无法准确衡量的,按编码数值来分析实际上就是强行规定为等距,这显然可能引起更大的误差。&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&分割线&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&两分类变量也要进行哑变量的设置。只不过两分类是分类变量的特例。因为n=2,故只需设置一个哑变量,在0和1之间。如性别有男女,那么需要设置1个哑变量,“性别”=1,男;0,女。我想,如果我们用二进制的概念去理解哑变量可能会更好一点。谢谢兄弟,我也一直认为应该这样设置,否则以连续变量进行分析,结果肯定是有问题的,但是令我迷惑的是为什么一些教材也不按哑变量进行处理,例如刘润兴编的《医学统计方法与应用》中logistic里的例子中处理就没有把淋巴结有无等分类变量按哑变量进行处理。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
pearzhouq 从理论上讲,绝对要!!哑铃变量(也就是名义变量)和定量性质的变量是完全不一样的!!!前者指从两个数值出现概率之间的差异为OR倍,后者反而是指两概率之间的差异是OR大小,显然不能完全对等!!!不信,以淋巴结是否转移为例,0 是无转移,1 是有;实际上如果是连续性计数资料,那么反而 0.5 算什么情况,还有理论上都有可能存在的 0.1、0.2、0.3……所以,这就完全不能混用。实际上,个人理解,为什么要把结果变量转变为阿拉伯数字,这主要是早期计算机功能很差,只能这样简化,结果就一直把这个习惯留下来。说真的,对于SPSS来说,直接用实际数值来进行分析,也是完全可以的!!!上述内容,和计算机基础课中数值变量与字符变量两者关系,有点点类似。可以参考联想一下。最后,我所见过的书中,就是两个结果的变量,也必须也设置“哑铃变量”!我想,再看一点logistic原理的书,可能会理解的更好一点的。以上大部分内容是个人理解,若有不对,请指明,多谢。谢谢兄弟,我认为您说的是有道理的,我也同意,但我最迷惑的是不知为什么一些教材也不按哑变量进行处理,例如刘润兴编的《医学统计方法与应用》中logistic里的例子中处理就没有把淋巴结有无等分类变量按哑变量进行处理。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
pearzhouq 。。。。。这只是一个翻译问题。。。我所见过的资料里,写的就是“哑铃变量”。。如果是翻译问题,我有点质疑。Dummy做名词有哑巴、赝品、仿制品之意;做adj.有虚拟的、假的之意。因此dummy ariable可翻译为哑变量、虚拟变量。哑铃dumbbell个人认为这样的翻译欠妥。纯探讨!见谅!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
cbchinese 谢谢兄弟,我也一直认为应该这样设置,否则以连续变量进行分析,结果肯定是有问题的,但是令我迷惑的是为什么一些教材也不按哑变量进行处理,例如刘润兴编的《医学统计方法与应用》中logistic里的例子中处理就没有把淋巴结有无等分类变量按哑变量进行处理。二分类变量是特例,设置哑变量也是0和1.一般都是直接赋值0、1的。SPSS里设置哑变量有多种方法。可以用categorical来定义,也可以在变量设置里直接设置几个变量作为哑变量。结果解释时需要注意。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
一个迷途小书童 如果是翻译问题,我有点质疑。Dummy做名词有哑巴、赝品、仿制品之意;做adj.有虚拟的、假的之意。因此dummy ariable可翻译为哑变量、虚拟变量。哑铃dumbbell个人认为这样的翻译欠妥。纯探讨!见谅!呵呵,就当dummy吧,一个名字,只要认识就成了,嘻嘻,谢谢兄弟指点,以后还请多多指导啊
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
pearzhouq 。。。。。这只是一个翻译问题。。。我所见过的资料里,写的就是“哑铃变量”。。没关系的,没办法很多都是国外建的模,知道您指导的是什么,其实就是个名字,怎么译都成
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
回复pearzhouq谢谢啊,以后有问题,还请多多关照,多多指导啊
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
cbchinese edited on
cbchinese 呵呵,就当dummy吧,一个名字,只要认识就成了,嘻嘻,谢谢兄弟指点,以后还请多多指导啊谈不上指点,共同学习进步!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
一个迷途小书童 二分类变量是特例,设置哑变量也是0和1.一般都是直接赋值0、1的。SPSS里设置哑变量有多种方法。可以用categorical来定义,也可以在变量设置里直接设置几个变量作为哑变量。结果解释时需要注意。这个倒是在设置是定义了,但用categorical和不用categorical的结果,即使对二分类变量来说,结果OR值(exp(B))也是不同的,请问能否解释啊。因为这个在解读结果时很重要。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
一个迷途小书童 谈不上指点,共同学习进步!过谦了,能找到你这样耐心解答的兄弟和老师,不是件容易的事
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
pearzhouq 从理论上讲,绝对要!!...pearzhouq兄,是否山水兄因坛子里一些事给气跑了啊,昨晚才看到,损失啊
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
引入哑变量有两种方式:加法方式与乘法方式。所谓加法方式是指,哑变量作为单独的自变量,有独立的系数,从几何意义上来讲,就是只改变回归直线的截距(constant),不改变斜率(B);而乘法方式则正好相反,不改变截距,只改变斜率,因为哑变量在回归方程中不是作为一个独立的自变量,而是与其中某一个自变量相乘后作为一个自变量。我感觉你所说的是有以上原因引起的。个人观点。请指教!&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&山水约定是个热心肠,但是因为一个帖子被气走了。是个损失!
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
cbchinese pearzhouq兄,是否山水兄因坛子里一些事给气跑了啊,昨晚才看到,损失啊偶也是被气走了。。。。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园中级站友
一个迷途小书童 理论上,分类变量都需要设置哑变量。如地域:江苏、浙江、上海。这时需要设置2个哑变量(n-1,n=3)。“地域(1)”=1,浙江;0,非浙江。“地域(2”)=1,上海;0,非上海。从而得到:
江苏= 0 ,0;
浙江 =1, 0;
上海 =0 ,1。从中可以看出是以江苏作为参照水平,这样进入logistic回归会产生3个变量的参数:地域,地域(1),地域(2)。如图(数据为编造):其中“地域”是地域这个变量的总体参数估计(注意没有B和OR),只有P值。“地域(1)”代表模型中浙江对比参照水平(江苏)的系数,“地域(2)”代表上海相比参照水平的系数。而“地域(1)”和“地域(2)”的差就代表浙江与上海的差异。&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&分割线&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&如果我们不设置哑变量,而是单纯地赋值:江苏=1,浙江=2,上海=3。SPSS 默认将所有的自变量均视作连续性的,如本例,不同地域的变量赋值为1 、2 、3 ,但这仅仅是一个代码而己,并不意味着地域间存在大小次序的关系,即并非代表概率logit (p) 会按此顺序线性增加或减少。即使是有序多分类变量,如家庭收入分为高、中、低三档,各类别间的差距也是无法准确衡量的,按编码数值来分析实际上就是强行规定为等距,这显然可能引起更大的误差。&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&分割线&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&两分类变量也要进行哑变量的设置。只不过两分类是分类变量的特例。因为n=2,故只需设置一个哑变量,在0和1之间。如性别有男女,那么需要设置1个哑变量,“性别”=1,男;0,女。我想,如果我们用二进制的概念去理解哑变量可能会更好一点。1、为什么两项的不需要定义,如有无淋巴结转移,无为0,有为1,处理时如果不按分类协变量处理,是否会不妥?如版主所说,看到大量的分析,二分类 都未按分类变量处理?2、将两项的协变量以分类协变量进行logistic回归和不以分类协变量进行logistic回归分析,得出了OR会有较大差异,如何解释,哪个OR值更可靠?这个倒没听说,差距有多大?上传点数据和结果看看?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
anyida05 1、为什么两项的不需要定义,如有无淋巴结转移,无为0,有为1,处理时如果不按分类协变量处理,是否会不妥?如版主所说,看到大量的分析,二分类 都未按分类变量处理?2、将两项的协变量以分类协变量进行logistic回归和不以分类协变量进行logistic回归分析,得出了OR会有较大差异,如何解释,哪个OR值更可靠?这个倒没听说,差距有多大?上传点数据和结果看看????
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园中级站友
一个迷途小书童 ???应该引用 一楼二分类变量,使用两种方法,结果会有很大差距?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
发了半天都是乱码,重发
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
cbchinese edited on
丁香园荣誉版主
anyida05 应该引用 一楼二分类变量,使用两种方法,结果会有很大差距?举例数据库见附件:rar解压后即可不同方法结果不同见附件word文档筛选变量采用Foward:Wald如果设置哑变量,则哑变量对照方法采用系统默认的indicator针对术后是否复发做logistic回归分析三种方法,结果不同方法1、所有变量均不做为哑变量,直接分析,结果如下方法2、将变量除年龄外的胃切除、家族遗传、营养状况、术后化疗均做为哑变量进行分析,结果如下方法3、仅将三分类变量胃切除、营养状况做为哑变量分析,二分类变量家族遗传、术后化疗不做为哑变量分析,结果如下请问各位仁兄和老师,为什么三个结果会不同,我们应该选择哪种方法。该例数据实际来源于统计书《医学统计学与SPSS 软件应用》例13-1,书中采用的是第一种方法,为什么用第一种方法?还请各位仁兄和老师指点。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
一个迷途小书童 引入哑变量有两种方式:加法方式与乘法方式。所谓加法方式是指,哑变量作为单独的自变量,有独立的系数,从几何意义上来讲,就是只改变回归直线的截距(constant),不改变斜率(B);而乘法方式则正好相反,不改变截距,只改变斜率,因为哑变量在回归方程中不是作为一个独立的自变量,而是与其中某一个自变量相乘后作为一个自变量。我感觉你所说的是有以上原因引起的。个人观点。请指教!&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&山水约定是个热心肠,但是因为一个帖子被气走了。是个损失!嗯,那结果不同如何解释,取哪个呢,请指点一下我那个例子,谢谢啊
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
pearzhouq 偶也是被气走了。。。。消消气,不用那么大气,更不要走啊,还需要兄弟给帮忙呢啊
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园中级站友
cbchinese 举例数据库见附件:rar解压后即可不同方法结果不同见附件word文档筛选变量采用Foward:Wald如果设置哑变量,则哑变量对照方法采用系统默认的indicator针对术后是否复发做logistic回归分析三种方法,结果不同方法1、所有变量均不做为哑变量,直接分析,结果如下方法2、将变量除年龄外的胃切除、家族遗传、营养状况、术后化疗均做为哑变量进行分析,结果如下方法3、仅将三分类变量胃切除、营养状况做为哑变量分析,二分类变量家族遗传、术后化疗不做为哑变量分析,结果如下请问各位仁兄和老师,为什么三个结果会不同,我们应该选择哪种方法。该例数据实际来源于统计书《医学统计学与SPSS 软件应用》例13-1,书中采用的是第一种方法,为什么用第一种方法?还请各位仁兄和老师指点。版主, 有没有发现方法2
方法3的结果是一样的呢? 常数项略有不同。每一个自变量的结果一样
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
anyida05 版主, 有没有发现方法2
方法3的结果是一样的呢? 常数项略有不同。每一个自变量的结果一样谢谢,细看一下确实是一样的,您的意思是如果是二分类变量无论做为哑变量还是不做为哑变量的结果都是一样的,非常感谢,我知道了。但第一个如何解读呢?书中用的是第一个结果。是否第一个是不正确的呢?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
anyida05 版主, 有没有发现方法2
方法3的结果是一样的呢? 常数项略有不同。每一个自变量的结果一样嗯,您说的对,细想想确实是这样,二分类变量确实无论是否当哑变量处理结果都是一样的,高手就是高手。另外一个问题不讨论了,我想教材中可能只是考虑数据的处理,而会忽略一些数据处理的合理性吧,钻它那个牛角尖,我就没什么意思了。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园中级站友
胃切除、营养状况
3 分别代表啥?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园中级站友
二楼站友举例的,江苏、浙江、上海
这种,是必须设置哑变量的
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
anyida05 胃切除、营养状况
3 分别代表啥?营养状况好、中、差其实是有序变量,不做哑变量处理,且其他人告诉我这样的好处是可以节省一个自由度,会更准确些,但胃切除1、2‘、3是指切除术式,做有序变量有些牵强,但自由度好像很重要
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
anyida05 二楼站友举例的,江苏、浙江、上海
这种,是必须设置哑变量的谢谢兄弟,经常麻烦你们,经你们指点,我理解和运用深刻多了我现在理解的确实如你所说的,1、如果是二分类变量不用设为哑变量,2、如果是三分类以上的有序变量尽量不设哑变量,这样可以节省自由度,准确度会更高一些,3、非有序变量的三分类以上的变量必须设为哑变量,否则会影响结果。非常感谢各位兄弟的帮助和指点。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园中级站友
cbchinese 谢谢兄弟,经常麻烦你们,经你们指点,我理解和运用深刻多了我现在理解的确实如你所说的,1、如果是二分类变量不用设为哑变量,2、如果是三分类以上的有序变量尽量不设哑变量,这样可以节省自由度,准确度会更高一些,3、非有序变量的三分类以上的变量必须设为哑变量,否则会影响结果。非常感谢各位兄弟的帮助和指点。现在的认识 是这样的;所以对于胃的术式不用,是不是要修正一下
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园荣誉版主
anyida05 现在的认识 是这样的;所以对于胃的术式不用,是不是要修正一下??胃的术式为什么不用当哑变量处理?
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园中级站友
cbchinese ??胃的术式为什么不用当哑变量处理?要用啊。我是讲不用 要修改啊
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园}

我要回帖

更多关于 聋哑人低保申请书范文 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信