因变量是哑变量的还是多元线性回归哑变量吗

关注今日:55 | 主题:182899
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
【求助】哑变量设置的详细步骤 多元线性
页码直达:
这个帖子发布于6年零86天前,其中的信息可能已发生改变或有所发展。
请教,spss中哑变量设置的详细步骤,用于多元线性回归中,本人将治疗分为不相关的四个组,想将四组设置为哑变量,问题二,等级资料是否需要设置哑变量。
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
在spss中,logistics回归中,有专门的选项来处理需要哑变量化的变量,只需单击“Categorical..”进行设置即可。但是对于多元线性回归就没有那么幸运了。
用computer或recode设置一组哑变量。由于哑变量是一个整体变量,所以进行变量筛选时必须共同进退。因此,讲所有哑变量同一般变量一下直接进行筛选是不对的,会出现一部分变量进入一部分变量未进入的情形。解决的方法是:将同一因素下的哑变量进行归组,在纳入方法中选择了“ENTER”来确保这些哑变量同进同出,而其它连续型变量和二分类变量则归为另一组,纳入方法为STEPWISE。然后在没有纳入这组哑变量的情况下再做一次STEPWISE,再来比较是不是应该纳入这组哑变量。在sas中,哑变量的设置需要另外写程序,但是在回归程序中,则比较简单。eg.因变量y,自变量x1,x2,哑变量组x31 x32 x33,
model y=x1 x2 {x31 x32 x33} /selection=即,把哑变量组用{}括起来就可以了。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园【图文】虚拟变量(哑变量)回归_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
虚拟变量(哑变量)回归
上传于|0|0|暂无简介
大小:1.24MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢小木虫 --- 500万硕博科研人员喜爱的学术科研平台
&&查看话题
spss上logistic回归怎么设置成哑变量
要做一个logistic回归分析,把分类变量转换为哑变量,我知道怎么转换成哑变量,但是不知道spss上如何操作,比如年级有三个值:一年级、二年级、三年级,那就需要设两个虚拟变量:年级1、年级2,以一年级作为对照组,那年级1和年级2同时为0则表示一年级,年级1为1,年级2为0表示二年级,年级1为0,年级2为1表示三年级。
在百度上看到一个例子,
将是否吸烟这个变量放到因变量中,将种族放到自变量中,如图所示,既然定义种族为哑变量,那能直接这样定义吗“1=白人;2=黑人;3=其他种族”
那上面这个对于种族设置的哑变量可以吗?哑变量一般设置的时候是用1,0,-1来表示,它这个不是这样的。
如您所说,如果我在菜单transform---recode into different variables里面去设置哑变量,那么对于我进行logistic回归分析的最终结果和不设置哑变量进行logistic回归分析的最终结果是一样的,只是不设置哑变量的时候,不能得出这三组之间一个详细的比较,对吗?
哑变量设置没啥具体要求,设置成1,2,3都是可以的,不过设置和不设置的结果肯定不一样
这样啊 O(∩_∩)O谢谢
那我从哪一方面应该学习哑变量呢?我从网上查logistic回归分析这一部分,有关哑变量的内容涉及的比较少,没有相关的具体讲解,如果我想深入学习这个,那应该从哪里学习呢?
万分感谢,可以加你QQ吗?我的是
习惯而已,喜欢从零开始,也习惯零作为参考组
研究生必备与500万研究生在线互动!
扫描下载送金币
浏览器进程
打开微信扫一扫
随时随地聊科研线性回归分析中的哑变量
最近偶尔在重温统计学,发现自己工作后用了各种高级的统计分析方法,各种统计模型,却忽视了统计学中一些最基础的知识,而这些知识是所有这些高级方法的基础,基础不扎实,高级方法用起来真觉得底气不足,今天看到哑变量在回归分析中的应用,总结如下:
哑变量(Dummy
Variable),也叫虚拟变量,引入哑变量的目的是,将不能够定量处理的变量量化,如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。
这种“量化”通常是通过引入“哑变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为哑变量(dummy
variables),记为D。
举一个例子,假设变量“职业”的取值分别为:工人、农民、学生、企业职员、其他,5种选项,我们可以增加4个哑变量来代替“职业”这个变量,分别为D1(1=工人/0=非工人)、D2(1=农民/0=非农民)、D3(1=学生/0=非学生)、D4(1=企业职员/0=非企业职员),最后一个选项“其他”的信息已经包含在这4个变量中了,所以不需要再增加一个D5(1=其他/0=非其他)了。这个过程就是引入哑变量的过程,其实在结合分析(conjoint
analysis)中,就是利用哑变量来分析各个属性的效用值的。
在线性回归分析中引入哑变量的目的是,可以考察定性因素对因变量的影响,引入哑变量有两种方式:加法方式与乘法方式。
所谓加法方式是指,哑变量作为单独的自变量,有独立的系数,从几何意义上来讲,就是只改变回归直线的截距(constant),不改变斜率(B);
而乘法方式则正好相反,不改变截距,只改变斜率,因为哑变量在回归方程中不是作为一个独立的自变量,而是与其中某一个自变量相乘后作为一个自变量。
当然,也可以同时使用加法和乘法来引入哑变量,即同时改变截距和斜率。
由于哑变量的取值只有0和1,它起到的作用像是一个“开关”的作用,它可以屏蔽掉D=0的case,使之不进入分析,在spss软件中就是filter的作用。我试验了一下,确实如此。
利用spss软件自带的data:car.sav,分析汽车的功率与100米加速时间的关系,将变量“filter_$”作为哑变量,我们分别run两次线性回归分析,然后对比这2次的结果,来说明上面的想法。
第一次:将哑变量“filter_$”纳入到分析中,同时利用加法和乘法来引入,将“accel”作为因变量,“horse”、“filter_$”、“filter_$*horse”作为自变量,进行线性回归分析;
第二次,利用变量“filter_$”进行筛选case,即不分析filter_$=0的case,同样将“accel”作为因变量,而只将“horse”作为自变量;
两次的线性回归结果分别为:
第一次:accel=20.495-0.049*horse-0.007*"filter_$*horse"+0.738*filter_$
第二次:accel=21.234-0.056*horse
当filter_$=1时,第一次计算的公式正好等于第二次机算的公式。
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。}

我要回帖

更多关于 哑变量在多元线性回归 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信