stata回归结果怎么看为什么在winsor以后不回归了呢?

点击联系发帖人 时间：2017-08-04 19:50

stata导出回归结果

扫二维码下载作业帮
拍照搜题，秒出答案，一键查看所有搜题记录
下载作业帮安装包
扫二维码下载作业帮
拍照搜题，秒出答案，一键查看所有搜题记录
我的回归分析结果.为什么常数项那么大,其他项系数很小.是不是出错了啊
扫二维码下载作业帮
拍照搜题，秒出答案，一键查看所有搜题记录
没有错的常数项的意思是表示当自变量取值都为0时,因变量的取值,这个本身就跟你的因变量取值单位有很大的关系的
为您推荐：
其他类似问题
这得几年级能看的懂啊
扫描下载二维码苹果/安卓/wp
积分 24, 距离下一级还需 21 积分
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡下一级可获得
道具: 显身卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
阅读文献的时候发现会计学的学术文章对于异常值的处理一般采用的是Winsorize和删除两种手段，虽然会用方法但不知道原理是什么？也在网上搜集了一些资料，咨询了博士师兄。资料上说：Note that Winsorization is not equivalent to simply throwing some of the data away. This is because the order statistics are not independent. 博士师兄说：数据少的时候用winsorize，数据多的时候可以删除异常值。是这样吗？希望各位高人能提供权威性的解释谢谢
载入中......
总评分:&学术水平 + 1&
热心指数 + 1&
信用等级 + 1&
本帖被以下文库推荐
& |主题: 69, 订阅: 6
& |主题: 776, 订阅: 205
& |主题: 369, 订阅: 159
, , , , , , ,
本帖最后由 denver 于
22:43 编辑
winsorize是用相应分位数的值替代分位数之外的值，而不是删掉，这样可以最大限度的保存数据信息另外，这个跟数据多少没关系。主要是根据已有文献来的，如果别人用winsorize你也要用，否则你的结论和别人的没有可比性。不过就我看来，至少在金融领域，使用winsorize比较普遍，删除异常值的做法越来越少的被使用了
观点有启发
热心帮助其他会员
热心帮助其他会员
总评分:&论坛币 + 34&
学术水平 + 4&
热心指数 + 4&
Denver大家一起读Paper系列索引贴：
简单的说，一个是缩尾，一个是截尾。
观点有启发
总评分:&论坛币 + 5&
学术水平 + 2&
热心指数 + 2&
信用等级 + 2&
<font color="# 发表于
简单的说，一个是缩尾，一个是截尾。那两种方法对回归结果会产生怎样不同的结果呢？还有什么时候缩尾什么时候结尾？谢谢灰常感谢
12:43:01 上传
winsorized数据
12:42:24 上传
winsorized前的原始数据
谢谢解答！也正有同问。winsorize前后的数据截图见附件。跑程序时发现有意思的现象，winsorize之前的数据回归分析不显著，而winsorize处理后结果就显著了。
无尘第二发表于
谢谢解答！也正有同问。winsorize前后的数据截图见附件。跑程序时发现有意思的现象，winsorize之前的数据回 ...请问winsorize
在Stata中是怎么做的？谢谢
我也想知道应该在stata中怎么做，我也有这个问题需要咨询，谁能来再解释一下啊！
不放弃、不抛弃
碧海潇湘发表于
请问winsorize
在Stata中是怎么做的？谢谢findit winsor
异常值处理，原理大致是将异常值修建成与正常分布最大值or 最小值相同。
eg，如果你的log_size都在20左右，例如在15~20之间区间浮动，有些特别大或特别小的值出现，用winsorize就会把他们变成区间的最大值or最小值。这个“特别大”or“特别小”是你自己可以定义的，如果你认为比20高出10%算作异常值，那么22就会被修改成20，放在样本里。
个人理解，仅供参考~
初级学术勋章
初级学术勋章
初级热心勋章
初级热心勋章
初级信用勋章
初级信用勋章
中级学术勋章
中级学术勋章
中级热心勋章
中级热心勋章
高级学术勋章
高级学术勋章
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向，请联系（010-）；
邮箱：service@pinggu.org
投诉或不良信息处理：（010-）
论坛法律顾问：王进律师君，已阅读到文档的结尾了呢~~
新农保提高农村居民生活水平了吗——基于双向固定效应与断点回归模型的分析
扫扫二维码，随身浏览文档
手机或平板扫扫即可继续访问
新农保提高农村居民生活水平了吗——基于双向固定效应与断点回归模型的分析
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由：
将文档分享至：
分享完整地址
文档地址：
粘贴到BBS或博客
flash地址：
支持嵌入FLASH地址的网站使用
html代码：
&embed src='/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布，请您等待！
3秒自动关闭窗口Stata统计分析常用命令汇总
一、winsorize极端值处理
范围：一般在1%和99%分位做极端值处理，对于小于1%的数用1%的值赋值，对于大于99%的数用99%的值赋值。
1、Stata中的单变量极端值处理：
stata 11.0，在命令窗口输入“findit winsor”后，系统弹出一个窗口，安装winsor模块安装好模块之后，就可以调用winsor命令，命令格式：winsor
var1, gen(new var) p(0.01) 或者在命令窗口中输入：ssc
winsor安装winsor命令。winsor命令不能进行批量处理。
2、批量进行winsorize极端值处理：
打开链接：http://personal.anderson.ucla.edu/judson.caskey/data.html，找到winsorizeJ，点击右键，另存为到stata中的ado/plus/目录下即可。命令格式：winsorizeJ var1var2var3,suffix(w)即可，这样会生成三个新变量，var1w var2w var3w，而且默认的是上下1%winsorize。如果要修改分位点，则写成如下格式：winsorizeJ var 1 var2 var3,suffix(w) cuts(5 95)。
3、Excel中的极端值处理：（略）
winsor2 命令使用说明
简介：winsor2 winsorize or trim (if trim option is specified) the variables in varlist at particular percentiles specified by option cuts(# #). In defult, new variables will be generated with a suffix &_w& or &_tr&, which can be changed by specifying suffix() option. The replace option replaces the variables with their winsorized or trimmed ones.
相比于winsor命令的改进：
(1) 可以批量处理多个变量；
(2) 不仅可以 winsor，也可以 trimming；
(3) 附加了 by() 选项，可以分组 winsor 或 trimming；
(4) 增加了 replace 选项，可以不必生成新变量，直接替换原变量。
*- winsor at (p1 p99), get new variable &wage_w&
sysuse nlsw88, clear
winsor2 wage
*- left-trimming at 2th percentile
winsor2 wage, cuts(2 100) trim
*- winsor variables by (industry south), overwrite the old variables
winsor2 wage hours, replace by(industry south)
1. 请将 winsor2.ado 和 winsor2.sthlp 放置于 stata12\ado\base\w 文件夹下；
2. 输入 help winsor2 可以查看帮助文件；
二、描述性统计
1、summarize
命令格式：su、sum或者summarize [varlist] [if] [in] [weight] [,options]
如果summarize或sum后不加任何变量，则默认对数据中的所有变量进行描述统计 options 选项：detail 表示产生更加详细的统计变量
Separator（n）表示每n个变量画一条分界线，n=0表示禁止使用分界线
Summarize 描述统计输出表中包含：样本容量、平均数、标准差、最小值和最大值
2、tabstat
命令格式：tabstat [varlist] [if] [in] [weight] [,options]
options 选项：stat(statname) 表示设定所需要的统计量
col(stat)或c(s)表示将结果报表转置
mean：平均数
count/n：观测值数目
max/min ：最大值/最小值
range ：极差 sd：标准差
cv：变异系数
semean ：平均标准误差
skewness：偏度var ：方差
kurtosis ：峰度
median/p50：中位数
p# ：#%百分位数
例如：tabstat[varlist],stat(count mean sd median min max range) col(stat)
3、描述性统计结果输出到word或Excel
用sum做的描述性统计：logout, save(miaoshutongji)
word replace:sum
用tabstat做的描述性统计：logout, save(miaoshutongji)
word replace:tabstat
[varlist] ,stat(count mean sd median min max range) col(stat)
分组描述：bysort var:
三、相关性分析
（一）相关性分析
1、Pearson相关系数命令格式：correlate（简写：cor或corr）[varlist] [if] [in] [weight] [,options]
2、spearman相关系数命令格式：spearman[varlist], stats(rho p)
3、在Stata中，命令corr用于计算一组变量间的协方差或相关系数矩阵；
4、命令pwcorr可用于计算一组变量中两两变量的相关系数，同时还可以对相关系数的显著性进行检验；option选项中加上sig可显示显著性水平：pwcorr[varlist] ,sig
5、命令pcorr 用于计算一组变量中两两变量的偏相关系数并进行显著性检验。
6、Spearman 和 Pearson 检验同在一个表的命令：corrtbl[varlist] ,corrvars ([varlist])
输出结果中，上三角为Spearman相关系数和显著水平，下三角为Pearson系数和显著水平。
（二）输出相关系数表到word或Excel中
例如：logout, save(mytable) word replace: pwcorr_a
price mpg rep78 headroom trunk, star1(0.01) star5(0.05) star10(0.1)
四、截面数据单方程线性回归模型的Stata实现
命令格式：regress（简写：reg）depvar indepvars [if] [in] [weigh] [option]
（depvar表示因变量，
indepvars表示自变量）
五、异方差的检验与处理
1、检验异方差命令格式：hettest
2、判断异方差的标准：
看P值的大小来判断，如果P值小于0.05，则不能排除异方差的可能，上图中P值等于0.，因此，可以排除异方差的可能性。
3、处理异方差命令格式：在reg命令后加上“,r”或者“,robust”即可。经异方差处理后的回归不显示调整后的R2（adj-R2），如果要查看调整后的R2，再输入命令：di e(r2_a)
六、多重共线性（自变量之间高度相关）命令格式：vif
（一）判断多重共线性的标准（两个标准必须同时满足）：
1、最大的vif大于10；
2、平均的vif大于1 。
（二）多重共线性的修正
1、采用逐步回归进行修正，命令格式：sw
indepvar, pr(0.05)
2、对于含二次项的，使用“对中”的方法，既可以保留二次项，又可以在一定程度上克服多重共线性的问题：先定义两个变量，分别为该变量减去其均值和该变量的平方，命令如下： sum var
gen var1=var-r(mean)
gen var2=var^2
再用新变量代替原来的变量进行回归处理
七、内生性的检验与处理（内生性是指自变量与误差项之间有关系）
1、内生性的检验：
看P值的大小来判断，如果P值小于0.05，则不能排除内生性的可能，上图中P值等于0.，因此，可以排除内生性的可能。
2、内生性的处理：使用工具变量法：ivreg
内生性的三个来源：测量误差、遗漏变量和双向因果。
1、变量的内生性。
这个是没有办法单独检验的。当有合适工具变量时候，是可以检验的，就是hausman检验
2、工具变量的外生性。
这个也是没办法检验的。当有很多工具变量时候，可以检验是否有不是外生的，就是“过度识别”问题
3、工具变量的相关性。
这个可以说成是“弱工具变量”问题，检验可以通过一阶段的F值。还可以利用Partial R2。
4、估计方法
stata里面有这么几个2sls，2sls smal、liml、gmm，各自适用情况：small适合小样本；liml适合弱工具变量；gmm适合异方差。
webuse hsng2
*Fit a regression via 2SLS, requesting small-sample statistics
ivregress 2sls rent pcturban (hsngval = faminc iregion), small
*Fit a regression using the LIML estimator
ivregress liml rent pcturban (hsngval = faminc iregion)
*Fit a regression via GMM using the default heteroskedasticity-robust weight matrix
ivregress gmm rent pcturban (hsngval = faminc iregion)
*Fit a regression via GMM using a heteroskedasticity-robust weight matrix, requesting nonrobust standard errors
ivregress gmm rent pcturban (hsngval = faminc iregion), vce(unadjusted)
estata firststage ,all forcenonrobust \\\可以查看第一阶段F值，已经partial R2
estat overid \\\查看是否过度识别
estat endogenous \\\查看是否异方差
regress 2sls rent pcturban hsngval
est store m1
ivregress 2sls rent pcturban (hsngval = faminc iregion)
est store m2
hausman m1 m2 \\\内生检验
八、线性方程组的回归分析
命令格式：sureg(depvar1 varlist1)(depvar2 varlist2)…(depvarN varlistN) [if] [in] [weigh]
九、联立方程组
命令格式：reg3 (depvar1 varlist1)(depvar2 varlist2)…(depvarN varlistN) [if] [in] [weigh]
十、面板数据的固定效应和随机效应}

我爱游戏网