固定效应 随机效应存在异方差怎么办?robust就可以了吗

导读:较多。随机效应的存在使得OLS估计是一致但无效的。可使用广义最小二乘法(FGLS)来进行估计。也可以使用组间估计量(BE)用豪斯曼检验选择是选用固定效应模型还是随机效应模型,如果统计量大于零界值,则拒绝假设。如果假设成立,RE最有效,但是不适用于异方差的情形。解决方法是自助法和辅助回归。非平衡面板经常会损失数据,导致破坏样本的随机性。xtsetpanelva 较多。 随机效应的存在使得OLS估计是一致但无效的。可使用广义最小二乘法(FGLS)来进行估计。也可以使用组间估计量(BE) 用豪斯曼检验选择是选用固定效应模型还是随机效应模型,如果统计量大于零界值,则拒绝假设。如果假设成立,RE最有效,但是不适用于异方差的情形。解决方法是自助法和辅助回归。 非平衡面板经常会损失数据,导致破坏样本的随机性。 xtset panelva timevar
(设定面板数据的面板个体变量和时间变量) encode country, gen (cntry)
(为面板个体编号使得面板个体为整数) 显示面板数据统计特征: xtdes
(显示面板数据结构,是否为平衡面板) xtsum
(显示组内、组间和整体的统计指标) xttab varname
(显示组内、组间与政体的分布频率) xtline varname
(对每个个体分别显示该变量的时间序列图,如果希望叠放,则选择overlay) reg y x1 x2 x3, vce (cluster id)
(混合回归,VCE是以id为cluster的聚类稳健标准差,因为同一地区不同时间扰动项之间一般存在自相关。) VCE是考虑到了同一聚类之间的同方差现象。 xtreg Y X1 X2 X3, fe vce (cluster id)
(使用固定效应模型回归) 得到的回归中rho表示来自个体效应ui的比例。 Xtreg YX1 X2 X3, fe
中的F检验通过,则可以使用混合回归模型。若拒绝假设(p小),则FE更优,每个个体都有自己的固定效应。但此时的由于没有使用稳健回归,因此F检验并不有效,还需要进一步用LSDV法观察。 LSDV法的stata命令为: xi: xtreg y x1 x2 x3 i.id, vce(cluster id)
(xi为增添互动项interaction expansion,i.id表示根据确定个体变量id生成的虚拟变量,在这里是state) (P小,则说明个体虚拟变量很显著,因此,不满足无个体效应的假设,则不能用混合回归模型。) 对于固定效应模型,也可以用一阶差分法FD的命令: xtserial y x1 x2 x3, output
(我的stata不能识别xtserial 咋回事?)一般认为FE比FD有效,故较少使用FD。 也可以在固定效应中考虑时间效应,即双向固定效应: tab year gen(year)
定义年度虚拟变量 xtreg YX1 X2 X3 year2-year7, fe vce (cluster id)
(明明是stata12,为什么说数据太多不能计算?要把前面的计算保存等清空,那后面怎么对比?) test year1 year2 year3。。year7
对年度虚拟变量的联合检验为 检验存在时间效应和固定效益后,还可能存在随机效应,对随机效应进行检查: xtreg y x1 x2 x3, re vce (cluster id)
(随机效应FGLS) xtreg y x1 x2 x3, mle
(随机效应MLE) 检验个体随机效应存在一个LM检验,需要在随机效应估计之后进行: Xtreg fatal spircons unrate perinc beertax, re vce (cluster, state) estimates store RE xttest0
如果P很小,则拒绝假设,认为在“随即效应”与“混合回归”之间,应该选择“随即效应”。
如果数据质量不好,可以考虑使用组间估计量,但会损失较多信息量。 reg y x1 x2 x3, be estimates store BE
选用固定效应模型还是随机效应模型运用豪斯曼检验 xtreg y x1 x2 x3, fe estimates store FE xtreg y x1 x2 x3, re estimates store RE hausman FE RE, constant sigmamore P小,则强烈拒绝使用随机效应模型,而应采用固定效应模型。 但是如果聚类稳健标准差和普通标准差相差较大,则传统的豪斯曼检验并不适用。这时需要进行辅助回归。
目前在stata中需要手动进行。步骤如下: quietly xtreg fatal beertax spircons unrate perinck, re scalar theta=e(theata)
(从回归中得到THETA) global yandxforhausman fatal beertax spircons unrate perinck
(使用yandxforhausman时,代表了所有使用的变量) foreach x of varlist $yandxforhausman{ by state: egen mean ‘x’=mean(‘x’)
到底用什么表示? gen md‘x’=‘x’-mean‘x’ gen red‘x’=‘x’-theata*mean‘x’ } quietly xtreg redfatal redbeertax redspircons redunrate redperinck mdbeertax mdspircons mdunrate mdperinck, vce(cluster state) test mdbeertax mdspircons mdunrate mdperinck 检验发现P小,则拒绝r=0的假设,应该选用固定效应模型。 (疑问:那中间那个式子呢?) 面板数据在回归之前要通过平稳性检验,其处理步骤简化为:面板数据单位根检验―协整检验―回归。一般为了方便,采用相同单位根检验LLC检验和不同单位根检验Fisher-ADF检验(非面板数据一般采用ADF检验)。两种检验均拒绝存在单位根的元假设,则认为序列平稳。
13.长面板和动态面板(不能像短面板那样假定独立同分布,而应该运用广义最小二乘法FGLS进行估计,解决组内和组间的自相关。)
解释变量包含被解释变量的滞后项,则为动态面板,反之为静态面板。 (1)仅解决组内自相关的FGLS
tab state, gen(state)
考虑个体效应,生成州虚拟变量。
gen t=year-1962
考虑时间趋势,生成时间趋势变量
reg Y X1 X2 X3 State2-state10 t, vce(cluster state)
用LSDV估计双向固定效应模型
estimates store OLS
考虑组内自相关的情形:用命令stpcse
stpcse Y X1 X2 X3 state2-state10 t, corr(ar1)
约束条件为自回归系数都相同的一阶。
考虑各组自回归系数不同的组内自相关情形
stpcse Y X1 X2 X3 state2-state10 t, corr(psar1)
如果仅考虑不同个体扰动项存在异方差而忽略自相关,则可以用 stpcse Y X1 X2 X3 state2-state10 t, hetonly 将以上各估计的系数及标准差列表便于比较: 究竟应该采用OLS还是采用AR1,则需要检验自相关。 (2)同时处理组内自相关和组间同期相关的FGLS的命令 xtgls
xtgls Y X1 X2 X3state2-state10 t , panels(iid/het/cor) corr(ar1/psar1)
iid表示不同个体(组间)的扰动项独立且具有相同的方差,het表示不同个体的扰动项独立但具有不同的方差,cor表示不同个体的扰动项同期相关且具有不同的方差。Corr表示组内,解释同前。如果加上igls则表示用的迭代FGLS,而非两步FGLS.
若执行xtgls或者xtpcse时没有使用个体虚拟变量,则为随机效应模型,若使用了则为固定效应模型。 (3)长面板数据自相关和异方差检验
组间异方差检验,运用似然比检验 Xtgls Y X1 X2 X3, igls panel(het)
(允许异方差的迭代式FGLS估计) Estimates store hetro (将异方差条件下的估计结果储存为hetero) Xtgls y x1 x2 x2, igls
(同方差条件下的FGLS) Estimates store homo
(将同方差条件下的估计结果储存为homo) local df = e(N_g)-1
(计算自由度,即约束条件个数,其中e(N_g)为个体个数)
lrtest hetero homo, df(‘df’)
(制定自由度,进行似然比检验。)
符号到底是怎样的?
P=0,则强烈拒绝LR检验的“组间同方差”假设。
另一种检验组间异方差的方法为xttest3,只能在xtreg,fe 或者xtgls之后使用:
Ssc install xttest3(安装命令“xttest3”)
(进行组间异方差检验)
这个超级简单~~
组内自相关检验 通过下载命令xtserial来实现这个检验
net install st0039
(安装命令stserial)
为什么下不了?
xtserial y x1 x2 x3, output
(进行组内组相关检验,若P小,则强烈决绝不存在一阶组内自相关的假设。)
组间截面相关检验:非官方xttest2。其仅能在xtgls,ivreg2,和xtreg,fe后使用,且能用于场面版 ssc install xttest2
(安装xttest2)
(组间截面相关检验)
当这一种方法无法检验时,可以采用另一种方法,xtcsd命令,长短面板都能用,用在fe之后?
ssc install xtcsd
(安装命令“xtcsd”)
xtcsd, pesaran abs show
(pesaran的检验,服从正态分布)
xtcsd, friedman abs show
(friedman的检验,服从喀方分布)
xtcsd,frees abs show
(frees的检验)
对于长面板除了可以让不同个体拥有不同的截距项外还可以使其拥有不同的斜率,这成为“变系数模型”,如果其系数为常数,则可分别回归,但如果各个体扰动项相关,则应该把所有个体回归方程叠放,然后使用“似不相关回归”(SUR),但由于参数估计较多,会损失自由度。如果考虑“部分变系数模型”,则SUR不再适用,而应用LSDV法,引入虚拟变量,以及虚拟变量与可变细数解释变量的互动项(参见help xi) 如果将系数看作是随机的,则FGLS估计模型,即利用OLS残差估计协方差矩阵中的参数,然后再使用GLS,命令为: Xtrc y x1 x2 x3, betas
(betas表示显示对每一组系数的估计),其附带参数稳定性检验 虽然面板数据能在一定程度上解决遗漏变量问题,但如果存在内生解释变量,还是需要用工具变量法,先解决遗漏问题,再使用2SLS 对于动态面板,就算是组内估计量(FE)也是不一致的。 差分GMM和水平GMM结合就成了系统GMM估计。 差分GMM的stata命令为: xtabond depvar [indepvars], lags(p) maxldep(q) pre(varlist) endogenous (varlist) inst(varlist) twostep vce(robust) 如:xtabond lwage occ south smsa ind, lags(2) maxldep(3) pre(wks, lag(1,2)) endogenous(ms, lag(0,2)) endogenous(union, lag(0,2)) twostep vce(robust) 差分GMM存在的前提是扰动项不存在自相关,对此要进行检验,需要扰动项的差分不存在二阶或更高阶自相关即可。 命令为: estat abond ,p小,则存在自相关,P大,则不存在自相关。 更高阶自相关的检验为: estat abond artests(3) 由于使用过多的工具变量,还需要进行过度识别检验 先回归,但要去掉最后的vce(robust) estat sargan 系统GMM的stata命令为: xtdpdsys depvar[indepvars], lags(p) maxldep(q) pre(varlist) endogenous(varlist) inst(varlist) twostep vce(robust) 若要对比差分GMM和系统GMM的系数和标准差,则用命令: estimates table DGMM SGMM, b se
14.离散被解释变量(通常不适合用OLS,而应该用二值模型,probit logit和多值选择模型)
如果F为标准正态的累积分布函数,则P模型为Probit模型,若F为逻辑分布的累积分布函数,则P模型为Logit模型。计算Logit模型通常比Probit模型更方便。 二值模型的Stata命令为: probit y x1 x2 x3 logit y x1 x2 x3 probit 和logit 的分布函数不同,因此参数不能直接比较,需要分别计算二者的边际效应,再进行比较,STATA进行处理的命令为: mfx
(计算在样本均值处的边际效应) mfx, at(X1=0)
(计算在X1=0时,X2,X3取值样本均值处的边际效应) mfx, eyex
(计算在样本均值处的弹性) predict yhat (计算发生概率的预测值,并记为yhat),对于Logit模型,系数表示解释变量x增加一个单位将引起的“对数几率比”的边际变化。 衡量二值模型的拟合优度采用“准R2”,判断拟合优度还可以通过计算预测准确的百分 比,相应STAT命令为: estat clas logti 和probit模型虽然估计系数不同,但其估计系数没有可比性,其mfx计算出的边际效应及准R2与正确预测比几乎一致。 如果接受似然比检验(LR),则可用同方差probit模型估计。在存在异方差的情况下进行probit模型估计为: hetprob Y X1 X2 X3, het(varlist)
那自相关呢?
多值选择模型: 多值选择模型的stata命令为: mlogit Y X1 X2 X3, base(#)
(多值logit选择模型,base(#)用来指定参照组) mlogit Y X1 X2 X3, rrr base(#)
(多值logit选择模型,回报relative risk ratio) mprobit Y X1 X2 X3, base(#)
(多值probit选择模型) 排序数列模型的stata命令:ordered probit/logit oprobit Y X1 X2 X3 ologit Y X1 X2 X3 oprobit 预测:predict p2 p3 p4 p5 列出第一个观测值的预测结果: list p2 p3 p4 p5 in 1/1
, ologit 预测:predict r2 r3 r4 r5 列出第一个观测值的预测结果: list r2 r3 r4 r5 in 1/1
, 计数模型 (1)有些被解释变量仅能取非负整数,如金牌数量,看病次数等,一般用泊松回归。Stata命令为 poisson y x1 x2 x2, r
(稳健标准差) estat gof
(goodness of fitnes拟合优度检验) 泊松回归的局限是其期望和方差一定相等,但有些被解释变量的方差明显大于期望,即存在“过度分散”,则可以考虑“负二项回归”(negative binomial regression),使用MLE估计。Nbreg y x1 x2 x2, r 如果计数数据中含有大量的零值,则可以使用“零膨胀泊松回归”。这可以Vuong统计量来检验,如果Vuong统计量很大,则选择零膨胀泊松回归或者零膨胀负二项泊松回归。 零膨胀泊松回归的stata命令为: zip y x1 x2 x3, inflate(varlist) vuong
(零膨胀泊松回归) zipnb y x1 x2 x3, inflate(varlist) vuong
(零膨胀负二项回归)
15.受限制的被解释变量(断尾回归、截取回归)
断尾回归stata命令:
truncreg y x1 x2 x3, ll(#)
(左边断尾) truncreg Y X1 X2 X3, ul(#)
(右边断尾) truncreg Y X1 X2 X3,ll(#)ul(#)
(双边断尾) 截取回归stata命令: tobit模型
tobit y x1 x2 x3, ll(#) 包含总结汇报、人文社科、资格考试、专业文献、考试资料、文档下载、教学研究、word文档、办公文档、经管营销以及stata笔记等内容。本文共3页
相关内容搜索【图文】异方差性的概念、类型、后果、检验及其修正方法(含案例)_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
异方差性的概念、类型、后果、检验及其修正方法(含案例)
&&关于异方差性的教学课件PPT
大小:675.50KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢sunnyloverainy
%&取消单词断字
\tolerance=1
\emergencystretch=\maxdimen
\hyphenpenalty=10000
\hbadness=10000
%LaTeX指定断字
这个命令告诉LaTex,hyphenation只能从标有短横线(-)的地方断开。
\hyphenation{hy-phen-a-tion}
mdesc看缺漏值
fsum变量描述性统计和标签
pwd看当前工作路径
pwcorr_a相关系数矩阵
*&将第1行设置为变量标签labone ,nrow(1)*将第1、2行设置为变量标签labone&,nrow(1 2)
2.selenium库
3.chromedriver
sudo python {把pip-9.0.1文件夹下的setup.py拖进终端} install
sudo easy_install selenium 多试几次就成功
sudo pip install -U selenium 可能不成功
下载chromedriver(/a/chromium.org/chromedriver/downloads)
解压后添加后缀.exe,然后在finder里面前往文件夹bin/usr拖进去
driver&= webdriver.Chrome(executable_path=&/usr/bin/chromedriver.exe&)
PSM 主要是能够找到配对对象,计算出的 ATT 克服了样本选择偏误。对于 DID 而言,它主要是为了分离时间效应和政策效应,要求至少要有两期的数据(PSM&并无此要求),以便能够对比政策实施前后的变化。然而,在对比过程中,要求 treat 组和 control 组的特征尽可能相近,以保证两组的时间效应相同,而这恰恰是 PSM 擅长的事情。因此,在评价那些需要一定时间才能产生效果的政策时,会倾向于采用 PSM+DID,但要求数据至少要有两期。
twoway (scatter y x)(lfit y x)
异方差的检验:&&&&
Breusch-Pagan test in STATA:
其基本命令是:estat hettest var1 var2 var3其中,var1 var2 var3 分别为你认为导致异方差性的几个自变量。是你自己设定的一个滞后项数量。&&
同样,如果输出的P-Value 显著小于0.05,则拒绝原假设,即不存在异方差性。&&
White检验:&&
其基本命令是在完成基本的OLS 回归之后,输入&&
imtest, white如果输出的P-Value 显著小于0.05,则拒绝原假设,即不存在异方差性&&
&处理异方差性问题的方法:&&
方法一:WLS&&
WLS是GLS(一般最小二乘法)的一种,也可以说在异方差情形下的GLS就是WLS。在WLS下,我们设定扰动项的条件方差是某个解释变量子集的函数。之所以被称为加权最小二乘法,是因为这个估计最小化的是残差的加权平方和,而上述函数的倒数恰为其权重。&&
在stata中实现WLS的方法如下:&&
reg (被解释变量)&(解释变量1)&(解释变量2)……&[aweight=变量名]&&
其中,aweight后面的变量就是权重,是我们设定的函数。&&
一种经常的设定是假设扰动项的条件方差是所有解释变量的某个线性组合的指数函数。在stata中也可以方便地实现:&&
首先做标准的OLS回归,并得到残差项;&&
reg (被解释变量)&(解释变量1)&(解释变量2)……predict r, resid&&
生成新变量logusq,并用它对所有解释变量做回归,得到这个回归的拟合值,再对这个拟合值求指数函数;&&
gen logusq=ln(r^2)reg logusq (解释变量1)&(解释变量2)……predict g, xbgen h=exp(g)&&
最后以h作为权重做WLS回归;&&
reg (被解释变量)&(解释变量1)&(解释变量2)……&[aweight=h]&&
如果我们确切地知道扰动项的协方差矩阵的形式,那么GLS估计是最小方差线性无偏估计,是所有线性估计中最好的。显然它比OLS更有效率。虽然GLS有很多好处,但有一个致命弱点:就是一般而言我们不知道扰动项的协方差矩阵,因而无法保证结果的有效性。&&
方法二:HC SE&&
There are 3 kinds of HC SE&&
(1)Huber-White Robust Standard Errors HC1,&其基本命令是:&&
reg var1 var2 var3, robust&&
White(1980)证明了这种方法得到的标准误是渐进可用(asymptotically valid)的。这种方法的优点是简单,而且需要的信息少,在各种情况下都通用。缺点是损失了一些效率。这种方法在我们日常的实证研究中是最经常使用。&&
(2)MacKinnon-White SE HC2,其基本命令是:&&
reg var1 var2 var3, hc2&&
(3)Long-Ervin SE HC3,其基本命令是:&&
reg var1 var2 var3, hc3&&
约束条件检验:&&
如果需要检验两个变量,比如x 与y,之间系&&
数之间的关系,以检验两者系数相等为例,我们可以直接输入命令:&&
test x=y&&
再如检验两者系数之和等于1,我们可以直接输入命令:&&
test x+y=1&&
如果输出结果对应的P-Value 小于0.05,则说明原假设显著不成立,即拒绝原假设。&&
序列相关性问题的检验与处理&&序列相关性问题的检验:&首先,要保证所用的数据必须为时间序列数据。如果原数据不是时间序列数据,则需要进行必要的处理,最常用的方法就是:&gen n=_n tsset n 这两个命令的意思是,首先要生成一个时间序列的标志变量n(或者t 也可以);然后通过tsset 命令将这个数据集定义为依据时间序列标志变量n定义的时间序&&
列数据。&最直观的检验方式是通过观察残差分布,其基本步骤是在跑完回归之后,直接输入&Predict error, stdp 这样就得到了残差值;然后输入命令:&plot error n 会得到一个error 随n&变化的一个散点图。&&
D-W检验——对一阶自相关问题的检验:&D-W检验是对一阶自相关问题的常用检验方法,但是如果实际问题中存在高阶序列相关性问题,则不能用这个检验方法。&D-W 检验的命令如下:&首先,输入回归命令,&reg Variable1 Variable2 Variable3…VariableM 输出一个简单的OLS估计结果。然后,再输入命令:&&
dwstat 这时会输出一个DW &统计量。通过与临界值之间的比较,可以得出结论。也可以执行如下命令&&
estat durbinalt &&
直接进行Durbin检验。&&Breusch-GodfreyTest in STATA——检验高阶序列相关性:&在得到一个基本回归结果和error 之后,我们假设这样一个关系:&et =&α0&+&α1 et-1 +&α2 et-2 …+&αk et-p +&β1 x1t +&β2 x2t …&+βk xkt +εt&BG &检验的原假设是:H0&&:&&α1&=&α2&=&…&αp&=0。&其基本命令是:&bgodfrey , lags(p)&其中p &是你自己设定的一个滞后项数量。如果输出的p-value&显著小于0.05,则可以拒绝原假设,这就意味着模型存在p &阶序列相关性;如果输出的p-value&显著大于0.05 &甚至很大,则可以接受原假设,即不存在p&&阶序列相关性。&&&
处理序列相关性问题的方法——GLS:&常用的几种GLS &方法:&(1) Cochrane-Orcutt estimator 和Prais-Winsten estimator 其基本命令是&prais var1 var2 var3, corc (2) Newey-West standard errors 其基本命令是&newey var1 var2 var3, lag(3)&其中,lag(3)意思是对三阶序列相关性问题进行处理;如果需要对p &阶序列相&&
关性问题进行处理,则为lag(p)&&&
t因变量,g,f,c是自变量,_26存放了弟26个观测值,为需要预测的值&&
reg t g f c if _n!=26&&
predict taxpredict if _n==26&&
均值的区间预测&&
predictnl py=predict(xb),ci(lb ub) l(95)&&
因变量的区间预测&&
adjust g= f=24649.95 c=99.9,stdf ci level(95)&&
Hausman检验是检验内生性的最常用的方法。它是通过比较一致估计量与有效估计量的Wald统计量。命令格式为:&&
&&.hausman name-constistent [name-efficent]&[,options]&&
其中,name-cosistent指一致估计的结果, name-efficent 指有效估计的结果。注意,一致、有效估计量的先后顺序不能改变。&&
Option选项:&&
constant &计算检验统计量将常数也包括在内,默认值为排除常数allegs 利用所有方程进行检验,默认只对第一个方程进行检验skipeqs(eqlist) eqlist只能以方程名称而不能以方程序号表示equation(matchlist)&比较设定的方程。force 即使假设条件不满足仍进行检验df(#)&默认值为一致估计与有效估计的协方差矩阵的差的估计sigmamore 协方差矩阵采用有效估计量的协方差矩阵sigmaless &&协方差矩阵采用一致估计量的协方差矩阵tconsistent(string)&&一致估计量的标题tefficient(string)&有效估计量的标题&&
工具变量估计命令格式:.ivregress esitimator depvar [varlist1]&[varlist2=varlist_iv]&[if]&[in]&[weight][,options]其中,estimator包括2sls,gmm,liml三种。varlist1为模型中的外生变量,varlist2为模型中的内生变量,varlist_iv为模型中的工具变量。&&
Nonconstant &不包括常数项Hascons &用户自己设定常数项CMM 选项:& wmatrix(wmtype)& robust,cluster clustvar,hac kernel, unadjusted& center &权数矩阵采用中心矩& igmm 采用迭代GMM估计& eps(#)&参数收敛标准。默认值为eps(le-6)& weps(#)&&权数矩阵的收敛标准。默认值为w eps(le-6)Vce(vcetype) unajusted,robust,cluster clustvar,bootstrap,jackknife,hac kernellevel(#)置信区间First 输出第一阶段的估计结果Small 小样本下的自由度调整&&
.estat firststage [,all forcenonrobust]&&
&&&&&&&&该命令给出第一阶段的估计结果以及各种统计量,包括排除外生变量的相关性检验。All选项给出所有的拟合优度统计量。如果模型存在多个内生变量,则stata给出R2、偏R2、调整的R2 、F统计量;如果模型存在多个内生变量,则stata给出Shea偏R2和调整的偏R2。&&&&&& forcenonrobust给出最小特征值统计量及其临界值,即使采用稳健估计(这一检验的假设条件是误差项为独立正态分布)。&&
&&&&&&&&&&
estat overid[,lag(#) forceweights forcenonrobust]该命令给出了过度识别约束检验。如果使用2sls估计估计,则Stata给Sargan’s(1958)和Basman’s(1960)卡方统计量,这也是Wooldridge’(1995)稳健得分检验。&如果采用liml估计方法,则stata给出Anderson and Rubin’s(1950)&卡方统计量以及Basmann F统计量;如果采用GMM估计,则stata给出hansen’s(1982)J统计量。Lags(#)用于计算得分检验的HAC(异方差自相关一致)统计量的过程中进行去噪时设定滞后阶数。如果设定lag(0),则表示不进行去噪处理。默认选择为lag(1)。这一选择仅使用于2sls估计方法和设定vce(hac)选项情况。Forceweight &&&表示即使采用aweights,pweights或iweights也进行检验。Stata仅对于fweights的情况进行检验,其他权数所得到临界值可能不准确。&&
Forcenonrobust &指在2sls或LIML估计中即使采用稳健标准差也进行Sargan and Basmann检验(这一检验的假设的假设条件是误差项为独立正态分布)。&&
log(wage)=a+b*educ+c*exper+d*expersq+u&&
怀疑模型教育(educ)具有内生性问题,利用父母接受教育的年数(fatheduc,motheduc)作educ的工具变量估计上述模型。(1)利用2SLS估计模型.ivregress 2sls lwage exper expersq (educ=fatheduc motheduc),first&&
第一阶段回归结果为:& educhat=9.1+0.19fatheduc+0.16motheduc+0.05exper&&&&&&&&&&&&&&(21.34)&&&&&&(5.62)&&&&&&&(4.39)&&&&&&&(1.12)&&&&&&&&&- 0.001expersq&&&&&&&&&&&&&(-0.84)第二阶段的估计结果为: lwagehat=0.05+0.06educ+0.04exper-0.001expersq&&&&&&&&&&&&&&(0.12)&&&&&(1.95)&&&&&&(5.29)&&&&&&&(-2.24)&&
(2)检验educ的内生性.quietly& ivreg& iwage exper expersq {educ=fatheduc motheduc}.est store IV_reg.quietly regress lwage exper expersq educ.est store LS_reg.hausman IV_reg LS_reg可以得到hausman估计量=2.7,P值=0.44。接受原假设,即educ是外生的。&&
(3)进行过度识别的约束检验.estat overid 可得Sargan统计量=0.38,P值=0.54接受原假设。&&
&面板数据估计&&
首先对面板数据进行声明:前面是截面单元,后面是时间标识:tsset company yeartsset industry year产生新的变量:gen newvar=human*lnrd产生滞后变量Gen fiscal(2)=L2.fiscal产生差分变量Gen fiscal(D)=D.fiscal&&
描述性统计:xtdes :对Panel Data截面个数、时间跨度的整体描述Xtsum:分组内、组间和样本整体计算各个变量的基本统计量xttab 采用列表的方式显示某个变量的分布&&
Stata中用于估计面板模型的主要命令:xtregxtreg depvar [varlist]&[if exp]&, model_type [level(#)&]&&
Model& type &&&&&&&&&&&&&模型be &&&&&&&&&&& Between-effects estimatorfe &&&&&&&&&&&& Fixed-effects estimatorre &&&&&&&&&&& GLS Random-effects estimatorpa &&&&&&&&& GEE population-averaged estimatormle &&&&&& Maximum-likelihood Random-effects estimator&&
主要估计方法:xtreg:&& Fixed-, between- and random-effects, and population-averaged linear modelsxtregar:Fixed- and random-effects linear models with an AR(1) disturbancextpcse :OLS or Prais-Winsten models with panel-corrected standard errorsxtrchh :Hildreth-Houck random coefficients modelsxtivreg :Instrumental variables and two-stage least squares for panel-data models&&
xtabond:Arellano-Bond linear, dynamic panel data estimatorxttobit :Random-effects tobit modelsxtlogit : Fixed-effects, random-effects, population-averaged logit modelsxtprobit :Random-effects and population-averaged probit modelsxtfrontier :Stochastic frontier models for panel-dataxtrc gdp invest culture edu sci health social admin,beta&&
xtreg命令的应用:声明面板数据类型:tsset& sheng t描述性统计:xtsum gdp invest sci admin1.固定效应模型估计:xtreg& gdp invest culture sci health admin techno,fe固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigma u 和sigma e),二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F 统计量和相应的P&值&&
2.随机效应模型估计:xtreg& gdp invest culture sci health admin techno,re检验随机效应模型是否优于混合OLS 模型:在进行随机效应回归之后,使用xttest0检验得到的P 值为0.0000,表明随机效应模型优于混合OLS&模型3.&最大似然估计Ml:xtreg& gdp invest culture sci health admin techno,mle&&
Hausman检验Hausman检验究竟选择固定效应模型还是随机效应模型:第一步:估计固定效应模型,存储结果xtreg& gdp invest culture sci health admin techno,feest store fe第二步:估计随机效应模型,存储结果xtreg& gdp invest culture sci health admin techno,reest store re第三步:进行hausman检验hausman feHausman检验量为:H=(b-B)&[Var(b)-Var(B)]-1(b-B)~x2(k)Hausman统计量服从自由度为k的χ2分布。当H大于一定显著水平的临界值时,我们就认为模型中存在固定效应,从而选用固定效应模型,否则选用随机效应模型如果hausman检验值为负,说明的模型设定有问题,导致Hausman 检验的基本假设得不到满足,遗漏变量的问题,或者某些变量是非平稳等等可以改用hausman检验的其他形式:hausman fe, sigmaless&&
对于固定效应模型的异方差检验和序列相关检验:Xtserial gdp invest culture sci health admin techno异方差检验:&&& xtreg& gdp invest culture sci health admin techno,fexttest3 (Modified Wald statistic for groupwise heteroskedasticity in fixed effect model)&&
随机效应模型的序列相关检验:xtreg& gdp invest culture sci health admin techno,reXttest1Xttest1用于检验随机效应(单尾和双尾)&、一阶序列相关以及两者的联合显著检验结果表明存在随机效应和序列相关,而且对随机效应和序列相关的联合检验也非常显著可以使用广义线性模型xtgls对异方差和序列相关进行修正:xtgls& gdp invest culture sci health admin techno, panels(hetero),修正异方差xtgls& gdp invest culture sci health admin techno, panels(correlated),修正依横截面而变化的异方差xtgls& gdp invest culture sci health admin techno, panels(hetero) corr(ar1),修正异方差和一阶序列相关ar(1)
总体回归方程和条件期望函数之间的关系&&
条件期望函数(conditional expectatioon function)是在给定的协变量X不变的情况下被解释变量Y的期望或者总体均值,能够很好地预测被解释变量Y。
根据迭代期望律,任一随机变量可以被分成两部分:一是条件期望函数;二是残差项。因此在满足残差平方和最小的情况下,条件期望函数是对Y的最好预测。
饱和回归模型(saturated)是指具有离散解释变量的回归模型,对于解释变量X的每一个可能取值,该模型都存在一个参数与之相对应。
饱和模型可以完美地逼近条件期望函数
如果模型中存在两个解释变量,那么通过包含这常数项、两个虚拟变量以及它们的乘积使得模型达到饱和。虚拟变量的系数就叫做主效应(main effect),两个虚拟变量的乘积叫做交叉项。注意这是构造饱和模型的一种方法,并不唯一。
什么时候能够赋予回归因果关系?&&
给定总体,条件期望函数刻画了平均潜在结果的差异,即具有因果性
观察到的差距=处理的平均因果效应+选择性偏误
条件独立假设(conditional independence assumption CIA):给定观察到的特点Xi,选择性偏误消失。
step1:&回归后将结果储存在内存中
&&&&&&&&& stata命令:est store 名称
step2:运行estout&(安装命令:ssc install estout)
&&&&&&&&& stata命令:esttab 名称&,se r2 star(*0.1 **0.05&***0.01)
&&&&&&&&&&&&&&&注意:se是标准误;p是p值;默认是t值
&&&&&&&&&&&&&&&&&&&&&&& r2是拟合优度,pr2是准R^2
&&&&&&&&&&&&&&&&&&&&&&& mtitle表示用模型名字作为每列标题,默认是被解释变量
&&&&&&&&&&&&&&&&&&&&&&&&附加选项参考help estout
step3:&输出Word文档
&&&&&&&& stata命令:esttab 名称 using 文件名.rtf
国外官方统计网站汇总:}

我要回帖

更多关于 固定效应 随机效应 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信