stata+p值多少才显著
双重差分法(DID)估计是最常用的因果推理方法之一。Stata的didregress和xtdidregress命令适用于重复横截面和面板数据的DID和三重差分(DDD)模型。DID和DDD模型控制未观测到的组和时间固定效应,一致地估计被治疗者的平均治疗效应( ATET )。
模型的关键假设可以通过estat trendplot、estat ptrends和estat granger命令来进行检验和图形化展示。
如果要估计不同时间和处理序列的ATETs,您可以使用Stata的新命令:hdidregress和xthdidregress。
• 用于ATET估计的DID和DDD模型:
– 重复横截面数据
– 面板数据
• Donald和Lang聚合方法
• Wild bootstrap P值和置信区间
• Bell和McCarey对偏差校正标准误差的自由度调整
• 均值结果和预处理平行趋势图形诊断
• Granger类型和预处理平行趋势检验
• 异构DID模型
• Bacon分解法评估处理效应异质性
拟合DID模型和ATET估计
我们想研究新的住院程序对患者满意度的影响,需要使用一些医院实施新程序之前和之后的每月患者数据。
. didregress (satis) (procedure),group(hospital) time(month)
手术满意度的ATET为0.85,分别考虑医院和每月固定效应。95% CI不包括0。
如果我们的数据是面板数据,可以使用xtset并输入:
. xtdidregress (satis) (procedure),group(hospital) time(month)
• 图形诊断
我们的DID模型假设,在实施新程序之前,对照组和实验组的满意度趋势是平行的。我们可以用estat trendplot对这一假设进行诊断。
• 预处理平行趋势检验
我们可以使用estat ptrends的正式统计检验来补充我们得出的图形诊断。
因此,预处理平行趋势的零假设并没有被拒绝。
• Granger因果性检验
我们的DID模型还可以假设治疗组和对照组在预期治疗时不会改变他们的行为。为了检验这一假设,我们可以使用estat granger来进行Granger因果检验。
预期治疗时没有行为改变的无效假设没有被拒绝。还可以使用estat grangerplot进行图形诊断。
• 计算相应的标准误差
有多个小组的情况是很常见的。在这些场景中,聚类稳健标准误差是不可靠的。对于这种情况,我们可以使用替代方法来计算标准误差。
我们可以通过添加vce(HC2)选项来使用经过HC2偏差调整的聚类稳健标准误差。
. didregress (satis) (procedure),group(hostpital) time(month) vce(hc2)
我们可以通过使用aggregate(dlang)选项来使用Donald和Lang聚合方法。
. didregress (satis) (procedure),group(hospital) time(month)aggregate(dlang)
野聚类自助法P值和置信区间功能也是可用的。与所有自举方法一样,我们需要设置一个种子以使结果可复制。
. didregress (satis) (procedure),group(hospital) time(month)wildbootstrap(rseed(123))
• DDD模型
要拟合DDD模型,只需向group()选项添加另一个变量,并定义新的处理过的观测值。
. didregress (satis) (new_treated),group(hospital another_group)time(month)
• 治疗时间变化时的治疗异质性检验
如果个体在不同的时间治疗,每个治疗队列的ATET可能会改变。如果是,则DID估计结果不一致。
我们可以使用Bacon分解来检验didregress和xtdidregress的ATET异质性,输入
. estat bdecomp
我们可以通过输入下列命令,以图表的形式展示结果
. estat bdecomp, graph
异质性DID
当治疗效果随时间变化且在不同队列中时,使用异质性DID估计ATETs结果是不同的。这时可以使用Stata的新命令hdidreress和xthdidreress,它会通过重复的横断面数据和面板数据来估计每个队列和时间段的ATETs。
• 每个队列和时期的ATET估计
– 重复横截面数据
– 面板数据
• ATETs 通过以下方式集合
– 组群
– 周期
– 暴露疗法
• 治疗效果异质性绘图和检验
• 同时置信区间
• 四个估算量
– 回归调整(RA)
– 逆概率加权法(IPW)
– 增广逆概率加权法(AIPW)
– 双向固定效应回归(TWFE)
• 预处理平行趋势检验
拟合具有异质处理效果的模型
我们想知道一个名为“健康习惯”的学区项目是否对学生的身体质量指数(BMI)有影响。我们的数据是学区级别的,其中包括学校是否参与该项目和学生的BMI等信息。从2013年到2020年,我们对40个学区的学生进行了重复抽样。我们使用aipw估计器对结果和治疗进行建模。
. hdidregress aipw (bmi medu) (hhabit parksd)group(schools) time(year)
AIPW估计器具有双重稳健性,这意味着即使治疗模型或结果模型(两者不能兼有)设定错误,估计仍然是一致的。治疗效果的异质性在结果中很明显,ATET估算值则因队列和时间组合而异。
可视化每个队列的ATETs
只看所有的ATETs估计是很难看出ATETs的具体趋势的。我们可以使用estat atetplot来可视化每个群组的ATETs时间概况。我们指定sci选项来显示同时置信带,该置信带覆盖了具有预定义概率水平的所有队列和时间的ATET的真实值。
. estat atetplot, sci
聚合ATETs
在调整模型时,我们可以使用estat aggregation来汇总队列、时间或治疗暴露中的ATETs。例如,我们使用estat aggregation, cohort来总结每个队列中的ATETs。
. estat aggregation, cohort graph
如果我们想要在一定时间内汇总ATETs,可以使用estat aggregation来指定time选项。
. estat aggregation, time graph
最后,如果我们想总结不同治疗时间内的ATETs,可以指定dynamic选项。
. estat aggregation, dynamic graph
北京天演融智软件有限公司(科学软件网)是STATA软件在中国的授权经销商,为中国的软件用户提供优质的软件销售和培训服务。
毕虽温1136stata中cnsreg命令显示结果中右上角的F检验是检验什么的? -
逄盼强14778157949 ______ F检验就是联合显著检验 检验回归方程是不是所有变量整体显著 你不要看自由度,直接看对应的P值,P值小于0.05,就是联合显著啦 http://zh.wikipedia.org/wiki/F检验 这个网址是F检验的定义
毕虽温1136STATA中Hausman检验的p值是0.0880,是使用固定效应模型还是随机效应模型?急啊~~ -
逄盼强14778157949 ______[答案] p=0就是fe,你的p是0.088的话要看你用1%,5%还是10%了,1和5的就用re,10就用fe
毕虽温1136求助Stata多元Logit回归分析结果解释 -
逄盼强14778157949 ______ 因为你的q1有三个值,分别是1,2,3,回归结果就有三行数据.其中,在结果数据中,q1=2的情况最多,所以是基准输出,表中系数回归的结果,是相对于q=2进行比较的数据,值为正表示可能性比q=2大,反之表示可能性比之小.所以你的结果中有三行数据.希望帮到你.
毕虽温1136stata中运行reg y x, robust出来的结果代表什么 -
逄盼强14778157949 ______ 1.估计方法采用的是最小二乘的方法 2.robust选项表明标准误经过怀特异方差修正,从而使结果更稳健. 3.F 值越大,p值越低,也就是说所有系数的联合显著性越高,换句话说就是所有变量的系数都为零的可能性越低.
毕虽温1136求哪位大神帮我看一下为什么我的stata回归分析相关系数一个变量会有两个数据的?这是对的吗,怎么解释急 -
逄盼强14778157949 ______ 一个系数一个p值
毕虽温1136求STATA达人分析一个线性回归的结果!!! -
逄盼强14778157949 ______ 方程整体显著性检验F值对应的P值大于0.05,说明整个方程是不显著的 每股收益显著性检验t值对应的p值大于0.05,说明每股收益对股价的影响是不显著的 每股收益的回归系数为18.36,说明保持其他条件不变的前提下,每股收益每增加1个单位,股价就增加18.36.但是因为每股收益的回归系数没有通过t检验,所以这个结论是不成立的 这个方程很有问题,原因是只有3个观测值
毕虽温1136想用stata做60次回归分析,自变量都相同(7个),怎样一次性操作? -
逄盼强14778157949 ______ forvalues x=1/60{ y`x' ............这里列你的自变量(每次可一样,也可不一样,加下标就是了,就是用`x'这个加下标,每循环一次,下标会自动加1,从1一直到60,共做60次) } 你可以copy以上代码,加入你自己的变量就可以了.
毕虽温1136如何用stata选择某一变量的中位数数据 -
逄盼强14778157949 ______ test语句的用法:test+式子,是用F检验来检验后面式子中变量对应的系数是否满足式子的数学关系.如果你需要T检验用ttest语句.你这个test语句的结果是这样的:你检验了是否ch、ma、en、se四个变量前面的系数是否相等(不知道你是否是要这个结果,不过你的语句是这样的),你虽然只写了一个式子,但是stata自动的分成了三个式子(就是底下的1、2、3,不过只是等价一下,告诉你F检验的第一个自由度为什么是3).最后的结论里F较小,P值较大,则在10%的显著性下是不显著的,可以说,你所检验的假设并不统计显著,也就是说,我们没有理由认为ch、ma、en、se四个变量前面的系数相等.
毕虽温1136stata中运行为什么会出现invalid name -
逄盼强14778157949 ______ 就是变量名字不对,核实一下,stata的资料我这里很多的
毕虽温1136统计问题,求大神帮忙解释一下这个数据的STATA软件的输出结果 -
逄盼强14778157949 ______ 两年没上百度了,昨天给我推荐一个,今天又来一个.好吧,试着回答一下. 这就是correlation matrix,就是相关性矩阵.任何统计软件上都会有计算方法.简单点说,负号表示负相关,正数表示正相关.再简单点,举个例子,FF和EN相关性是0.01,意思是FF越高,EN越高,反之亦然. 再看后面的星星*,统计学上,意思是这个结果很明显,可以接受.每一行变量的相关系数下面的数字是P值.目测楼主默认的显著水平是0.05,就是说小于0.05的P值结果都可以接受.比如FF和EN正相关性十分明显(P值=0)的这个结果是可以接受的.但是实际运用里面不一定要求很严格.这个看自己.想了解得更多可以去看统计学教材.