stata中p值很大
双重差分法(DID)估计是最常用的因果推理方法之一。Stata的didregress和xtdidregress命令适用于重复横截面和面板数据的DID和三重差分(DDD)模型。DID和DDD模型控制未观测到的组和时间固定效应,一致地估计被治疗者的平均治疗效应( ATET )。
模型的关键假设可以通过estat trendplot、estat ptrends和estat granger命令来进行检验和图形化展示。
如果要估计不同时间和处理序列的ATETs,您可以使用Stata的新命令:hdidregress和xthdidregress。
• 用于ATET估计的DID和DDD模型:
– 重复横截面数据
– 面板数据
• Donald和Lang聚合方法
• Wild bootstrap P值和置信区间
• Bell和McCarey对偏差校正标准误差的自由度调整
• 均值结果和预处理平行趋势图形诊断
• Granger类型和预处理平行趋势检验
• 异构DID模型
• Bacon分解法评估处理效应异质性
拟合DID模型和ATET估计
我们想研究新的住院程序对患者满意度的影响,需要使用一些医院实施新程序之前和之后的每月患者数据。
. didregress (satis) (procedure),group(hospital) time(month)
手术满意度的ATET为0.85,分别考虑医院和每月固定效应。95% CI不包括0。
如果我们的数据是面板数据,可以使用xtset并输入:
. xtdidregress (satis) (procedure),group(hospital) time(month)
• 图形诊断
我们的DID模型假设,在实施新程序之前,对照组和实验组的满意度趋势是平行的。我们可以用estat trendplot对这一假设进行诊断。
• 预处理平行趋势检验
我们可以使用estat ptrends的正式统计检验来补充我们得出的图形诊断。
因此,预处理平行趋势的零假设并没有被拒绝。
• Granger因果性检验
我们的DID模型还可以假设治疗组和对照组在预期治疗时不会改变他们的行为。为了检验这一假设,我们可以使用estat granger来进行Granger因果检验。
预期治疗时没有行为改变的无效假设没有被拒绝。还可以使用estat grangerplot进行图形诊断。
• 计算相应的标准误差
有多个小组的情况是很常见的。在这些场景中,聚类稳健标准误差是不可靠的。对于这种情况,我们可以使用替代方法来计算标准误差。
我们可以通过添加vce(HC2)选项来使用经过HC2偏差调整的聚类稳健标准误差。
. didregress (satis) (procedure),group(hostpital) time(month) vce(hc2)
我们可以通过使用aggregate(dlang)选项来使用Donald和Lang聚合方法。
. didregress (satis) (procedure),group(hospital) time(month)aggregate(dlang)
野聚类自助法P值和置信区间功能也是可用的。与所有自举方法一样,我们需要设置一个种子以使结果可复制。
. didregress (satis) (procedure),group(hospital) time(month)wildbootstrap(rseed(123))
• DDD模型
要拟合DDD模型,只需向group()选项添加另一个变量,并定义新的处理过的观测值。
. didregress (satis) (new_treated),group(hospital another_group)time(month)
• 治疗时间变化时的治疗异质性检验
如果个体在不同的时间治疗,每个治疗队列的ATET可能会改变。如果是,则DID估计结果不一致。
我们可以使用Bacon分解来检验didregress和xtdidregress的ATET异质性,输入
. estat bdecomp
我们可以通过输入下列命令,以图表的形式展示结果
. estat bdecomp, graph
异质性DID
当治疗效果随时间变化且在不同队列中时,使用异质性DID估计ATETs结果是不同的。这时可以使用Stata的新命令hdidreress和xthdidreress,它会通过重复的横断面数据和面板数据来估计每个队列和时间段的ATETs。
• 每个队列和时期的ATET估计
– 重复横截面数据
– 面板数据
• ATETs 通过以下方式集合
– 组群
– 周期
– 暴露疗法
• 治疗效果异质性绘图和检验
• 同时置信区间
• 四个估算量
– 回归调整(RA)
– 逆概率加权法(IPW)
– 增广逆概率加权法(AIPW)
– 双向固定效应回归(TWFE)
• 预处理平行趋势检验
拟合具有异质处理效果的模型
我们想知道一个名为“健康习惯”的学区项目是否对学生的身体质量指数(BMI)有影响。我们的数据是学区级别的,其中包括学校是否参与该项目和学生的BMI等信息。从2013年到2020年,我们对40个学区的学生进行了重复抽样。我们使用aipw估计器对结果和治疗进行建模。
. hdidregress aipw (bmi medu) (hhabit parksd)group(schools) time(year)
AIPW估计器具有双重稳健性,这意味着即使治疗模型或结果模型(两者不能兼有)设定错误,估计仍然是一致的。治疗效果的异质性在结果中很明显,ATET估算值则因队列和时间组合而异。
可视化每个队列的ATETs
只看所有的ATETs估计是很难看出ATETs的具体趋势的。我们可以使用estat atetplot来可视化每个群组的ATETs时间概况。我们指定sci选项来显示同时置信带,该置信带覆盖了具有预定义概率水平的所有队列和时间的ATET的真实值。
. estat atetplot, sci
聚合ATETs
在调整模型时,我们可以使用estat aggregation来汇总队列、时间或治疗暴露中的ATETs。例如,我们使用estat aggregation, cohort来总结每个队列中的ATETs。
. estat aggregation, cohort graph
如果我们想要在一定时间内汇总ATETs,可以使用estat aggregation来指定time选项。
. estat aggregation, time graph
最后,如果我们想总结不同治疗时间内的ATETs,可以指定dynamic选项。
. estat aggregation, dynamic graph
北京天演融智软件有限公司(科学软件网)是STATA软件在中国的授权经销商,为中国的软件用户提供优质的软件销售和培训服务。
咎备蓝4106stata怎样用程序求数据的样本量 -
庾非泰19379073955 ______ test+式子,是用F检验来检验后面式子中变量对应的系数是否满足式子的数学关系.如果你需要T检验用ttest语句. 你这个test语句的结果是这样的:你检验了是否ch、ma、en、se四个变量前面的系数是否相等(不知道你是否是要这个结果,不过你的语句是这样的),你虽然只写了一个式子,但是stata自动的分成了三个式子(就是底下的1、2、3,不过只是等价一下,告诉你F检验的第一个自由度为什么是3).最后的结论里F较小,P值较大,则在10%的显著性下是不显著的,可以说,你所检验的假设并不统计显著,也就是说,我们没有理由认为ch、ma、en、se四个变量前面的系数相等.
咎备蓝4106相关系数显著性检验中显著性水平是怎么选的,为什么有的取0.05、有的取0.01呢? -
庾非泰19379073955 ______[答案] 取0.05就是置信度为95%,取0.01置信度就是99%.具体选哪个就看得到的结果了,如有大部分都得P值都非常小,那就取0.01了,要是P值都很大,那就取0.05好了.一般情况下,0.05就可以,当然0.01就更精确了.
咎备蓝4106请stata计量统计达人帮忙分析一个数据处理结果.解释里面结果的意思,比如P,是否越打越好呢,非常感谢! -
庾非泰19379073955 ______ P是小了好,一般小于0.05,我们说这个是在5%水平下显著 你的回归结果不怎么样,可能存在多重共线性 一般情况下 t越大越好(一般大于2就算好),P越小越好(一般小于0.05就好) F越大越好
咎备蓝4106t检验里,P值越大,说明越具有显著差异性吗?比如:两处理各个样本数据配对时,其均值差异显著性检验结果 t=0.3088 p=0.7591 P值越大,说明越具有显... -
庾非泰19379073955 ______[答案] 晕!错了!p值越小,说明显著差异性越大~
咎备蓝4106stata怎么把数值变量 -
庾非泰19379073955 ______ stata数值变量可以考虑重新生成变量,比如想把 变量 年级 中的“三年级”赋值成3,命令:gen newvar=3 if 年级==“三年级” //newvar是新生成的变量,三年级因为是字符型的,要加 “ ”
咎备蓝4106如何用stata算p - value -
庾非泰19379073955 ______ 不用算,p-value即为结果输出里面的 P>|t|
咎备蓝4106如何用stata选择某一变量的中位数数据 -
庾非泰19379073955 ______ test语句的用法:test+式子,是用F检验来检验后面式子中变量对应的系数是否满足式子的数学关系.如果你需要T检验用ttest语句.你这个test语句的结果是这样的:你检验了是否ch、ma、en、se四个变量前面的系数是否相等(不知道你是否是要这个结果,不过你的语句是这样的),你虽然只写了一个式子,但是stata自动的分成了三个式子(就是底下的1、2、3,不过只是等价一下,告诉你F检验的第一个自由度为什么是3).最后的结论里F较小,P值较大,则在10%的显著性下是不显著的,可以说,你所检验的假设并不统计显著,也就是说,我们没有理由认为ch、ma、en、se四个变量前面的系数相等.
咎备蓝4106stata中运行reg y x, robust出来的结果代表什么 -
庾非泰19379073955 ______ 1.估计方法采用的是最小二乘的方法 2.robust选项表明标准误经过怀特异方差修正,从而使结果更稳健. 3.F 值越大,p值越低,也就是说所有系数的联合显著性越高,换句话说就是所有变量的系数都为零的可能性越低.
咎备蓝4106stata中改变置信区间,为什么P值不变 -
庾非泰19379073955 ______ 置信区间的变化时因为你设置的置信水平发生了变化,而p值跟这个没有关系的
咎备蓝4106t检验t值跟P值有关吗?是什么关系,t值得绝对值是不是越大,P值就越小? -
庾非泰19379073955 ______ t值代表的是t分布下横坐标的值,而p值则是相应的t值所覆盖的t分布面积. p值的大小要看你具体想求什么,这个道理和Z分数类似,如果求p(0<Z<1.96),那P=0.475,而且Z值越大,P值越大;如果是求p(Z>1.96),那P=0.025,Z越大,P越小,一般假设检验要的是后者.所以确实是t的绝对值越大,p值就越小