stata中p值很大

首页 >> 正文

stata中p值很大

来源：baiyundou.net 日期：2024-09-21

双重差分法(DID)估计是最常用的因果推理方法之一。Stata的didregress和xtdidregress命令适用于重复横截面和面板数据的DID和三重差分(DDD)模型。DID和DDD模型控制未观测到的组和时间固定效应，一致地估计被治疗者的平均治疗效应( ATET )。

模型的关键假设可以通过estat trendplot、estat ptrends和estat granger命令来进行检验和图形化展示。

如果要估计不同时间和处理序列的ATETs，您可以使用Stata的新命令：hdidregress和xthdidregress。

• 用于ATET估计的DID和DDD模型:

– 重复横截面数据

– 面板数据

• Donald和Lang聚合方法

• Wild bootstrap P值和置信区间

• Bell和McCarey对偏差校正标准误差的自由度调整

• 均值结果和预处理平行趋势图形诊断

• Granger类型和预处理平行趋势检验

• 异构DID模型

• Bacon分解法评估处理效应异质性

拟合DID模型和ATET估计

我们想研究新的住院程序对患者满意度的影响，需要使用一些医院实施新程序之前和之后的每月患者数据。

. didregress (satis) (procedure),group(hospital) time(month)

手术满意度的ATET为0.85，分别考虑医院和每月固定效应。95% CI不包括0。

如果我们的数据是面板数据，可以使用xtset并输入：

. xtdidregress (satis) (procedure),group(hospital) time(month)

• 图形诊断

我们的DID模型假设，在实施新程序之前，对照组和实验组的满意度趋势是平行的。我们可以用estat trendplot对这一假设进行诊断。

• 预处理平行趋势检验

我们可以使用estat ptrends的正式统计检验来补充我们得出的图形诊断。

因此，预处理平行趋势的零假设并没有被拒绝。

• Granger因果性检验

我们的DID模型还可以假设治疗组和对照组在预期治疗时不会改变他们的行为。为了检验这一假设，我们可以使用estat granger来进行Granger因果检验。

预期治疗时没有行为改变的无效假设没有被拒绝。还可以使用estat grangerplot进行图形诊断。

• 计算相应的标准误差

有多个小组的情况是很常见的。在这些场景中，聚类稳健标准误差是不可靠的。对于这种情况，我们可以使用替代方法来计算标准误差。

我们可以通过添加vce(HC2)选项来使用经过HC2偏差调整的聚类稳健标准误差。

. didregress (satis) (procedure),group(hostpital) time(month) vce(hc2)

我们可以通过使用aggregate(dlang)选项来使用Donald和Lang聚合方法。

. didregress (satis) (procedure),group(hospital) time(month)aggregate(dlang)

野聚类自助法P值和置信区间功能也是可用的。与所有自举方法一样，我们需要设置一个种子以使结果可复制。

. didregress (satis) (procedure),group(hospital) time(month)wildbootstrap(rseed(123))

• DDD模型

要拟合DDD模型，只需向group()选项添加另一个变量，并定义新的处理过的观测值。

. didregress (satis) (new_treated),group(hospital another_group)time(month)

• 治疗时间变化时的治疗异质性检验

如果个体在不同的时间治疗，每个治疗队列的ATET可能会改变。如果是，则DID估计结果不一致。

我们可以使用Bacon分解来检验didregress和xtdidregress的ATET异质性，输入

. estat bdecomp

我们可以通过输入下列命令，以图表的形式展示结果

. estat bdecomp, graph

异质性DID

当治疗效果随时间变化且在不同队列中时，使用异质性DID估计ATETs结果是不同的。这时可以使用Stata的新命令hdidreress和xthdidreress，它会通过重复的横断面数据和面板数据来估计每个队列和时间段的ATETs。

• 每个队列和时期的ATET估计

– 重复横截面数据

– 面板数据

• ATETs 通过以下方式集合

– 组群

– 周期

– 暴露疗法

• 治疗效果异质性绘图和检验

• 同时置信区间

• 四个估算量

– 回归调整(RA)

– 逆概率加权法(IPW)

– 增广逆概率加权法(AIPW)

– 双向固定效应回归(TWFE)

• 预处理平行趋势检验

拟合具有异质处理效果的模型

我们想知道一个名为“健康习惯”的学区项目是否对学生的身体质量指数(BMI)有影响。我们的数据是学区级别的，其中包括学校是否参与该项目和学生的BMI等信息。从2013年到2020年，我们对40个学区的学生进行了重复抽样。我们使用aipw估计器对结果和治疗进行建模。

. hdidregress aipw (bmi medu) (hhabit parksd)group(schools) time(year)

AIPW估计器具有双重稳健性，这意味着即使治疗模型或结果模型(两者不能兼有)设定错误，估计仍然是一致的。治疗效果的异质性在结果中很明显，ATET估算值则因队列和时间组合而异。

可视化每个队列的ATETs

只看所有的ATETs估计是很难看出ATETs的具体趋势的。我们可以使用estat atetplot来可视化每个群组的ATETs时间概况。我们指定sci选项来显示同时置信带，该置信带覆盖了具有预定义概率水平的所有队列和时间的ATET的真实值。

. estat atetplot, sci

聚合ATETs

在调整模型时，我们可以使用estat aggregation来汇总队列、时间或治疗暴露中的ATETs。例如，我们使用estat aggregation, cohort来总结每个队列中的ATETs。

. estat aggregation, cohort graph

如果我们想要在一定时间内汇总ATETs，可以使用estat aggregation来指定time选项。

. estat aggregation, time graph

最后，如果我们想总结不同治疗时间内的ATETs，可以指定dynamic选项。

. estat aggregation, dynamic graph

北京天演融智软件有限公司（科学软件网）是STATA软件在中国的授权经销商，为中国的软件用户提供优质的软件销售和培训服务。

","gnid":"972b14ac508ae1749","img_data":[{"flag":2,"img":[{"desc":"","height":"383","title":"","url":"https://p0.ssl.img.360kuai.com/t01931e6ad0fd5810a2.png","width":"900"},{"desc":"","height":"419","title":"","url":"https://p0.ssl.img.360kuai.com/t01eb62f5fe4982899e.png","width":"692"},{"desc":"","height":"359","title":"","url":"https://p0.ssl.img.360kuai.com/t013e0223101034d570.png","width":"695"},{"desc":"","height":"381","title":"","url":"https://p0.ssl.img.360kuai.com/t01a20b31de30ff7049.png","width":"627"},{"desc":"","height":"255","title":"","url":"https://p0.ssl.img.360kuai.com/t0190271e5401a49b10.png","width":"694"},{"desc":"","height":"254","title":"","url":"https://p0.ssl.img.360kuai.com/t016e612f1fd76f74cb.png","width":"691"},{"desc":"","height":"420","title":"","url":"https://p0.ssl.img.360kuai.com/t01d70903232c55da24.png","width":"694"},{"desc":"","height":"773","title":"","url":"https://p0.ssl.img.360kuai.com/t01cb240fe35b514cc4.png","width":"619"},{"desc":"","height":"367","title":"","url":"https://p0.ssl.img.360kuai.com/t01ac9cbd4f1ca2cc0d.png","width":"609"},{"desc":"","height":"287","title":"","url":"https://p0.ssl.img.360kuai.com/t010d2a9ed040818590.png","width":"607"},{"desc":"","height":"368","title":"","url":"https://p0.ssl.img.360kuai.com/t01e7939f217d8eb6b2.png","width":"610"},{"desc":"","height":"324","title":"","url":"https://p0.ssl.img.360kuai.com/t016190c4b8ee0309c2.png","width":"602"},{"desc":"","height":"368","title":"","url":"https://p0.ssl.img.360kuai.com/t01a27381672c01f697.png","width":"605"},{"desc":"","height":"429","title":"","url":"https://p0.ssl.img.360kuai.com/t01f4cc920cc3a61266.png","width":"604"},{"desc":"","height":"367","title":"","url":"https://p0.ssl.img.360kuai.com/t011e06853b1dd5f53a.png","width":"605"}]}],"original":0,"pat":"art_src_0,fts0,sts0","powerby":"cache","pub_time":1712913424000,"pure":"","rawurl":"http://zm.news.so.com/94fe3de7a27e3dfa937cb3a84d1e4088","redirect":0,"rptid":"327741b48e99043e","rss_ext":[],"s":"t","src":"天演融智","tag":[],"title":"Stata软件之双重差分法（DID）

咎备蓝4106stata怎样用程序求数据的样本量 -
庾非泰19379073955 ______ test+式子,是用F检验来检验后面式子中变量对应的系数是否满足式子的数学关系.如果你需要T检验用ttest语句. 你这个test语句的结果是这样的:你检验了是否ch、ma、en、se四个变量前面的系数是否相等(不知道你是否是要这个结果,不过你的语句是这样的),你虽然只写了一个式子,但是stata自动的分成了三个式子(就是底下的1、2、3,不过只是等价一下,告诉你F检验的第一个自由度为什么是3).最后的结论里F较小,P值较大,则在10%的显著性下是不显著的,可以说,你所检验的假设并不统计显著,也就是说,我们没有理由认为ch、ma、en、se四个变量前面的系数相等.

咎备蓝4106相关系数显著性检验中显著性水平是怎么选的,为什么有的取0.05、有的取0.01呢? -
庾非泰19379073955 ______[答案] 取0.05就是置信度为95%,取0.01置信度就是99%.具体选哪个就看得到的结果了,如有大部分都得P值都非常小,那就取0.01了,要是P值都很大,那就取0.05好了.一般情况下,0.05就可以,当然0.01就更精确了.

咎备蓝4106请stata计量统计达人帮忙分析一个数据处理结果.解释里面结果的意思,比如P,是否越打越好呢,非常感谢! -
庾非泰19379073955 ______ P是小了好,一般小于0.05,我们说这个是在5%水平下显著你的回归结果不怎么样,可能存在多重共线性一般情况下 t越大越好(一般大于2就算好),P越小越好(一般小于0.05就好) F越大越好

咎备蓝4106t检验里,P值越大,说明越具有显著差异性吗?比如:两处理各个样本数据配对时,其均值差异显著性检验结果 t=0.3088 p=0.7591 P值越大,说明越具有显... -
庾非泰19379073955 ______[答案] 晕!错了!p值越小,说明显著差异性越大~

咎备蓝4106stata怎么把数值变量 -
庾非泰19379073955 ______ stata数值变量可以考虑重新生成变量,比如想把变量年级中的“三年级”赋值成3,命令:gen newvar=3 if 年级==“三年级” //newvar是新生成的变量,三年级因为是字符型的,要加 “ ”

咎备蓝4106如何用stata算p - value -
庾非泰19379073955 ______ 不用算,p-value即为结果输出里面的 P>|t|

咎备蓝4106如何用stata选择某一变量的中位数数据 -
庾非泰19379073955 ______ test语句的用法:test+式子,是用F检验来检验后面式子中变量对应的系数是否满足式子的数学关系.如果你需要T检验用ttest语句.你这个test语句的结果是这样的:你检验了是否ch、ma、en、se四个变量前面的系数是否相等(不知道你是否是要这个结果,不过你的语句是这样的),你虽然只写了一个式子,但是stata自动的分成了三个式子(就是底下的1、2、3,不过只是等价一下,告诉你F检验的第一个自由度为什么是3).最后的结论里F较小,P值较大,则在10%的显著性下是不显著的,可以说,你所检验的假设并不统计显著,也就是说,我们没有理由认为ch、ma、en、se四个变量前面的系数相等.

咎备蓝4106stata中运行reg y x, robust出来的结果代表什么 -
庾非泰19379073955 ______ 1.估计方法采用的是最小二乘的方法 2.robust选项表明标准误经过怀特异方差修正,从而使结果更稳健. 3.F 值越大,p值越低,也就是说所有系数的联合显著性越高,换句话说就是所有变量的系数都为零的可能性越低.

咎备蓝4106stata中改变置信区间,为什么P值不变 -
庾非泰19379073955 ______ 置信区间的变化时因为你设置的置信水平发生了变化,而p值跟这个没有关系的

咎备蓝4106t检验t值跟P值有关吗?是什么关系,t值得绝对值是不是越大,P值就越小? -
庾非泰19379073955 ______ t值代表的是t分布下横坐标的值,而p值则是相应的t值所覆盖的t分布面积. p值的大小要看你具体想求什么,这个道理和Z分数类似,如果求p(0<Z<1.96),那P=0.475,而且Z值越大,P值越大;如果是求p(Z>1.96),那P=0.025,Z越大,P越小,一般假设检验要的是后者.所以确实是t的绝对值越大,p值就越小

（编辑：自媒体）