标准误差的自由度
双重差分法(DID)估计是最常用的因果推理方法之一。Stata的didregress和xtdidregress命令适用于重复横截面和面板数据的DID和三重差分(DDD)模型。DID和DDD模型控制未观测到的组和时间固定效应,一致地估计被治疗者的平均治疗效应( ATET )。
模型的关键假设可以通过estat trendplot、estat ptrends和estat granger命令来进行检验和图形化展示。
如果要估计不同时间和处理序列的ATETs,您可以使用Stata的新命令:hdidregress和xthdidregress。
• 用于ATET估计的DID和DDD模型:
– 重复横截面数据
– 面板数据
• Donald和Lang聚合方法
• Wild bootstrap P值和置信区间
• Bell和McCarey对偏差校正标准误差的自由度调整
• 均值结果和预处理平行趋势图形诊断
• Granger类型和预处理平行趋势检验
• 异构DID模型
• Bacon分解法评估处理效应异质性
拟合DID模型和ATET估计
我们想研究新的住院程序对患者满意度的影响,需要使用一些医院实施新程序之前和之后的每月患者数据。
. didregress (satis) (procedure),group(hospital) time(month)
手术满意度的ATET为0.85,分别考虑医院和每月固定效应。95% CI不包括0。
如果我们的数据是面板数据,可以使用xtset并输入:
. xtdidregress (satis) (procedure),group(hospital) time(month)
• 图形诊断
我们的DID模型假设,在实施新程序之前,对照组和实验组的满意度趋势是平行的。我们可以用estat trendplot对这一假设进行诊断。
• 预处理平行趋势检验
我们可以使用estat ptrends的正式统计检验来补充我们得出的图形诊断。
因此,预处理平行趋势的零假设并没有被拒绝。
• Granger因果性检验
我们的DID模型还可以假设治疗组和对照组在预期治疗时不会改变他们的行为。为了检验这一假设,我们可以使用estat granger来进行Granger因果检验。
预期治疗时没有行为改变的无效假设没有被拒绝。还可以使用estat grangerplot进行图形诊断。
• 计算相应的标准误差
有多个小组的情况是很常见的。在这些场景中,聚类稳健标准误差是不可靠的。对于这种情况,我们可以使用替代方法来计算标准误差。
我们可以通过添加vce(HC2)选项来使用经过HC2偏差调整的聚类稳健标准误差。
. didregress (satis) (procedure),group(hostpital) time(month) vce(hc2)
我们可以通过使用aggregate(dlang)选项来使用Donald和Lang聚合方法。
. didregress (satis) (procedure),group(hospital) time(month)aggregate(dlang)
野聚类自助法P值和置信区间功能也是可用的。与所有自举方法一样,我们需要设置一个种子以使结果可复制。
. didregress (satis) (procedure),group(hospital) time(month)wildbootstrap(rseed(123))
• DDD模型
要拟合DDD模型,只需向group()选项添加另一个变量,并定义新的处理过的观测值。
. didregress (satis) (new_treated),group(hospital another_group)time(month)
• 治疗时间变化时的治疗异质性检验
如果个体在不同的时间治疗,每个治疗队列的ATET可能会改变。如果是,则DID估计结果不一致。
我们可以使用Bacon分解来检验didregress和xtdidregress的ATET异质性,输入
. estat bdecomp
我们可以通过输入下列命令,以图表的形式展示结果
. estat bdecomp, graph
异质性DID
当治疗效果随时间变化且在不同队列中时,使用异质性DID估计ATETs结果是不同的。这时可以使用Stata的新命令hdidreress和xthdidreress,它会通过重复的横断面数据和面板数据来估计每个队列和时间段的ATETs。
• 每个队列和时期的ATET估计
– 重复横截面数据
– 面板数据
• ATETs 通过以下方式集合
– 组群
– 周期
– 暴露疗法
• 治疗效果异质性绘图和检验
• 同时置信区间
• 四个估算量
– 回归调整(RA)
– 逆概率加权法(IPW)
– 增广逆概率加权法(AIPW)
– 双向固定效应回归(TWFE)
• 预处理平行趋势检验
拟合具有异质处理效果的模型
我们想知道一个名为“健康习惯”的学区项目是否对学生的身体质量指数(BMI)有影响。我们的数据是学区级别的,其中包括学校是否参与该项目和学生的BMI等信息。从2013年到2020年,我们对40个学区的学生进行了重复抽样。我们使用aipw估计器对结果和治疗进行建模。
. hdidregress aipw (bmi medu) (hhabit parksd)group(schools) time(year)
AIPW估计器具有双重稳健性,这意味着即使治疗模型或结果模型(两者不能兼有)设定错误,估计仍然是一致的。治疗效果的异质性在结果中很明显,ATET估算值则因队列和时间组合而异。
可视化每个队列的ATETs
只看所有的ATETs估计是很难看出ATETs的具体趋势的。我们可以使用estat atetplot来可视化每个群组的ATETs时间概况。我们指定sci选项来显示同时置信带,该置信带覆盖了具有预定义概率水平的所有队列和时间的ATET的真实值。
. estat atetplot, sci
聚合ATETs
在调整模型时,我们可以使用estat aggregation来汇总队列、时间或治疗暴露中的ATETs。例如,我们使用estat aggregation, cohort来总结每个队列中的ATETs。
. estat aggregation, cohort graph
如果我们想要在一定时间内汇总ATETs,可以使用estat aggregation来指定time选项。
. estat aggregation, time graph
最后,如果我们想总结不同治疗时间内的ATETs,可以指定dynamic选项。
. estat aggregation, dynamic graph
北京天演融智软件有限公司(科学软件网)是STATA软件在中国的授权经销商,为中国的软件用户提供优质的软件销售和培训服务。
尚枝刚1897标准差与标准误在应用上有何不同? -
戎翠须13643885584 ______[答案] 1 标准差 标准差(S 或SD) ,是用来反映变异程度,当两组观察值 在单位相同、均数相近的情况下,标准差越大,说明观察值间 的变异程度越大.即观察值围绕均数的分布较离散,均数的 代表性较差.反之,标准差越小,表明观察值间的变异较小, ...
尚枝刚1897标准差公式意义:分母为什么为n - 1? -
戎翠须13643885584 ______ 其实标准差的定义公式为S=√{[(x1-x)^2+(x2-x)^2+......(xn-x)^2]/n},其中分母是n,因为这里的n的意义是总体数量.而在实际统计中,往往以样本代替反映整体,这时要用的就是你问的(n-1),表示的是样本能自由选择的程度(当选到只剩一个时,它不可能再有自由了,所以自由度是n-1).具体什么时候用哪个做分母,原则如下: 如是总体,标准差公式根号内除以n 如是样本,标准差公式根号内除以(n-1) 因为我们大量接触的是样本,所以普遍使用根号内除以(n-1)
尚枝刚1897标准差的公式??谢谢 -
戎翠须13643885584 ______ 方差s^2=[(x1-x)^2+(x2-x)^2+......(xn-x)^2]/n 标准差=方差的算术平方根 标准差计算公式的来源 标准差是反应一组数据离散程度最常用的一种量化形式,是表示精密确的最要指标. 虽然样本的真实值是不能知道,但是每个样本总是会有一个真实值...
尚枝刚1897什么是判定系数r2和估计标准误差syx -
戎翠须13643885584 ______ R2系数是一个重要的判定指标,公式为 .从公式中可以看出,判定系数等于回归平方和在总平方和总所占的比率,即回归方程所能解释的因变量变异性的百分比.如果R2=0.775,说明变量y的变异性中有77.5%是由自变量x引起的;如果R2=1,...
尚枝刚1897设自变量个数为5,样本容量为20,.在多元回归分析中,估计误差的自由度...
戎翠须13643885584 ______ 1 标准差 标准差(S 或SD) ,是用来反映变异程度,当两组观察值 在单位相同、均数相近的情况下,标准差越大,说明观察值间 的变异程度越大.即观察值围绕均数的分布较离散,均数的 代表性较差.反之,标准差越小,表明观察值间的变...
尚枝刚1897标准差问题求教为什么标准差的公式要除以 (n - 1),而不是n? -
戎翠须13643885584 ______[答案] 标准差其实有两个公式: 一个是针对总体而言的,公式中是除以n. 令一个是针对样本而言的,公式中是除以n-1,全称为样本标准差.分母除以n-1是由于(xi-x)的自由度为n-1,即(xi-x)中只需确定n-1个数值,另外一个数值也被确定. 需要指出的是...
尚枝刚1897分析化学中的 样本标准偏差计算公式中的n - 1表示n - 1个独立偏差但又有n个偏差, -
戎翠须13643885584 ______[答案] n-1在这里表示自由度,特指一组数据分散度的独立偏差数,n是一组数据的偏差数,首先得明确“独立”的概念,因为比如求得了三个数x1,x2,x3的平均值值,已知x1,x2与平均值的差值是已知的,不是一个独立的变数,所以此时的独立偏差数(自由...