stata统计变量个数
倾向值匹配、IPW等
Stata的因果推断功能允许您从观察数据中估计实验类型的因果效应(治疗效应)。是否对连续、二元、计数或生存结果感兴趣? 是在模拟结果过程还是治疗过程?Stata可以估算您的治疗效果。有了这样一套全面的估计量,您就会找到适合您的那一个。
估计量
• 双重差分(DID)
• 异质性DID(新增)
• 逆概率权重(IPW)
• 倾向得分匹配
• 协变量匹配
• 回归调整
• 加权回归
• 双重稳健方法
– 增强型IPW(AIPW)
– 带回归调整的IPW
– 具有lasso选择控件的AIPW
• 因果中介(新增)
统计
• 平均处理效应(ATEs)
• 处理后的ATEs(ATETs)
• 潜在结果手段(POM)
• 直接影响、间接影响
结果
• 连续—线性
• 二进制—logistic、概率、异方差
• 计数—Poisson
• 分数
• 非负,包括指数平均值
• 生存率—指数、Weibull、伽玛、对数正态
治疗
• 二进制—logistic、概率、异方差
• 多值——多项logistic
诊断
• 重叠图
• 协变量平衡
内生性处理效应
• 连续、截尾、二进制、有序和计数结果
• ATEs、ATETs和POMs
• 结合内生协变量、样本选择和面板数据
• 内生性检验
也许你是一名医学研究人员,知道医生在决定是否开药治疗高血压时考虑的变量,但你对应该用来模拟血压的变量却远没有那么自信。
您可以使用IPW估计器,
• teffects ipw (bp) (drug x1 x2)
或倾向性得分匹配
• teffects psmatch (bp) (drug x1 x2)
了解更多影响血压的变量,但不了解哪些决定是否开药的变量?
使用回归调整,
• teffects ra (bp x1 x3) (drug)
或最近邻匹配,
• teffects nnmatch (bp x1 x3) (drug)
如果你同时知道血压建模和是否开具药物处方,你可以使用双重稳健估计量中的一个。
使用增强的IPW,
• teffects aipw (bp x1 x3) (drug x1 x2)
或采用回归调整的IPW,
• teffects ipwra (bp x1 x3) (drug x1 x2)
令人惊讶的是,使用这些双重稳健的方法,我们只需要正确对待两个模型规范中的一个。
让我们看一个使用带回归调整的IPW例子。我们将收缩压建模为年龄、高血压家族史、吸烟和体重的函数。是否开药被模拟为年龄、家族史和体重的函数。
• teffects ipwra
(bp age fam_history smokes weight)
(drug age fam_history weight)
ATE为-21.4。若所有患者均按医嘱服药,平均血压将下降21.4mm Hg。在没有人给药的情况下,167.5的POM为我们提供了估计的收缩压。
让我们开看一些诊断。协变量是否平衡?我们可以查看年龄的核密度图,例如,比较处理过的和未处理过的。
• tebalance density age
加权后,年龄的密度非常相似。
我们可以对所有协变量进行平衡性检验。
• tebalance overid
我们并不反对所有协变量都是平衡的这一原假设。
我们只谈到了可用的治疗效果估计量的范围。
你有二元结果吗?
• teffects ipwra (y x1 x2, probit) (treat x1 x3)
或是生存结果?
• stteffects ipwra (x1 x2) (treat x1 x3)
是否存在内生性问题?
• eteffects (y x1 x2) (treat x1 x3)
你有很多潜在的控制因素吗?
• telasso (y x1 x2 x3 x4 ...)
(treat x1 x2 x3 x4 ...)
你有中介变量吗?
• mediate (y x1 x2) (m x1 x3) (treat)
等等……
北京天演融智软件有限公司(科学软件网)是STATA软件在中国的授权经销商,为中国的软件用户提供优质的软件销售和培训服务。
","gnid":"90368c0f7b5da87ea","img_data":[{"flag":2,"img":[{"desc":"","height":"383","title":"","url":"https://p0.ssl.img.360kuai.com/t0173f3da782f36af1c.png","width":"900"},{"desc":"","height":"360","title":"","url":"https://p0.ssl.img.360kuai.com/t015bd43ed3d5c90515.png","width":"606"},{"desc":"","height":"698","title":"","url":"https://p0.ssl.img.360kuai.com/t011010d5360808171c.png","width":"680"},{"desc":"","height":"374","title":"","url":"https://p0.ssl.img.360kuai.com/t01bae8dac627cd765c.png","width":"706"},{"desc":"","height":"323","title":"","url":"https://p0.ssl.img.360kuai.com/t01bce6f80d24249957.png","width":"529"},{"desc":"","height":"154","title":"","url":"https://p0.ssl.img.360kuai.com/t01b1d9efaff5e2cc46.png","width":"531"}]}],"original":0,"pat":"art_src_0,fts0,sts0","powerby":"pika","pub_time":1712479719000,"pure":"","rawurl":"http://zm.news.so.com/c4f62740a72fdcf19f2007480070a569","redirect":0,"rptid":"09a640408d231305","rss_ext":[],"s":"t","src":"天演融智","tag":[],"title":"Stata软件之因果推断
逯庙叛2164如何做 stata 参数估计列表 -
廉新伊18236007772 ______ 一、极大似然估计的原理 极大似然的估计原理可以由下面的程序得到说明.我们首先生成 10 个服从 正态分布的总体,每个总体的均值都不同,依次为 0,1,2,3,4,5,6,7,8, 9.方差相同,均为 1.然后我们随机地取出一个总体,从中抽出 10 个样本...
逯庙叛2164stata可以做描述性统计吗 -
廉新伊18236007772 ______ 所谓描述性统计分析,就是在表示数量的中心位置的同时,还能表示数量的变异程度(即离散程度).描述性统计分析一般有二种方法可以进行:1、频数分布分析,2
逯庙叛2164控制变量在统计软件STATA中如何使用? -
廉新伊18236007772 ______ reg 自变量1 自变量2 控制变量1 ……是的
逯庙叛2164如何用stata进行面板数据的回归分析 -
廉新伊18236007772 ______ 面板数据用xi即可 熟练掌握 我可以代分析
逯庙叛2164如何在stata中做GMM -
廉新伊18236007772 ______ 广义矩估计(Generalized Method of Moments,即GMM) 一、解释变量内生性检验 首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量.Hausman 检验的原假设为:所有解释变量均为外生...
逯庙叛2164stata中如何确定内存中是否有某个变量 -
廉新伊18236007772 ______ test语句的用法:test+式子,是用F检验来检验后面式子中变量对应的系数是否满足式子的数学关系.如果你需要T检验用ttest语句.你这个test语句的结果是这样的:你检验了是否ch、ma、en、se四个变量前面的系数是否相等(不知道你是否是要这个结果,不过你的语句是这样的),你虽然只写了一个式子,但是stata自动的分成了三个式子(就是底下的1、2、3,不过只是等价一下,告诉你F检验的第一个自由度为什么是3).最后的结论里F较小,P值较大,则在10%的显著性下是不显著的,可以说,你所检验的假设并不统计显著,也就是说,我们没有理由认为ch、ma、en、se四个变量前面的系数相等.
逯庙叛2164中位数和四分位数描述的数据如何分析 -
廉新伊18236007772 ______[答案] 只能描述性分析吗?作meta分析,比较难,可能用stata可以.中位数和四分位数是用来描述分布未知或不满足正态分布的数据的集中趋势和离散趋势的,对于这种数据除了进行统计描述外,也可以进行统计推断.只是采用什么方法需要根据数据分布特...
逯庙叛2164stata怎么把数值变量 -
廉新伊18236007772 ______ stata数值变量可以考虑重新生成变量,比如想把 变量 年级 中的“三年级”赋值成3,命令:gen newvar=3 if 年级==“三年级” //newvar是新生成的变量,三年级因为是字符型的,要加 “ ”