利用逆概率加权(inverse probability weighting, IP weighting)的方法消除混杂因素 的原理是逆概率加权创建了一个新的假人群数据。在新的假人群数据中不存在混杂因 素,可以直接计算治疗和结果的因果效应。
逆概率,顾名思义,先计算概率,然后再求倒数。概率是指某个个体接受某种治疗 的概率,因此某个个体的逆概率由以下方程表达:
计算因果效应时,只需要在回归方程中指定权重即可。但需要指出的是计算 95%置信区间是不能按照常规的方法,因为常规方法没有考虑逆概率的标准差。有两种方法,一种是利用 R 软件中的标准差估算程序包。另一种方法是利用反复抽样(bootstrapping),在原始的数据中随机抽取样本(单一样本可重复),计算因果效应,然后反复多次进行该过程,最后汇总得到的因果效应,计算 95%置信区间。
逆概率加权遇到的问题是有时倾向指数特别小,导致逆概率特别大,从而引起因果效应计算的偏差。为了使逆概率的范围缩小,往往会给逆概率乘上一个分子,得到稳定的逆概率。