在医疗干预、政策评估、金融信贷等现实场景中,我们经常面临一个关键问题:“某个个体在接受或未接受某种处理(如服药、培训、推荐)后,其结果会发生怎样的变化?”这正是因果推断所试图解答的核心挑战,尤其是在无法进行随机对照实验的观测数据中,如何准确估计个体处理效应(Individual Treatment Effect,ITE)变得尤为关键。随着深度学习的崛起,TarNet、CFRNet 与 DragonNet 等神经网络架构被提出,作为一系列创新性的深度因果推断模型,它们在建模处理偏倚、对抗分布不一致以及提升反事实预测准确性方面展现出强大潜力。本文将围绕这三种模型,从原理解析、结构设计、关键创新到应用实践进行系统梳理,帮助读者全面理解深度因果推断的发展脉络与落地路径。
1. 解决的问题:如何估计个体因果效应(ITE)并消除处理偏倚?
在医疗推荐、精准营销、政策制定等应用中,决策常常依赖于个体层面的干预效果估计(ITE, Individual Treatment Effect),即:在现实应用中,我们常遇到如下问题:
给定一个人接受或未接受某种干预,我们只能看到一个结果,如何估计未观测到的另一个结果?
这正是个体处理效应(ITE)估计问题,其核心挑战在于:
-
无法同时观测同一个个体的两个结果(反事实问题);
-
数据往往是观测性的(非随机分配),存在处理偏倚(selection bias);
-
对模型泛化性要求极高(真实分布中可能存在分布偏移)。
为了估计
,我们需要构建具有泛化能力的模型,从观测数据中学习潜在表示并对反事实进行合理预测。
2. 核心思想对比
TarNet 提出共享表示网络 + 双输出路径,显式建模 Y(0),Y(1),仅使用 Factual Loss。
CFRNet 在 TarNet 基础上引入 IPM 距离约束,实现处理组/对照组表示对齐。
DragonNet 进一步联合建模 Propensity Score(处理概率),增加 regularization 约束 ITE 稳定性。
它们都建立在同一框架下,但针对不同方面做出加强:
-
TarNet:因果预测的基本结构;
-
CFRNet:强化处理不平衡问题;
-
DragonNet:统一建模 Y 与 Propensity。
完整文章链接: 基于TarNet、CFRNet与DragonNet的深度因果推断模型全解析