结构因果模型 SCM：形式化因果关系

FreeGuideOnline 最新 2026-06-14

结构因果模型是一套用数学语言精确描述因果关系的框架。它由 Judea Pearl 等学者系统发展而来，核心思想是将因果理解为变量之间稳定的、非对称的影响机制，而不仅仅是数据中的统计关联。掌握 SCM，你就能从“相关不等于因果”的模糊直觉，走向可量化、可检验、可操作的因果推理。

从古至今，人类依靠直觉理解因果：火会烧伤手，施肥能让植物长高。但面对复杂系统，直觉常常失灵：

SCM 用图模型与方程组将因果假设显式地写下来，从而：

一个结构因果模型由三个部分构成：

$$ x = f_X(\text{pa}_X, u_X) $$

其中 (\text{pa}_X) 是 (X) 在图中的直接原因集合，(u_X) 是与 (X) 对应的外生扰动。

关键点：结构方程是非对称的，它表示“原因决定结果”，而不是数学上的恒等式。如果你强行反转方程，因果含义就消失了。

因果图是一个有向无环图（DAG），节点对应内生变量，有向边表示直接的因果关系。图完全反映了变量间的定性因果依赖：

借助 DAG，我们可以直观地识别三种典型的因果结构：

(A \to B \to C)
(B) 是中介变量。(A) 对 (C) 的因果效应通过 (B) 传导。若以 (B) 为条件，会阻断该间接影响（但可能引入新的偏误，需谨慎）。

(A \leftarrow C \to B)
共同原因 (C) 导致 (A) 和 (B) 之间产生虚假相关。要估计 (A) 对 (B) 的真实因果效应，必须以 (C) 为条件（控制混杂）。

(A \to C \leftarrow B)
(A) 和 (B) 原本独立，但若以对撞节点 (C) 为条件，会在 (A) 和 (B) 之间引入虚假关联。这是许多选择性偏差的根源，例如伯克森悖论。

理解这三种结构，是掌握d-分离准则和识别混杂的关键。

观测数据反映的是系统自然运转下的联合分布。干预则表示从外部强制设定某个变量的值，切断该变量与其正常原因的联系。

在数学上，干预 (do(X = x)) 对应一个修正的因果模型：删除指向 (X) 的所有边，将 (X) 的结构方程替换为常数 (x)，其余方程保持不变。

$$ P(Y \mid do(X=x)) \neq P(Y \mid X=x) $$

前者是干预后的因果效应，后者只是条件概率，两者在存在混杂时完全不同。(do)-算子让我们能形式化“如果人为将变量设为某个值，结果会如何变化”的问题。

示例：
观测数据中，服用药物的人可能本身健康状况更差（混杂）。(P(\text{康复} \mid \text{服药})) 会低估药效。而 (P(\text{康复} \mid do(\text{服药}))) 通过随机试验或统计调整消除混杂，才反映真实因果效果。

反事实推理回答个体层面的假设性问题：“假如当时我没上大学，现在的收入会是多少？”这类问题涉及同一单位在不同处理状态下的结果对比。

在 SCM 中，反事实通过以下步骤实现：

形式化地，对于个体 (u)，反事实结果记为 (Y_x(u))，表示如果 (X) 被设为 (x)，在同一个体 (u) 下的 (Y) 值。

正是结构方程的非参数确定性（给定 (u) 后，所有内生变量确定），使得反事实在理论上具有明确的含义。SCM 提供了从总体因果效应（(do)-算子）过渡到个体因果效应的桥梁。

结构因果模型将因果推理从哲学思辨变为可计算工具。当你学会了用方程和图思考因果关系，数据分析的深度和严谨性将迈入全新层次。