珀尔的干预模型

看了“大问题Dialectic”的新一期——因果关系的本质是什么?

因果关系是什么

亚里士多德:因果关系是客观存在于世界之中的。

休谟:因果关系是人类主观心理上产生的一种习惯性联想。

康德:因果关系是人类认知结构中的认知形式。

刘易斯:因果关系是If not A, then not B。

珀尔:因果关系是P(Y|do(X=x)) ≠ P(Y)

休谟的观点一度让我陷入虚无主义和犬儒主义。后面两个人感觉已经不是哲学了,就是实用主义。

不过看到珀尔的干预模型让我耳目一新,这不就是生物学的研究范式吗?

我们先来看最左边的这个P(Y|X),这个我们上过中学的时候都学过,这就是条件概率,意思就是在X已经发生的条件下,Y发生的概率。其实表达的意思就是,X在多大概率上是Y的原因。举例子说,吸烟在多大概率上导致了肺癌,我们就可以写成P(肺癌|吸烟)。

比如说,你是一位科研人员,正在研究吸烟和肺癌的关系,你把人群分成了两组,吸烟的人和不吸烟的人,对应着中间这个公式,就是X=吸烟,意思就是,这是吸烟的这一组,以及X=不吸烟,意思就是,这是不吸烟这一组。这个大X=小x指事件大X的不同的状态,如果X是吸烟,那小x可以是指吸烟以及不吸烟,如果大X是太阳出来了,那小x可以是指出来了,以及没出来,以及出来一半,这取决于你的实验设置。

好,说回吸烟,你观察发现,吸烟者这一组患肺癌的概率是20%,不吸烟者这一组患肺癌的概率是10%,于是,你就得出结论说:吸烟会导致肺癌,吸烟就是肺癌的原因。能这样吗?答案是:并不能,这个结论并不可靠,为什么,因为你单纯通过观察就得出结论的话,没有排除混杂因子的干扰。

什么是混杂因子(Confounding Factor),这个混杂因子也就是一种干扰因素,比如我们看下面这幅示意图,我们看的到的是,X和Y之间好像有个因果关系,也就是X导致了Y,但其实,我们没看到的实际情况,是X和Y有一个共同的原因Z,这个Z一方面导致了X,另一方面导致了Y,这个Z就是混杂因子,Z混杂了X→Y的因果关系。拿吸烟和肺癌的例子来说,有可能并不是X吸烟导致了Y肺癌,而是有一个共同原因Z,比如说压力大,压力大的人一方面更容易吸烟,以及压力大的人另一方面更容易得肺癌。或者这个Z干脆就是一种特殊的基因,有这种基因的人一方面更容易抽烟,另一方面更容易得肺癌。这些都有可能。

所以说,珀尔的干预模型要做的一个重要工作就是,在考察因果关系的时候,一定要把这些个混杂因子给排除出去,。如果不排除混杂因子Z,就贸然说吸烟导致肺癌,这在做科研的时候就犯了混杂偏误(Confounding Bias)。这就是经典的相关≠因果的问题了。那怎么排除混杂因子——你得干预,你得do something,得有个do在其中,这就是右边的这个公式了。这才是珀尔干预模型的精髓,中间这个没有do的公式叫做观察,而右边这个有do的公式才叫干预。

那怎么干预?就是你得随机抽取人群,这里面有吸烟的,也有不吸烟的,你作为实验人员不是按照吸烟或不吸烟来划分人群了,而是你得主动地去干预,你得do something,也就是随机把人群分成两组,然后强行告诉第一组说,你们从今以后,必须给我吸烟,强制要求他们都吸烟,以及强行告诉第二组说,你们从今以后一根烟都不能抽,强制都不能抽烟。然后再对比,干预过的两组,他们分别得肺癌的概率分布有什么差别。你这样得出来的概率,才排除掉了混杂因子,才能干干净净地考察X与Y之间是否具有因果关系。

当然,强制让受试抽烟,这种实验肯定是没法做的,我这里就是为了让大家理解这个干预模型拿这个例子来说事儿。我们可以再举个例子。我们要考察名校学历对人40岁时候的收入的影响,现在都说要考上个985双一流大学,说是上不了名校的话,毕业以后薪资待遇就很低,真的是这样的吗?我们就来考察一下其中的因果关系。

这时候你就不能停留在观察层面——把人群分成上过985双一流的人为一组,以及上的是什么民本双非的人为另一组,然后对比他们40岁时候的收入,这样你就没有排除掉混杂因子,因为可能你得出上名校的人收入更高的结论,是因为有这么一个混杂因子Z,比如说,家庭条件好,家庭条件的人更容易上名校,以及家庭条件好的人更容易找到收入高的工作。你得排除掉这些混杂因子,单纯看收入和名校学历之间的关系。所以,你得干预,你得do something,那就是随机抽取一帮高三毕业生,不管他们的智商、家庭条件以及长得是否好看,随机把他们分成两组,一组人为让他们上名校,另一组人为不让他们上名校,然后再看他们40岁时候的收入,是否有显著的差异。这样经过干预才能真正捋清名校和收入之间的因果关系。

总之,这个干预模型的核心精髓,就是你得主动地去干预,而不是被动地观察,被动观察只能得到相关关系,而只有主动干预,才能排除混杂因子,得出干净的因果关系。现在我们回过头来看珀尔对因果关系下的定义,就一目了然了,这个定义就是,如果你人为地对X做一个干预动作,导致了Y的概率分布发生了改变,那么X就是Y的原因。

实验室吭哧吭哧干活儿就一个目的——为某个生物学现象建立“因果”,一共两个步骤。首先,通过观察发现“相关性”,比如“患病人群X总是跟基因A的异常相关联”,然后就开始做干预,细胞、动物、临床实验,通过控制变量(类似刘易斯的反事实依赖),看KO, 过表达, 做点突变, 小分子干扰等等能不能达到我们预期的效果。最后的Conclusion就是一句因果关系或一个因果链条。

感觉因果概念下都是还原论支配的,也许未来另一种抛弃因果的整体论研究范式会成为趋势。现在LLM和人类脑科学也许就是这样,但感觉还是没有因果关系信仰下的研究范式成熟清晰,也可能是已经有了但是我还没学到。

但随着AI大发展,感觉也反过来影响人们的哲学观念了。比如我现在就比以前更偏好认为:“因果关系”也许真的只是人类的一厢情愿,只是复杂世界在极简条件下的特例(类似牛顿力学和相对论的关系)。科学和哲学相互勾连,这种感觉真奇妙,也许同时也会影响人们的现实生活,比如认同机械论的人可能就没有人情味儿一点,而相信整体论的可能会更加尊重大自然的一切造物。

评论

4 + 1 = ?
您的邮箱地址不会被公开。必填项已用 * 标注 如遇验证码无法通过,请勿使用无痕/隐私浏览器模式