因果关系阶梯
发布时间:2024-03-24
点击次数:
《为什么》一书中,作者将因果关系分为三个阶梯,对因果关系揭示的程度依次升高:
第一等级:数据挖掘。
在这一个等级中,我们遵循着统计学的规律,通过我们的观察,在海量的数据中做回归分析,正态分布模拟,以期望在历史发生过的数据之中寻找结论,但是,我们必须承认,无论我们在数据挖掘的过程中寻找到了多么强力的证据证明A因和B因素有想象之中的因果联系,我们仍然不能够确定二者确实存在因果关系,我们只能通过相关系数代表其相关性的大小。统计数据在因果关系阶梯中处于最下层。它只能在一部分时间内预测未来,准确度低。
我们通过个人经验和经历在我们人生的时间轴上累积了大量的案例,对这些海量的数据做出类似于统计学之类的规律分析,以期待通过这种分析,确定因果律,来确定一个可行的预测模型来预测未来。
但是这种在历史数据中找答案的做法可能无效,我们不能确定的是“反向因果”“第三种因素干扰”等等混淆因子对我们的结论的冲击。
一个典型的例子就是:在过去的1000天的人类观察中,数据显示有933天太阳出来了(非阴天、下雨、下雪),且同时观察到雄鸡打鸣。二者具有高度的相关性。
但是我们不会认为下面的表述是正确的:
原因:雄鸡打鸣。
结果:太阳出来。
即使经验数据告诉你,这两个事物确实有联系。
第二等级:干预
在这一等级中,我们发挥了人类的主观能动性,不光去观察数据,而且开始主动改变输入的变量,然后通过前后对比来确定到底我们改变的变量对最终结果是否有影响。很多整形医院对他们的广告都会采用这种前后对比的方法来说明这种因果关系:是由于我们整形大夫技术好,她才变得这么漂亮的。
原因:整形大夫技术好
结果:她变得漂亮
但是前后对比的证据效力依然不会很强,其中的“混杂因子”仍然没有被排除殆尽。
假设某一天你患了感冒,然后医生给你开了感冒药,你服用了7天,病好了,前后对比确实会给你一种感觉:医生开的药是有效的,但是下面的因果关系却不是100%确定的:
原因:我吃了7天的感冒药。
结果:我病好了。
因为还有一种“混杂因子”没有被排除掉,那就是你自愈了,你吃不吃这7天的药,你的病都会好,只不过“你吃了7天的药”这件事情发生在前面,你就会认为发生在前面的事情是原因。
或者还有别的极端的原因,比如说你这七天是因为睡眠充足了,不熬夜了才把病治好的(第三种因素)。
所以前后对比并不是很靠谱。
这也是普通散户无法模仿巴菲特的价值投资的一个原因,因为巴菲特在持股之后会主动干预企业的经营决策,他不光是个伟大的投资者,而且是个伟大的企业家。他知道怎么把公司经营得更好。
这就引发了一个悖论:并不是因为这个投资标的本身又好又便宜,它以后的股价才上涨,而是因为巴菲特持股了它,且干预了它,经营管理水平的提高,导致公司股价上升。这里面就会有混杂因子存在了:我们可以把它叫做“皮格马利翁效应”“自我实现的预言”(直接控制公司的经营行为,用资金给一家公司赋能)。我们无法排除这些混杂因子,所以也就不能轻易地效法巴菲特的方法。
第三等级:未然历史
未然历史是没有被观测到的历史,是我们无法踏入的平行宇宙,是其他因素都不变的前提下,我们想象中的平行世界相互作对比,看看我们控制的变量在不同的取值下,不同的平行世界到底会有怎样的不同表现。如果我们生活的世界是主宇宙,发生的事件形成了主宇宙的历史,那么其他平行宇宙发生的历史事件就是未然历史。
这是能够探求到因果关系的最终极的方法。
人类的科学探索史中,我们无法对未然历史进行观察,所以我们用了“大规模随机双盲实验”这种手段来近似地模拟出来“观察到平行世界或者未然历史”的效果。