读书笔记:《原因与结果的经济学》
作者:互联网
原因与结果的经济学
前言
不要混淆因果关系和相关关系。混淆因果关系和相关关系,会导致错误判断。
我们采取任何行动都需要花费可观的金钱和时间。偏信那些看似存在因果关系的无稽之谈,把它们作为行动依据,不仅得不到预期的成效,还白白浪费了金钱和时间。如果依据因果关系有效地把这些金钱和时间利用起来,我们获得满意的成果的概率也会更高。
浅薄的人相信运气,强大的人相信因果。 —— 拉尔夫·爱默生
一、反事实:因果推理最根本的思考法
- 因果关系:前一个事件是后一个事件的原因,后一个事件是前一个事件的结果。
- 相关关系:一个事件变化后,另一个事件也随之发生变化。
判断因果关系的三个要点:
- 是否纯属巧合
- 是否存在第三变量
- 同时影响原因和结果的混杂因素
- 是否存在逆向因果关系
证明因果关系需要:反事实。反事实是指对过去未曾发生事实所做的假设。
这是因果推理中的根本问题,要证明因果关系,反事实是必经之路。
但是反事实无法创造,因为事实已经发生,所以我们需要用最贴切的值替换反事实。其替换的条件是,两个组是可比较的,但是在现实中很难找到这样的事例。
一般来说,在未能得到正确的反事实时,人们常会把没有因果关系的事项错误地理解为存在因果关系。
本书将具体介绍如何制造可比较的组,如何用最贴切的值替换反事实。这些方法的共同目标都是:制造可比较的组,用最贴切的值替换反事实。
科学依据是指反映因果关系的证据,经济学家不会把只证明了相关关系的分析成为证据,
章节 | 方法 | 描述 | 等级 |
---|---|---|---|
无 | 元分析 | 多个随机试验的整合,是证明因果关系的最确凿的方法 | 最高 |
2 | 随机对照试验 | 将对象人群随机分为干预组和对照组,据此分析因果关系。这种方法是因果推理的理想形态 | 高 |
3 | 自然实验 | 巧妙运用社会中发生的各种类似实验的现象来分析因果关系的方法 | 中 |
4,5,6,7 | 准实验 | 巧妙运用社会中发生的各种类似实验的现象来分析因果关系的方法 | 中 |
8 | 回归分析 | 掌握现有数据时的常用方法。如果有混杂因素的数据,就能排除其影响 | 低 |
巧克力消耗量越大,诺贝尔奖获奖人数越多?
巧克力不是生存必需品,而是所谓的奢侈品,所以富裕国家的摄入量自然更大。
虽然多吃巧克力就更有可能获得诺贝尔奖的说法言过其实,但摄入巧克力至少具有增强记忆力的功效。
二、随机对照试验:因果推理的理想形态
随机分组的重要性:人与临床试验小鼠的不同之处在于,人会按照自身的意识选择自己的行为。个人选择会导致两个研究对象组不具备可比较的属性。这种现象在经济学中被称为选择性偏差。
最可靠的方法就是用抽签等方式随机决定。通过随机分组,可以使个人无法按照自身的意志做出选择,因此可就不会出现选择性偏差。由此得出的接收体检组和不接受体检组便是可比较的。
具有统计学意义:
- 无法用误差或巧合解释的差异:在统计学上具有显著性。
- 属于误差或巧合范围内的差异:在统计学上不具有显著性。
元分析是指整合多项研究结果,从整体的角度验证关系的方法。
不能贸然实施不知是否有效的政策,即使需要付出一些成本,也应该先验证因果效应是否存在。
定期接受体检并不能带来长寿。
组织大规模随机对照试验虽然成本很高,但与为全体国民提供没有效果的体验服务相比,则要划算得多。
医疗费用自付比例和健康之间的因果关系。
医疗费用自付比例越高,人们就医或住院的次数越少。
提高自付比例从整体来看不会对健康状况造成不良影响,但会使贫困阶层人群的健康状况恶化。
在探讨提高医疗费用自付比例时,为了避免使贫困阶层受到不良影响,需要采取充分的安全保障措施,将经济困难人群的自付比例等控制在较低水平。
随机对照试验:随机对照试验通过投硬币、随机数表、抽签等方式,将研究对象人群随机分为接受干预的组(干预组)和不接受干预的组(对照组),使两组成为可比较的组,用对照组的数据替换干预组如果没有收到干预的反事实。
三、自然实验:利用与实验类似的偶发现象
自然实验的核心理论:用现有数据重现与实验类似的环境。
通过随机对照试验得到的数据称为实验数据。通过日常经济活动得到的数据以及从政府统计调查等渠道获得的数据称为观测数据。
采用观测数据进行分析时,首要工作是从观测数据中找出与人为实验相类似的环境。
研究是否投放广告和店铺销量之间的因果关系。
为了排除店铺经营状况,店长参与积极度的影响。
利用某家企业印刷机出现故障,导致部分店铺未能投放广告。对如期投放广告和未能投放广告的店铺进行比较。
研究医生性别和患者死亡率之间的因果关系。
为了排除男医生倾向于选择重症患者,或者重症患者倾向于选择男医生的影响。
只研究住院医师,即负责当班时收治的患者,不能主动进行选择。
女医生负责的患者死亡率更低。
研究出生体重和健康之间的因果关系。
对双胞胎中出生体重较重的婴儿(干预组)和出生体重较轻的婴儿(对照组)进行比较。
出生体重较重的婴儿更健康。
自然实验:利用研究对象人群由于法律制度变更、自然灾害等外生冲击的影响而自然分成的受影响组(干预组)和不受影响组(对照组)的现象,来验证因果关系。可以类比为自然形成的随机对照试验,比人工实验能排除更多影响因素。
研究被动吸烟和心脏病患病风险之间的因果关系。
利用美国各州的吸烟管控力度不同的自然实验。
对阻止吸烟进行严格控制,吸烟者未发生变化,但被迫受二手烟影响的人的健康状况得到了改善。
准实验
准实验:自然实验是利用观测数据和外生冲击,找到类似随机对照实验的环境。但是,可视为自然实验的环境可遇而不可求。准实验是对实验的模仿,即通过观测数据和统计学方法,打造出与实施随机对照实验相类似的状态。
统计学方法有以下四种:
- 双重差分法
- 工具变量法
- 断点回归法
- 匹配法
四、准实验:排除趋势影响的双重差分法
实验前后测设计无法证明广告与销售额之间存在因果关系。
不能用实验前后测分析:
- 没有考虑到随时间产生的自然变化(趋势)所造成的影响。
- 没有考虑到回归平均的可能性。
使用实验前后测比较使,前侧为反事实时,前后比较才有效。
双重差分法:分别获取干预组和对照组在实验前后测的数据。可以计算两个差分:
- 干预组前后的差异,对照组前后的差异。
- 干预组与对照组的差异。
用干预组的前后差异减去对照组的前后差异,排除了趋势的影响。
双重差分法成立的两个前提条件:
- 干预组和对照组在实验前趋势平行(相同)。
- 收到干预期间,没有出现影响结果的其他变化。
研究保育所数量和母亲就业之间的因果关系。
第一个差异:一段时间内母亲就业率的差异。
第二个差异:该段时间内保育所增长的地区的母亲就业率和保育所几乎没有增长的地区的母亲就业率的差异。
保育所的目的与其说是促进母亲就业,不如定位为为孩子开拓更好的未来更恰当。
研究最低工资和就业之间的因果关系。
第一个差异:一段时间内就业率的差异。
第二个差异:该段时间内最低工资水平提高的州的就业率和最低工资水平几乎没有增长的州的就业率的差异。
提高最低工资不会减少就业,而是导致企业提高了产品价格。最低工资的平稳上升对就业的不良影响是有限的。
双重差分法:该方法从受到干预的组(干预组)和未受干预的组(对照组)中获取干预前后的结果差异,以及干预后的对照组的结果差异。不过,该方法只在两个前提条件成立时才能发挥作用。第一个前提条件是,干预组和对照组在干预前具有相同的趋势,即趋势是可比较的。第二个前提条件是,在施加干预期间,没有其他变化对干预组和对照组的结果产生影响。
"不快点睡觉,妖怪就要来了"是正确的教育方法吗?
该教育项目看似有效,实际上不仅不具备让青年人改过自新的力量,反而提高了他们犯罪的概率。
五、准实验:利用第三变量的工具变量法
研究是否投放广告和店铺销量之间的因果关系。
利用打印企业的广告费打折活动,弄清楚广告对销售额的因果效应。
打折活动与店长的干劲无关,也不会直接影响销售额,但它会影响店铺是否投放广告的决策,从而间接影响到销售额。
工具变量:对结果没有直接影响,但会通过影响原因间接影响结果的第三变量。
工具变量法成立的两个前提条件:
- 工具变量要能够影响原因,但不直接影响结果。
- 必须确保不存在同时影响工具变量和结果的第四变量。
研究电视和学习能力之间的因果关系。
使用是否拥有电视作为收看电视的工具变量。
研究母亲的学历和孩子的健康之间的因果关系。
以17岁时的家庭居住地到大学的距离作为母亲的学历的工具变量。
教育不仅对受教育本人有益,下一代也会从中受益。对社会来说,教育是回报最高的投资之一。
工具变量法:该方法利用只能通过影响原因而间接影响结果的工具变量,使受到干预的组(干预组)和不受干预的组(对照组)形成可比较的状态。不过,这种方法只有在满足两个前提条件时才能发挥作用。第一个条件时,工具变量会影响原因,但不会直接影响结果。第二个条件是,不存在同时影响工具变量和结果的第四变量。
研究增加女性管理层成员和促进企业成长之间的因果关系。
将实施女性董事性别比例的法案实施前各企业的女性董事比例作为工具变量。
仅通过指定硬性指标来增加女性管理层成员,以达到鼓励女性参与管理、提高企业价值的目的,有时反而会适得其反。
六、准实验:关注跳跃的断点回归设计
研究是否投放广告和店铺销量之间的因果关系。
企业方案为:只有员工人数50人以上的大型店铺才能投放广告。
比较49人店铺和50人店铺的销售额,就可以明确广告对销售额的因果效应。
如果销售额在断点处出现了大幅跳跃,断点出现的跳跃是投放广告导致的,因此跳跃的幅度即可视为投放广告对销售额带来的因果效应。
断点回归设计成立的前提条件:在连续变量的断点附近,没有发生过影响结果的其他事件。
研究朋友的学力和自己的学力之间的因果关系。
勉强通过合格线考入精英高中的学生(干预组)和差那么一点没有合格线只能去上其他高中的学生(对照组)属于可比较组。
和学霸在一起,也无法提高自己的学习能力。
不应该过分期待周围人的影响而忽略了提高自己的实力。
研究医疗费用自付比例和死亡率之间的因果关系。
借助年满70岁以后医疗费用自付比例从30%降至10%的制度。
将70岁作为断点值,试图研究断点前后老年人在健康状况及医疗服务使用频率上的变化。
医疗费用自付比例降低后,虽然老年人去医院的次数变多了,但这对他们的死亡率和健康状况并不会产生影响。在不损害老年人健康的前提下消减医疗支出。
断点回归设计:断点回归设计是利用任意决定的断点值两侧自然成为干预组与对照组的情况,推算因果效应的方法。断点回归设计成立的前提条件是断点值周围没有发生影响结果的其他事件。
七、准实验:组合相似个人的匹配法
研究是否投放广告和店铺销量之间的因果关系。
找出相似的店铺进行比较。
匹配法:从对照组中选出和干预组非常接近的配对,使两组成为可比较组的方法。
倾向得分匹配法:将多个协变量整合成一个得分,用这个得分进行匹配。成立的两个前提条件:
- 所有会影响结果的协变量均为可转化为数值的数据。
- 所有协变量都必须用来计算倾向得分。
研究大学偏差值和收入之间的因果关系。
使用每名学生考上的大学和未考上的大学进行匹配。
并非对所有学生来说,就读于偏差值高的大学都意味着未来收入最大化。
在偏差值高的大学建立的人际社交网络或许会有利于少数人种群或贫困阶层的发展。
匹配法:该方法运用能够影响结果的协变量,从对照组中选出和干预组相似的样本进行匹配,并对两个组进行比较。存在多个协变量时,也可以将它们整合成一个得分进行匹配(倾向得分匹配法)。匹配法成立的条件是影响结果的所有协变量均可观测。
商务版随机对照试验:A/B 测试。
八、回归分析:便于分析现有数据
在实际工作和生活中,绝大部分数据只是对经济活动结果的记录,并非以分析为目的而收集的。遇到这种情况,随机对照试验或准实验大多没有用武之地。
使用多元线性回归分析,提前收集混杂因素的数据,在排除其影响的基础上再评估原因与结果的关系。
- 混杂因素:同时影响原因和结果的第三变量。
- 存在混杂因素时,无法正确评估因果关系,必须用匹配法或多元回归分析排除混杂因素的影响。
- 如果用多元回归分析等方法处理中间变量,则会低估原因原本具有的影响。
- 中间变量:由原因间接影响结果的第三变量。
- 中间变量的存在不会影响我们对因果关系的判断。
补充一:了解分析的有效性和局限性
有效性:
- 内部效度:是指两个变量之间的因果关系的确定程度,即对研究对象群体再次施加相同干预后,会出现相同结果的程度。
- 外部效度:是指对研究对象之外的群体施加相同干预后,会出现相同结果的程度。
随机对照试验的局限性:
- 实施随机对照试验的成本很高。
- 存在外部效度问题。很多随机对照试验在挑选研究对象时都设有严格的筛选条件,因此无法确定该研究结果是否也适用于其他群体。
- 很多试验出于伦理问题的考虑无法实施。
- 随机对照试验有时无法按计划随机分组,导致随机化失败。
- 与随机对照试验中得到的效果相比,实际在整个社会实践后产生的实效可能会变小。
判断因果关系的三个要点:
- 不是纯属巧合
- 不存在混杂因素
- 不存在逆向因果关系
补充二:因果推理的五个步骤
解读因果关系的五个步骤:
- 原因是什么
- 结果是什么
- 确认三个要点
- 不是纯属巧合
- 不存在混杂因素
- 不存在逆向因果关系
- 制造反事实
- 需要用最贴切的值来替换反事实的结果。
- 调整到可比较的状态
- 需要用最贴切的值来替换反事实的结果的有效方法:通过调整形成可比较的组。
标签:对照组,变量,读书笔记,因果关系,经济学,干预,随机对照,断点,原因 来源: https://blog.csdn.net/qq_39384184/article/details/111657946