首页 > 编程语言> > 中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

2021-03-28 22:51:10 作者：互联网

凡是搞计量经济的，都关注这个号了

稿件：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

之前，我们引荐过不少关于断点回归设计RDD的文章，里面包括操作数据、程序和解读，列示如下：1.断点回归设计RDD分类与操作案例，2.RDD断点回归, Stata程序百科全书式的宝典，3.断点回归设计的前沿研究现状, RDD，4.断点回归设计什么鬼？且听哈佛客解析，5.断点回归和读者的提问解答，6.断点回归设计RDD全面讲解, 教育领域用者众多，7.没有工具变量、断点和随机冲击，也可以推断归因，8.找不到IV, RD和DID该怎么办? 这有一种备选方法，9.2卷RDD断点回归使用手册, 含Stata和R软件操作流程，10.DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征，11.安神+克拉克奖得主的RDD论文, 断点回归设计，12.伊斯兰政府到底对妇女友不友好？RDD经典文献，13.PSM,RDD,Heckman,Panel模型的操作程序，14.RDD经典文献, RDD模型有效性稳健性检验，15.2019年发表在JDE上的有趣文章, 计量方法最新趋势，16.关于(模糊)断点回归设计的100篇精选Articles专辑！17.断点回归设计RDD精辟解释, 保证你一辈子都忘不了，18.“RDD女王”获2020年小诺奖！她的RD数据, 程序, GIS和博士论文可下载！关于她学术研究过程的最全采访！

正文br/>关于下方文字内容，作者：杨青清，湖南大学经济与管理研究中心经济所，通信邮箱：mikiyqq@163.com
这篇发表在AER上的文章设计了一套非常规范的RDD，系统考察了移民合法化对犯罪率的影响以及对应的作用机制。
叩开天堂之门：移民合法化对犯罪的影响，原文PDF附在文后

Pinotti, Paolo. 2017. "Clicking on Heaven's Door: The Effect of Immigrant Legalization on Crime." American Economic Review, 107 (1): 138-68.

关于这篇文章的程序和code都可以在这里下载，https://share.weiyun.com/Q9Uf8Z74

美国和欧洲等国家，无证移民（undocumented immigrants）无法正式工作或开展新的经济活动。他们只能进行非正规工作，合法活动的收入也较低，这意味着非法活动的机会成本很低，因此他们参与非法活动的倾向也更高。但是普通移民（regular immigrant）和非正规移民（irregular immigrants）只是两个不同的群体，并不能代表合法地位对犯罪率的因果效应。在因果识别过程中可能存在选择性偏误，风险厌恶程度较低或有较高违法倾向的人本身就更可能非法居留以及犯罪。
因此，本文使用模糊断点回归设计（fuzzy RDD）的方法研究了移民合法化对意大利移民犯罪率的影响。在临界点的选择上，采用了结构性断点（Structural Break）的方法，即临界点是未知的，这样可以更好保证准实验的随机性。作者发现，合法化使合法移民的犯罪率在1.1%的基准线上平均降低了0.6个百分点。在结果的稳健性方面，作者进行了密度检验（density test）和平衡性检验(balanced tests)，均通过了检验，即没有拒绝居住许可的分配在临界点前后是随机的这一假设。同时，结果在参数估计和非参估计中几乎没有变化。作者还将配置变量（running variable，也叫assignment variable）的阶数在0至6之间变化；改变带宽从截止时间的1分钟至30分钟；加入了申请者的固定效应；改变临界点的时间以进行安慰剂检验，从多方面论证了结果的稳健性。最后，作者探讨了本文可能面临的识别挑战并在结论部分提出了三点警告。
I. Institutional Background
意大利的移民政策是由需求驱动的。通常是在每年的11月，中央政府设立下一年可提供不同类别工人的居留许可配额。在规定的click days，意大利的雇主，不论是当地的还是合法的外国居民，都可以代表移民进行申请。申请成功的移民可以继续为该雇主工作，也可以寻找其他的工作，开始新的生意，等等。如果他们始终没有被雇佣，他们需在六个月内找到工作，否则只能离开意大利。
A. The Quota System
移民有两种类型：个人或家庭雇佣的护理人员获得A型许可证；企业雇员获得B型许可证，进一步可分为建筑工人——B1型和非建筑工人——B2型。另外，意大利为14个特权国家保留了特定的配额，没有按许可类型进行区分，这些国家加入了双边协议以控制非正规移民。Table 1展示了不同类型移民的配额、申请量以及配额占申请量的比例。我们也可以从该表中看到特权国家都有哪些。从表中不难发现，移民的配额是供不应求的。
需要注意的是，上述配额制度将申请人分为1,751个不同的组：特权国家的1,442组移民（103个省×14个民族）和其他国家的309组移民（103个省×3种许可证：A，B1和B2）。每个组中的所有申请人都在同一配额内竞争许可证。为确保简洁并强调准随机变异的主要来源是本文识别策略的核心，本文随后将这些组称为“lotteries”。
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

B. Type-A and Type-B Applicants
原则上，家庭和个人都应使用A型许可证来为家庭佣工担保。但是，非正规移民通过家人或朋友很容易拿到家庭佣工的合同。或者，他们可能支付给个人或组织几千欧元，假装是家庭佣工，从而成为合法移民。而为家庭佣工担保的条件也很简单，只需在click days前的最后一个月宣布收入超过800欧元即可。
为了证实这一问题，作者将click days 文件中A型移民的发生率和特征与ISMU调查中意大利伦巴第大区的移民进行对比。（ISMU是非政府组织Iniziative e Studi sulla Multietnicità 自2001年起每年进行的一项调查，调查对象包括正规和非正规移民，每年约9000人。）从Table 2 中可以发现，的确存在这样的异常。Figure 1则提供了按国籍划分的更详细的比较。
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

C. The Application Procedure
2007年之前，申请程序都是纸质且滚动处理的，但是这样做，数据需要工作人员手动输入，效率很低，因此从2007年开始全部数字化，雇主在每年特定的click days 通过网络提交申请，这些申请按照电子系统收到申请的顺序进行处理，并采取先到先得的原则。如果符合申请条件，则申请成功，允许申请人进入意大利的入境签证将发送到其原籍国的意大利领事馆。移民则需要返回原籍国再重新进入意大利，假装之前从来没有来过意大利。当申请达到配额时，便不再接收申请。这种机制使配额即将用尽的前后，获得居住许可的可能性形成断点。Figure 2 的panel A和panel B 分别展示了米兰的A型和贝加莫的B型许可每分钟申请的数量以及获得许可可能性随时间的变化情况。从图中可以发现，B型申请者被拒绝的比率要大于A型, 这种差异可能反映了欺诈性申请的发生率较高，或地方移民当局审查更严格，又或者两者均有。
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

II. Empirical Strategy and Data
A. The RD Design
式子（1）中的L是处理变量，当申请者在2007年的click days获得合法地位时，L=1，否则等于0。当申请者下一年在意大利犯罪时，C=1,否则C=0。等式右侧第一项为合法地位对click days之后申请者犯罪率的平均处理效应。图片则代表了选择性偏误，总结了其他可能与申请时间，即与获得合法身份的可能性有关的决定性因素的影响。
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

X代表了申请时间，X=0时为临界点，Z ≡ 1{X ≤ 0} 为处理分配虚拟变量（treatment assignment dummy），当申请者在临界点之前申请时，Z为1。
那么，中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！确定了Z对临界点附近的犯罪影响的简化形式。由于临界点的时间由所有申请的时间决定，且只会在click days 之后公布，Z在X = 0的任意窄带宽内可以视作是随机分配的。
作者通过临界点处理概率的第一阶段差异来重新调整简化形式的效果：
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

式子（2）的比值为合法地位对临界点附近顺从者犯罪率的的局部平均处理效应(LATE)。需要注意的是，在终止之前（之后）收到的申请被拒绝（接受）可能取决于申请人特征，而申请人特征也与犯罪倾向相关。作者将Z作为L 的工具变量，采用两阶段最小二乘法对式子（2）进行估计，以参数方式控制X的多项式，或以非参数方式将样本限制在临界值的窄带宽内。
B. Data
数据方面，包括移民数据和犯罪数据。其中移民数据包括申请者的原籍国、年龄、性别、申请的许可类型、所在的省份、申请时间以及申请的结果。本文将时间窗口限制在临界点前后一小时，并将申请者限定为男性，最终保留了110,337个申请者样本。申请的数据在个人层面与警方报告的所有罪犯的犯罪记录相匹配，这些犯罪记录是在2007年实施（至少一次）严重犯罪，包括抢劫，盗窃，贩毒，走私，勒索，绑架，谋杀和强奸。具体指标包括犯罪类型，犯罪发生的月份以及犯罪者是否被公然逮捕。值得一提的是，违反移民法并不构成严重犯罪。
另外，本文的配置变量为每个申请相对于其lottery的临界点的延迟时间。需要指出，本文的RD设计与我们通常看到的RD 不同的是：处理分配不取决一个预定的阈值规则，断点是未知的，取决于同一lottery提交的所有申请实现的时间和结果。基于以上设定，作者进行了Andrews(1993)的检验，检验对于每一个lottery，结构性断点的存在。该检验确定了"最有可能的断点"，并且允许我们检验结构性断点的显著性。Figure2 中的竖线展示了米兰和贝加莫所估计的结构性断点。对于绝大多数lotteries（包含98%的申请者），该检验都拒绝了不存在结构性断点的原假设，所估计的断点的中位数为8：39：06 AM,且大部分配额都在上午9点前被用尽。
III. Results
A. Baseline Estimates
Figure 3 展示了在click days前后申请者人均犯罪数量的变化。Click days 开始的前一年（2007年）没有显著的断点，临界值前后的犯罪率约为1.1%。Click days实施后（2008年），出现了在10%水平上显著的效应，为-0.3个百分点,即在临界点左侧申请者犯罪率降低。2SLS 所估计的效应为犯罪率减少0.6个百分点。(详见Table 3)
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

式子（3）为顺从者的平均特征。g(K)为个体特征K的分布，式子右侧可以通过将Z作为L的工具变量，再用2SLS估计g(K)L。
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

如果具体的分析不同类型的申请者，便会发现，犯罪率的降低完全由A型申请者驱动，在click days 之前，这些申请者的犯罪率为1.8%，但是在合法化之后，降低了-1.3个百分点（从Figure 3 和Table 3的column 2中可见）。而B型申请者几乎没有受到影响。
接着，作者从平均特征的差异以及配置变量的密度检验两方面说明了结果是在一定程度上是可信的。具体的结果见Figure 4 &Figure 5:
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

Table 4 显示了 2SLS 内核局部线性回归的结果。在选择带宽方面，作者分别采用了Imbens and Kalyanaraman (2012) (简称IK2012)，以及 Calonico, Cattaneo, and Titiunik (2014)（简称CCT2014）的标准。
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

由于更高阶多项式和更小的带宽会以较大的渐近方差为代价而减少偏差，因此Figure 6 展示了这两种形式的敏感性检验。Figure6展示了不同规格的参数回归和非参回归所估计的合法地位的2SLS系数以及置信区间。可以发现，当采用不同规格的参数和非参数方法时，估计值是非常相似的。
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

图7将此估计值与1,000个安慰剂的分布进行了比较。通过在lotteries中随机排列临界点，计算“假的”配置变量X̃作为每次申请的时间与安慰剂分界点之间的差，并估计X̃ =0.32处犯罪概率的不连续性，可以获得每个安慰剂估计值。Figure7中的p值可以解释为在合法地位没有影响的原假设下，估计偏差足以说明估计系数的大小。
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

B. Threats to the Indentification
这一部分分析了本文存在的两个识别挑战：
1.我们不能确定申请者每一时刻都在意大利

Presence in Italy before Click Days.

作者在之前的论述中都认为大部分的申请者一直在意大利。但是也存在部分申请者遵守移民规则，在申请时不在意大利的可能。因此，这些移民在click days前几天在意大利是不会犯罪的，因此相对于非正规移民而言，合法移民的犯罪率相对而言是较高的。这种可能性的存在可能会导致估计结果产生偏差。

Collecting the Entry Visa in the Country of Origin

成功的申请者必须从意大利驻原籍国大使馆领取签证，然后再进入意大利。虽然绝大多数申请人在click days时已经在意大利，但他们必须遵守这一程序，以便最终获得居留许可。因此，在click days后的几周内，成功的申请者必须前往原籍国，在意大利的时间便很少了。原则上，这一事实可以部分解释合法移民在click days后一年内犯罪率的下降。然而实际上，如果犯罪倾向在一年内没有显著差异，合法的申请者需要在意大利境外停留半年以上，才能将犯罪率下降0.6个百分点（基线为1.1%）。具体结果在Table 5中体现。Table 5 的列（2）和（3）展示了离意大利距离不同的原籍国对效应的影响。另外，如果效应是由在意大利以外度过的时间驱动的，由于距离较远的申请者回国的成本较高，他们可能会在原籍国度过更长的时间。因此，作者进一步比较了click days 之后不同时期合法地位对犯罪的效应，发现即使把时段缩短至最后一个季度，系数依然显著。从Figure 8中也可以更清楚的看出效应随时间的变化。总体而言，Table 5中关于申请人不同子样本和一年中不同时期的证据似乎排除了效应是由在意大利境外花费的时间驱动的可能性。
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

2.测量偏误
首先，由于一些罪行并没有被报告出来，被指控的罪行经常会低估所犯罪行。第二，警方记录的罪犯需要与申请人的姓名、国籍和出生年份的数据相匹配，因此在匹配过程中可能出现系统性偏误。
令图片代表被警方报告出来的犯罪的移民，
其中，中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

Table 5 的最后一列展示了针对公然被捕的罪犯的结果。
另外，作者认为，对于合法移民而言，犯罪被报告的概率要高于非法移民，所以数据可能高估了合法移民相对于非正规移民的犯罪率。因此本文估计的系数可以视为真实效应的下界。
C. Channels
首先，合法地位在2007年至2008年间降低了移民的犯罪率。其次，平均系数掩盖了申请者之间的极端异质性。特别是，对A型申请者的影响很大，而对B型申请者的犯罪率没有影响。A型申请者可能包括大量在犯罪和进入劳动力市场之间徘徊的人。为了进一步调查劳动力市场机会的重要性，本文还探讨了犯罪和担保人类型的异质性。具体结果如Table 6所示。对于A 型申请者而言，合法地位会对经济型犯罪产生显著影响；而担保人方面，更多的是由外国担保人驱动的，这与前文所说的虚假的家庭佣工也是相符的。
中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

IV. Conclusions
在结论部分，作者主要提出了三点警告：
1.本文以意大利为背景而获得的结果不能立即推广到体制背景迥异的国家；
2.作者基于以前关于这些层面合法地位影响的证据，强调了改善就业机会和工资作为新合法化移民犯罪行为变化的可能驱动因素的作用；
3.每一个合法化事件都可能导致对未来进一步大赦的期望，从而可能导致随后几年更高的移民压力。
这是该篇文章的程序和code，可以直接下载使用，下载链接如下：

https://share.weiyun.com/Q9Uf8Z74

中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究！

有些学术神器，推荐给各位：①找合适的英文期刊发表的神器! 亲测太好用了！②神器! SSCI分区及影响因子查询, 还有国人发表比例，③学术神器Endnote的最详尽使用方法，④一数学神器诞生! 手写公式和符号, 竟免费转成LaTex，⑤让LaTeX排版流行起来, 让效率助你奔跑助你飞。

拓展性阅读：①"实证研究13篇"功夫秘笈, 中青年学者研究必备锦囊！①关于各种因果识别方法的120份经典实证文献汇总”，②哈佛大学新修订完成的因果推断经典大作免费下载！附数据和code，③因果推断的统计方法总结, 177份文献，④政策评估的计量方法综述, 包括最新因果推断方法，⑤在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献，⑥看完顶级期刊文章后, 整理了内生性处理小册子，⑤工具变量精辟解释, 保证你一辈子都忘不了，⑦DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征，⑧关于双重差分法DID的32篇精选Articles专辑！⑨关于(模糊)断点回归设计的100篇精选Articles专辑！⑩匹配方法(matching)操作指南, 值得收藏的16篇文章等，⑪MIT广为流传的政策"处理效应"读本，⑫DID的研究动态和政策评估中应用的文献综述，⑬最新政策效应评估的四种方法，⑭政策效应评估的基本问题。

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。
2.5年，计量经济圈近1000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

标签：移民,犯罪率,申请者,范文,days,RDD,实证,断点
来源： https://blog.51cto.com/15057855/2675673