其他分享
首页 > 其他分享> > 前沿: 卫星数据在实证研究中的应用, 用其开展因果推断的好处!

前沿: 卫星数据在实证研究中的应用, 用其开展因果推断的好处!

作者:互联网

前沿: 卫星数据在实证研究中的应用, 用其开展因果推断的好处!

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
前沿: 卫星数据在实证研究中的应用, 用其开展因果推断的好处!

关于一些计量方法的合辑,各位学者可以参看如下文章:①“实证研究中用到的200篇文章, 社科学者常备toolkit”、②实证文章写作常用到的50篇名家经验帖, 学者必读系列、③过去10年AER上关于中国主题的Articles专辑、④AEA公布2017-19年度最受关注的十大研究话题, 给你的选题方向,⑤2020年中文Top期刊重点选题方向, 写论文就写这些,⑥过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图。后面,咱们又引荐了①使用CFPS, CHFS, CHNS数据实证研究的精选文章专辑!,②这40个微观数据库够你博士毕业了, 反正凭着这些库成了教授,③Python, Stata, R软件史上最全快捷键合辑!,④关于(模糊)断点回归设计的100篇精选Articles专辑!,⑤关于双重差分法DID的32篇精选Articles专辑!,⑥关于合成控制法SCM的33篇精选Articles专辑!⑦最近80篇关于中国国际贸易领域papers合辑!,⑧最近70篇关于中国环境生态的经济学papers合辑!⑨使用CEPS, CHARLS, CGSS, CLHLS数据库实证研究的精选文章专辑!⑩最近50篇使用系统GMM开展实证研究的papers合辑!

正文

关于下方文字内容,作者:李文琦,加拿大英属哥伦比亚大学经济学,通信邮箱:liwenqiapp@126.com
今天,我们主要介绍一下"卫星数据在实证研究中的应用, 用其开展因果推断的好处!"。与本文产生关联的文章,有①夜间灯光数据校对的一些成熟方法推荐,②中国省/地级市夜间灯光数据release, 1992-2013的面板数据。
注:本文由三部分组成,前两部分是这两篇文章的单独分析,第三部分源于综合二者。
1.从上面看:卫星数据在经济学中的应用
这篇文章分别介绍了遥感数据(尤其是卫星数据)的优势、简介、应用和问题这四个方面(阅读笔记遵循原文顺序)。
有四大类优势被列出:

经济学历史悠久,人类的经济研究涉及面广泛,让一些机器,例如卫星,取代人工操作的技术显然还不够成熟。所以我们仍然在遥感技术甚至是机器技术的初期,需要详细了解它们的原理、应用、优势、问题等才能更好地发展和利用它们。这里作者缩小了研究范围,将大量的遥感数据(可能从除了卫星以外的其他飞行器机器中得到的)缩小为遥感卫星数据,也就是主要讨论卫星,但也没有完全忽视其他类型的遥感数据。
以下是作者提供的关于遥感的相关知识简介,具体知识分类如下:

遥感数据在经济学中的应用(此部分的每一种应用都涉及了很多前人的科研知识, 作者只做了简单综述,我也就简单记下重点)。

使用遥感数据的潜在问题:经济学家在运用卫星数据时,会碰到一些仅存于当时研究数据或者普遍数据中存在的挑战。这些可能出现的问题可能是数据样本大小、空间依赖、测量误差和隐私问题。

结论:总而言之,遥感数据可以节约大量成本。遥感卫星不断发展成更好的空间、时间、光谱分辨率,并且它们探测的频次也在逐步提高。人们不但可以更精细地研究分类产品,还可以研究连续产品,各种细微的常规方法难以测量的变量以及现实冲突等也都可以被卫星观察。
2. 使用卫星数据进行因果推理的好处和陷阱
本文讲的是使用卫星数据探究因果关系的好处和陷阱,以及其中的联系。作者用经典案例“土地覆盖”来展现卫星数据的工作,以及谈论卫星图片数据的潜在优势和问题。
本文中提到的卫星数据对环境经济学研究的好处主要有三点:
(1):卫星数据的收集相比传统方法更容易得到,尤其在研究土地覆盖这类涉及面积巨大的问题上,显得更加方便且节约成本。
(2):第二个优势与第一个优势是相对的。卫星数据不仅可以方便在大的面积、范围上观测,还可以深入到小范围(传统粗分辨率的普查数据无法做到)。
(3):一直可以连续观测大小区域里的各种变量。优势(1)和(2)与分类产品有关,优势(3)与连续产品有关。
从遥感的角度来说,由于时空分辨率的提高,数据产品可以落脚于更精细、更小范围、平常难以观测的时空尺度上的系统。由于遥感专家发明了免费、易读取的数据产品,政府公司等提供免费的卫星图像,网上平台让专家和非专家们更容易下载和处理这些卫星图像数据,从而方便转化为数据产品,进行研究和应用。
从 1972 年美国 NASA 发射卫星探测器以来,越来越多的卫星被各种国家、组织所投放,并且这些卫星至投放以来一直不停地捕捉地球物状的变化,提供源源不断的卫星数据。这里要进行说明,卫星传感器会在三个方面发生改变:时间分辨率(卫星返回地球同一地点所用时间);空间分辨率(每个数据像素点所捕获的面积);光谱分辨率(卫星测量的不同电磁光谱的波长)。卫星可以是无源的(卫星测得的是地球表面自然反射的能量);也可以是有源的(意味着卫星主动向地球表面发射刺激,地表于是反射刺激,卫星再测量这种来回的活动)
【插入介绍分类产品和连续产品!重要!】对于如何将光谱数据转化为有用的数据产品,遥感科学家发明了多种算法,其中有分类产品(比如将一块土地按用途划分:种植区、工业区等;按土壤成分划分:黑土、红土等);也有连续产品(例如,强调在研究土地覆盖中不同观测物的数值变化。我猜测由于这种变化是要经过持续观测才能得出的,所以叫连续产品)。
尽管遥感数据有很多好处,但人们不应由于它的的优势而忽视了它自身以及带来的问题。最核心的是系统误差(尽管随机误差也很重要),并且我们主要考虑的是问题出现在得到的数据是否准确这一基础环节上,而不是讨论是否正确处理了经过处理后的正确数据与结论之间的关系(事实上,这一部分通常被处理得当)。当卫星产品是随机误差时,如果数据用作因变量,可能会增加标准误差;如果用作自变量,会导致衰减偏差。但卫星产品中很多错误都是系统性误差(一直被认为地错误估计成为某一种形式)。
作者讨论了随机误差和系统误差的潜在来源:

系统误差非常值得关注,它会导致结论的高估或低估。比如,在分类产品中,农业林和人工种植林很可能被卫星数据归类为森林,这可能导致高估森林的收益。在连续产品中,“夜间照明”数据集,如果在一定的光照水平上,卫星数据产品会估计相同 的值,此时就很难有区分。这种系统性误差很可能在高度城市化的地区有体现,因为这些地方光照水平很高,卫星的光照估计值已经饱和。
同时我们要关注跨时间数据一致性的重要性。(1)同一个变量可能由不同卫星以不同方式测量,它们如果不标准化,则很难比较,最好先预处理,以减小差异。(2) 大气影响和云层覆盖的季节性,可能导致特定季节的卫星图像始终浑浊。例如,印度北部空气污染水平每年 10 月至 11 月一直很高,因为这段时间与农业燃烧季节相吻合。
最后,作者做出了假设,即使可以解决所有的随机和系统误差,但哪些卫星数据可以提供经济分析依然存在限制:
(1)遥感界关注的变量可能不是环境经济学家想要的。比如,“夜间灯光”数据集包含可测量的夜间亮度,但经济学家却对测量经济活 动感兴趣。
(2)卫星数据无法直接测量整个经济学中广泛关注的某些变量。
(3)在大量云和雾霾覆盖的地方,可能无法用最常用的无源卫星传感器获得数据。
3.知识回顾和拓展
第一篇文章介绍得很全面,包含了卫星数据(或者是范围更广的遥感数据)的简介, 应用,优势和劣势,在综述的基础上有创新。
第二篇文章感觉像是从第一篇里各个部分零星摘取了一些观点,然后换个说法。不过它还是有一些细节解释,比如详细提到了分类产品和连续产品这两个术语(尽管其中的含义在第一篇文章中已经涉及到了);详细谈到了跨时间数据一致性的重要性等。
我认为比较好的阅读顺序是先读第二篇,粗略了解卫星数据里的一些基本概念,然后再读第一篇类似综述的文章。阅读过程中有些知识点还需要巩固,如混淆矩阵怎么看,如何进行独立数据验证,内生性外生性的原因和影响等。这两篇文章都关注了长期发展领域中某些部分使用不当造成的不可忽视的误差。这令我想起了 p-value 检验,如 Ronald L. Wasserstein & Nicole A. Lazar (2016) The ASA’s Statement on p-Values: Context, Process, and purpose, The American Statistician, 70:2, 129-133 中提到的,我们在研究中通常用到的 p 值<0.05 的判断方法会不会被错误地应用。
Reference: Donaldson, Dave, and Adam Storeygard. 2016. "The View from Above: Applications of Satellite Data in Economics." Journal of Economic Perspectives, 30 (4): 171-98.
Reference: Meha Jain, The Benefits and Pitfalls of Using Satellite Data for Causal Inference, Review of Environmental Economics and Policy, Volume 14, Issue 1, Winter 2020, Pages 157–169.
拓展性阅读:

①关于各种因果识别方法的120份经典实证文献汇总”,②哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code,③因果推断的统计方法总结, 177份文献,④政策评估的计量方法综述, 包括最新因果推断方法,⑤在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献,⑥看完顶级期刊文章后, 整理了内生性处理小册子,⑤工具变量精辟解释, 保证你一辈子都忘不了,⑦DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征,⑧关于双重差分法DID的32篇精选Articles专辑!⑨关于(模糊)断点回归设计的100篇精选Articles专辑!⑩匹配方法(matching)操作指南, 值得收藏的16篇文章等,⑪MIT广为流传的政策"处理效应"读本,⑫DID的研究动态和政策评估中应用的文献综述,⑬最新政策效应评估的四种方法,⑭政策效应评估的基本问题。

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

标签:研究,数据,观测,遥感,产品,实证,前沿,卫星,因果
来源: https://blog.51cto.com/15057855/2676751