欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    工具变量回归ppt课件.ppt

    • 资源ID:1902497       资源大小:1.68MB        全文页数:100页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    工具变量回归ppt课件.ppt

    工具变量回归,经典假设 所有的解释变量Xi与随机误差项彼此之间不相关。,若解释变量Xi和ui相关,则OLS估计量是非一致的,也就是即使当样本容量很大时,OLS估计量也不会接近回归系数的真值。,造成误差项与回归变量相关(内生性)的原因很多,但我们主要考虑如下几个方面:遗漏变量变量变量有测量误差双向因果关系。,遗漏变量偏差可采用在多元回归中加入遗漏变量的方法加以解决,但前提是只有当你有遗漏变量数据时上述方法才可行。双向因果关系偏差是指如果有时因果关系是从X到Y又从Y到X时,此时仅用多元回归无法消除这一偏差。同样,变量有测量误差也无法用我们前面学过的方法解决。因此我们就必须寻找一种新的方法。,工具变量(instrumental variable, IV)回归是当回归变量X与误差项u相关时获得总体回归方程未知系数一致估计量的一般方法。我们经常称其为IV估计。其基本思想是:假设方程是:,我们假设ui与Xi相关,则OLS估计量一定是有偏的和非一致的。工具变量估计是利用另一个“工具”变量Z将Xi分离成与ui相关和不相关的两部分。,在经济学中:(1)内生变量:由模型内的变量所决定的变量称作内生变量。(2)外生变量:由模型外的变量所决定的变量称作外生变量。,重要概念:内生变量和外生变量,在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”。这与一般经济学理论中的定义有所不同。1。与误差项相关的变量称为内生变量(endogenous variable)。2。与误差项不相关的变量称为外生变量(exogenous variable)。,我们的工作就是要寻找相应的工具变量将解释变量分解成内生变量和外生变量,然后利用两阶段最小二乘法(TSLS)进行估计。一个例子:考虑货币政策对宏观经济的影响。由于货币政策的制定者会根据宏观经济的运行情况来调整货币政策,故货币政策是个内生变量(双向因果关系)。Romer (2004)通过阅读历史文献将货币政策的变动分解为“内生”(对经济的反应)与“外生”(货币当局的自主调整)的两部分。,工具变量的选取,一个有效的工具变量必须满足称为工具变量相关性和工具变量外生性两个条件:即,(1)工具变量相关性:工具变量与所替代的随机解释变量高度相关; (2)工具变量外生性:工具变量与随机误差项不相关;,两阶段最小二乘估计量,若工具变量Z满足工具变量相关性和外生性的条件,则可用称为两阶段最小二乘(TSLS)的IV估计量估计系数1。两阶段最小二乘估计量分两阶段计算:第一阶段把X分解成两部分:即与回归误差项相关的一部分以及与误差项无关的一部分。第二阶段是利用与误差项无关的那部分进行估计。,具体来说:第一阶段:将X分解成与X高度相关的外生变量Z以及与干扰项ui相关的部分vi。,工具变量回归,谁开创了工具变量回归?1928年的著作的“The Tariff on Animal and Vegetable Oils”的附录B。作者是谁?Philip Wright 还是他的儿子Sewall Wright文体计量学的分析,为什么IV回归是有效的?,例1: Philip Wright的问题Philip Wright关心的是那个时期的一个重要经济问题:即如何对诸如黄油,大豆油这样的动植物油和食用动物设置进口关税。在20世纪20年代,进口关税是美国主要的税收收入来源。而理解关税的经济效应的关键在于要有商品需求和供给曲线的定量估计。由前知供给弹性为价格上涨1%引起的供给量变化的百分率,而需求弹性为价格上涨1%引起的需求量的百分率变化。,例如具休考虑黄油的需求弹性估计问题:,根据11个均衡样本点估计的方程究竟是需求函数还是供给函数?两者都不是。由于这些点是由需求和供给两者的变化确定的,因此用OLS拟合这些点的直线既不是需求曲线也不是供给曲线的估计。,利用这些样本点估计出来的OLS拟合线是需求曲线还是供给曲线,都不是!两个极端的情况如图:,因此,由于这些点是由需求和供给两者的变化确定的,因此用OLS拟合这些点的直线既不是需求曲线也不是供给曲线的估计。,Wright的解决办法:1。找到第三个变量,这个变量影响供给但不影响需求。这样,所有的均衡价格和均衡量对都落在这条稳定的需求曲线上,此时很容易估计出它的斜率。2。可见,这第三个变量,也就是工具变量,它与价格相关(它使供给曲线移动,于是导致价格发生变化),但与u无关(需求曲线保持不变)。,3。Wright考虑了几个可能的工具变量;其中一个是天气。例如,某牧场的降雨量低于平均值会使牧草减少从而减少给定价格时黄油的产量(会使供给曲线向左移动而使均衡价格上升),因此牧场地区降雨量满足工具变量相关性的条件。但牧场地区降雨量对黄油的需求没有直接影响,因此牧场地区降雨量与ui的相关系数为零;也就是牧场地区降雨量满足工具变量外生性条件。,上图表明若某个变量使供给曲线移动而使需求保待不变时会发生什么样的情况。现在所有的均衡价格和均衡量对都落在这条稳定的需求曲线,例2:班级模型对测试成缓的效应估计,尽管控制了学生和地区特征,但由于受诸如校外学习机会或教师质量等不可测变量的影响,第二篇中给出的班级规模对测试成绩的效应估计中仍然可能存在着遗漏变量偏差。若这些变量的数据不可得,则不能通过在多元回归中加入这些变量的方法来处理遗漏变量偏差。,工具变量回归提供了解决这一问题的一种思路。考虑下面的假想例子:由于夏天发生了地震,为了进行灾后修复工作,必须关闭某些加利福尼亚州的学校。而最靠近震中的地区受到的影响最严重。于是有学校关闭的地区需要把学生“挤在一起”,因此暂时扩大了班级规模。,这意味着到震中的距离与班级规模相关,故它满足工具变最相关性的条件但如果到震中的距离与其他影响学生成绩的因素无关(如学生是否还在学习英语),则由于它与误差项无关因此是外生的。于是到震中的距离这个工具变量可以用来避免遗漏变量偏差和估计班级规模对测试成绩的效应。,TSLS估计量的抽样分布,为了简单起见,我们仅考虑只有一个回归变量X和一个工具变量Z的情况。,即,参数的TSLS估计量为Z和Y的样本协方差与Z和X的样本协方差之比。,假设原方程为:,即总体系数为Z和Y的总体协方差与Z和X的总体协方差之比。,在香烟需求中的应用,为了减少由于吸烟导致的疾病和死亡,以及这些生病的人对社会其他成员产生的成本或外部性,一种方法是对香烟征收重税从而减少吸烟同时阻止潜在的新吸烟者。但具体需要增加多大幅度的税收来削减香烟的消费呢?例如,若要使香烟消费减少20%则香烟的税后售价应该是多少?,若需求弹性为-1,使价格上涨20%就能达到减少20%消费量的目标。若弹性为-0.5,则价格必须上涨40%才能使消费下降20%。同philip Wright对黄油的研究一样。我们无法通过数量对数关于价格对数的OLS回归得到香烟需求弹性的一致估计。我们利用TSLS和1985-1995年美国48个大陆州的年度数据估计了香烟的需求弹性。,模型假定:被解释变量:香烟消费,即为州内每人购买的香烟包数。内生解释变量:包含所有税收的每包香烟的实际平均价格。工具变量:由一般销售税征收的香烟税收。,这个工具变量设定是否合理? 工具变量的相关性:由于高销售税增加了总的销售价格 ,因此每包香烟的销售税满足工具变量相关性的条件。工具变量的外生性:若销售税是外生的,则必须与需求方程中的误差无关;即销售税必然只是通过价格间接影响香烟的需求。这看上去是合理的:主要是因为不同州选择了不同的销售额、收入、财产和其他公共财政事业的混合税收,所以不同州的一般销售税是不同的。其中关于公共财政的选择受到政治考量的驱使而不是受香烟需求有关的因素影响。,结论:这种工具变量的设置方法是合理的。因此我们利用两阶段最小二乘法(TSLS):第一阶段结果:第二阶段结果:,32,香烟需求 (续),33,STATA 实例: 香烟需求,第一阶段,34,第二阶段,35,结合到一个命令中,一般IV回归模型,因变量 Yi。外生解释变量 Wi。内生解释变量 Xi。我们引入的工具变量Zi。,更为详细的说明,引入工具变量的个数,假设我们有n个内生解释变量,引入了m个工具变量,n和m的关系是什么?n=m 恰好识别 nm 不可识别 只有恰好识别和过度识别才能用IV方法估计。,一般IV模型的TSLS,对一般的IV回归模型,我们需要修改工具变量的相关性和外生性条件。相关性条件:1. 当包含一个内生变量但有多个工具变量时,工具变量相关性的条件为给定W时至少有一个Z对预测X是有用的(相关的)。2. 当包含多个内生变量时,不但要排除完全多重共线性问题,而且工具变量必须提供关于这些变量外生性变动的足够信息,以分离出它们各自对Y的效应。外生性条件:工具变量外生性条件的一般叙述为每个工具变量必须与误差项ui不相关。,一般IV模型中的工具变量相关性和外生性,IV回归假设和TSLS估计量的抽样分布,基于TSLS估计量的推断,在香烟需求中的应用,在上一节中,我们基于1995年美国48个州的年消费数据利用包含一个回归变量(每包香烟的实际价格对数)和一个工具变量(每包香烟的实际销售税)的TSLS估计了香烟的需求弹性。但这个估计并非没有问题的。收入会影响需求,它是总体回归误差的一部分。若州销售税与州的收入有关,则它与香烟需求方程误差项中的某个变量相关。这违反了工具变量外生性的条件。会导致IV估计量是非一致的。因此我们需要在回归中加入收入这一变量。,除了工具变量SaleTaxi外,我们增加一个新的工具变量香烟专项税CigTaxi,香烟专项税提高了消费者支付的香烟价格,因此可证明它满足工具变量相关性的条件。同时它与州香烟需求方程中的误差项不相关,因此它是外生工具变量。,有了这个工具变量后我们就有了每包香烟的实际销售税和每包香烟的实际州专项税两个工具变量。因此需求弹性是过度识别的,即工具变量的个数(m=2)大于包含的内生变量个数(k=1)。现在我们就可以利用TSLS估计需求弹性了,其中第一阶段回归中的回归变量为包含的外生变帚ln(Inci)和两个工具变量。,结果,使得标准误差变小。,50,实例: 香烟的需求,51,实例:香烟需求,一个工具,52,实例: 香烟需求, 两个工具,53,工具变量有效性的检验,假设1:工具变量相关性工具变量相关性越强,也就是工具变量能解释越多的X变动,则IV回归中能用的信息就越多,因此利用相关性更强的工具变量得到的估计量也更精确。弱工具变量:如果虽然 但是,弱工具变量几乎不能解释X的变动。例子:在香烟实例中,我们可证明州到香烟生产厂家的距离是一个弱工具变量:虽然远距离提高了运输成本(因此使供给曲线向内移动,从而使均衡价格上升),但香烟很轻,因此运输成本只占到了香烟价格中的很小部分。故价格变动量中由运输成本也就是到生产厂家的距离解释的部分可能非常小。,为什么弱工具变量是个问题,如果工具变量是弱的,那么即使当样本容量较大时用正态分布近似TSLS估计量的抽样分布效果仍然很差。因此即便是在大样本下仍然缺乏常用统计推断方法的理论依据。事实上,如果工具变量较弱,则TSLS估计量严重偏离OLS估计量的方向。此外,用TSLS估计量1.96标准误差构造的95%置信区问包含系数真值的次数远小于95%,简言之,若工具变量较弱则TSLS不再是可靠的了。,弱工具变量会使得分母变得很小,甚至为0,导致结果严重偏离。,一个内生回归变最时弱工具变量的检验,当只有一个内生回归变量时检验弱工具变量的一种方法是利用F统计量检验TSLS第一阶段回归中工具变量系数都为零的假设。第一阶段F统计量,度量了工具变量中包含的信息:包含的信息越多,则F统计量的期望值越大。经验法则是如果第一阶段F统计量应该超过10。,即检验Z1、 Z2 、Zm的联合显著性。test Z1=Z2=Zm=0 计算F值 然后和10比较。,如果存在弱工具变量该怎么办?,1. 如果有很多工具变量,有少数强工具变量和许多弱工具变量,可以忽略最弱的工具变量而选用相关性最强的工具变量子集。2. 但如果系数是恰好识别的,则你不能略去弱工具变量。即使系数是过度识别的,但你可能没有足够的强工具变量用于识别,因此略去一些弱工具变量也没有什么帮助。在这种情况下,有两个选择:,第一个选择是寻找其他较强的工具变量。(难度较大)第二个选择是利用弱工具变量继续进行实证分析,但采用的方法不再是TSLS。而是对弱工具变量不太敏感的有限信息极大似然法(LIML)。在大样本下,LIML 与2SLS是渐近等价的,但在存在弱工具变量的情况下,LIML 的小样本性质可能优于2SLS。,假设2:工具变量外生性如果工具变量不是外生的,则TSLS是非一致的。工具变量回归的思想毕竟是工具变量中包含与误差项ui不相关的Xi变动信息。若工具变量实际上不是外生的,则它不能正确指出Xi中的外生性变动,因此表明利用IV回归无法得到一致的估计量。,工具变量外生性的检验,刚才我们提到:只有恰好识别和过度识别才能用IV方法估计。恰好识别:工具变量个数=内生变量个数过度识别:工具变量个数内生变量个数一个很重要的命题是:只有过度识别情况下才能检验工具变量的外生性,而恰好识别情况下无法检验。,过度识别约束检验,基本思想:假设有一个内生回归变量,两个工具变量且没有包含的外生变量。则你可以计算两个不同的TSLS估计量:其中一个利用第一个工具变量,而另一个利用第二个工具变量。由于抽样变异性,这两个估计量不会相同,但如果两个工具变量都是外生的,则这两个估计量往往比较接近。如果由这两个工具变量得到估计非常不同,则你可以得出其中一个或两个工具变量都有内生性问题的结论。,在恰好识别情况下,假设考虑只包含一个内生变量(k=1)的情况。此时如果有两个工具变量,可以计算出两个TSLS估计量,其中每个工具变量对应一个估计量,然后可以将两者进行比较看看它们是否接近。但如果你只有一个工具变量,则只能计算出一个TSLS估计量,这样就无法进行比较了。更直观地看,如果系数是恰好识别的,此时m=k,那么过度识别检验统计量J恰好为零。,一个综合的例子,工具变量选择的要求: 1。相关性:工具变量与内生解释变量高度相关,即Cov(xt,Zt) 0。 2。外生性:工具变量与扰动项不相关,即Cov(Zt,ut) =0。 使用工具变量有两种方法:二阶段最小二乘法(TSLS)和广义矩估计法(GMM)。,二阶段最小二乘法:2SLS,主要思想:进行两阶段回归。假设方程为: y=b1x1+b2x2+u 其中x1是外生变量,x2是内生变量,找到两个变量z1和z2,作为x2的工具变量。第一阶段回归:reg x2 x1 z1 z2 x2结合了z1和z2的信息,此时取出x2的拟合值x2_hat。第二阶段回归: reg y x1 x2_hat,我们利用数据集grilic.dta估计教育投资的回报率。变量说明:lw80(80年工资对数),s80(80年时受教育年限),expr80(80年时工龄),tenure80(80年时在现单位工作年限), iq(智商),med(母亲的教育年限),kww(在knowledge of the World of Work测试中的成绩),mrt(婚姻虚拟变量,已婚=1),age(年龄)。,建立如下初始方程: use grilic.dta,clear reg lw80 s80 expr80 tenure80,继续对方程进行分析:我们发现了如下问题:1。遗漏变量问题:认为方程遗漏了“能力”这个变量,加入iq(智商)作为“能力”的代理变量。2。测量误差问题:iq(智商)对“能力”的测量存在误差。3。变量内生性问题:s80可能与扰动项中除“能力”以外的其他因素相关,因此是内生变量。,解决方法:引入四个变量med,kww,mrt,age,作为内生解释变量iq与s80的工具变量。然后使用TSLS方法进行回归。ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first 几点注意事项:1. first选项的目的是显示TSLS第一阶段的结果,如果省略,则仅显示第二阶段的结果。2. 命令的用法比较严格,将被解释变量和所有外生解释变量放到括号外面,内生解释变量放到括号里面,等号后面为所有工具变量。,3。2SLS只能通过stata完成,利用定义手动计算的结果是错误的,因为残差序列是错误的。4。不可能单独为每个内生变量指定一组特定的工具变量,而是给所有内生变量指定一系列工具变量 。5。所有外生变变量都作为自己的工具变量。6。为了检验工具变量的外生性,本题为过度识别。7。在大样本下,IV 估计是一致的,但在小样本下,IV 估计并非无偏估计量,有些情况下偏误可能很严重。,弱工具变量检验,工具变量Z与 X 的相关性较低时,2SLS 估计量存在偏误,Z 称为“弱工具变量”。检验方法: estat firststage 1。初步判断可以用偏R2(partial R2) (剔除掉模型中原有外生变量的影响)。 2。 Minimum eigenvalue statistic(最小特征值统计量),经验上此数应该大于10。 这个方法类似于与书上的“第一阶段F统计量” (但允许有多个内生变量) 。,工具变量外生性检验,我们一般称为过度识别约束J检验。 检验工具变量是否与干扰项相关,即工具变量是否为外生变量。目前仅限于在过度识别的情况下,在此进行过度识别检验。TSLS根据Sargan统计量进行过度识别检验 。命令为: estat overid 检验工具变量的外生性。 H0:所有工具变量都是外生的。 H1:至少有一个工具变量不是外生的,与扰动项相关。,ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat firststage estat overid,究竟该用OLS 还是IV,还有一个重要问题没有考虑:我们只是假设解释变量中具有内生性。那么解释变量是否真的存在内生性?假设能够找到方程外的工具变量。1。如果所有解释变量都是外生变量,则OLS 比IV 更有效。在这种情况下使用IV,虽然估计量仍然是一致的,会增大估计量的方差。2。如果存在内生解释变量,则OLS 是不一致的,而IV 是一致的。,检验方法:豪斯曼检验检验,豪斯曼检验(Hausman specification test)H0 :所有解释变量均为外生变量。H1:至少有一个解释变量为内生变量。 quietly reg lw80 s80 expr80 tenure80 iq est store ols quietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age) est store iv hausman iv ols,在香烟需求中的应用,在香烟的案例中我们增加了两个工具变量:销售税与香烟专项税。我们现在判定这两个工具变量的外生性。我们发现:香烟专项税可能不具有外生性,例如,种植烟草的州的吸烟率要高于大多数其他州的吸烟率。而这个因素与税收相关,原因是如果烟草种植和香烟生产是这个州的重要产业,那么这些企业会努力让香烟专项税维持在低水平上,所以,这个州是否种植烟草和生产香烟,它可能与香烟专项税相关。,1. 由于这是一份面板数据,所以我们可以利用离差的形式消除这种不随时间变化的内生变量的影响。2. 两个不同年份间的时间跨度会影响弹性估计的解释。这是因为香烟是能让人上瘾的,所以只有在较长的时间范围,价格的改变才会改变吸烟者的习惯。即对于香烟来说,短期内的需求可能没有弹性,但长期内可能富有弹性。3. 因此,我们把时间差定为10年。,被解释变量,内生解释变量,外生解释变量,工具变量1,工具变量2,获得工具变量的方法,使用工具变量法的前提是存在有效的工具变量。因此,如果寻找工具变量在实践中十分重要。由于工具变量的两个要求(“相关性”与“外生性”)常常是自相矛盾的,即与内生解释变量相关的变量常常与被解释变量的扰动项也相关。故在实践上寻找合适的工具变量常常比较困难,有时需要一定的创造性与想象力。,第一种方法是利用经济理论提出工具变量。例如,Philip Wright对农业市场经济的了解促使他找寻使供给曲线移动但需求曲线不动的工具变量,于是他找到了天气。 第二种构造工具变量的方法是找出实际上是由导致内生回归变量移动的随机现象引起的内生回归变量X变化的某个外生因素。例如,在上面的假想例子中,地震造成的损害使某些学区的平均班级规校增大了,显然班级规模的这种变动与影响学生成绩的潜在遗漏变量不相关。,在实际操作中:寻找工具变量的步骤大致可以分为两步,(i)列出与内生解释变量(X)相关的尽可能多的变量的清单(这一步较容易);(ii)从这一清单中剔除与扰动项相关的变量(这一步较难)。,寻找工具变量的几个实例,例一。把罪犯关进监狱会减少犯罪吗?要考察的问题:入狱人口增加1%引起的犯罪率的变化。估计这个效应的一种方法是利用美国的州的年度数据建立犯罪率对监禁率的回归。此外,该回归中应该包含一些衡量经济环境的控制变量,人口统计变量等等。,遗漏变量偏差问题:双向因果偏差:一方面,被监禁的人增多使犯罪率下降;但另一方面,犯罪率上升会有更多的人被监禁。因此,我们必须选择工具变量,这个工具变量必须与监禁率相关(它必须是相关的),同时也必须与感兴趣犯罪率方程中的误差项无关(它必须是外生的)。,Levitt(1996)寻找了以下工具变量:监狱容量,即减少监狱过分拥挤的诉讼。1。监狱过度拥挤诉讼减慢了数据中囚犯监禁的发展速度,这表明这个工具变量是相关的。2。监狱过度拥挤诉讼是由监狱条件而不是由犯罪率或其决定因素导致的程度,我们得出这个工具变量是外生的。,例二。缩小班级规模能提高测试成绩吗?第二篇我们看到了,小班的学校往往比较富有,并且他们的学生也能获得更多的校内和校外学习机会,所以当时我们控制了各种度量学生富裕状况和英语学习能力等的变量,利用多元回归解决了遗漏变量偏差的威胁。遗漏变量偏差:但还有可能遗漏掉其他无法获得的变量,如校外的学习机会等。,因此我们需要找到一个工具变量,这个变量与班级规模相关(相关性),但与组成误差项的因素(如父母对学习的兴趣、课外的学习机会、教师的质量和学校设施)等不相关(外生性)。Hoxby(2000)找到的工具变量:出生日期导致的潜在入学人数距离其长期趋势的偏差1。这一变量与班级规模相关。2。这一变量与随机误差项不相关。,例三。对心脏病的积极治疗能延长寿命吗?模型的设置:被解释变量是患者期望寿命,解释变量包括二元治疗变量(患者是否接受了心导管术) 和其他影响死亡率的控制变量(年龄、体重、其他健康状况指标等等)。变量内生性问题:所有决定接受治疗的人都是被认为治疗有效的人,如果他们的决定部分取决于数据集中没有包含的但与健康结果有关的不可观测因素,则治疗决定与回归误差项相关。,McClellan,McNeil和Newhouse(1994)找到的工具变量:地理位置。大部分医院都不是专攻心导管术的。因此许多患者到没有提供这种治疗的“普通”医院的距离比到心导管术医院的距离近。所以可以把患者的家到最近的心导管术医院的距离和到最近的任何类型医院的距离之差作为工具变量,若距离最近的医院为心导管术医院,则距离之差为零,否则取正。如果这个相对距离影响到患者接受这种治疗的概率则它是相关的。同时它在患者间是随机分配的,因此它是外生的。,例四:警力与犯罪率。一般认为,警察人数越多,执法力度越大,则犯罪率应该越低。为了度量警力对犯罪率的作用,如果直接把犯罪率对警察人数进行回归,就会出现“内生变量偏差”。这是因为,警察人数其实是一个内生变量,比如,某个城市的犯罪率很高,则市政府通常会扩大警力规模。(双向因果关系),为此,必须找到与警察人数相关,但对犯罪率却没有单独影响的工具变量。Levitt (1997)创造性地使用“市长选举的政治周期”作为工具变量。通常,在任市长在竞选连任时,为了拉选票,会增加警察人数,故满足“相关性”。另一方面,选举周期一般以机械的方式确定,除了对警察人数有影响外,不会单独地对犯罪率起作用,故满足“外生性”。,例五:国际贸易与经济增长。国际贸易会带来财富是一个古老的观点。但要实证地研究国际贸易对经济增长的促进作用却面临着内生解释变量的问题,因为经济增长也可以反作用于国际贸易,即随着经济增长,国际贸易也跟着增加了。Frankel and Romer (1999)使用地理因素作为工具变量。首先,国际贸易受地理因素的影响(比如,距离越近的国家贸易量越大),故满足“相关性”。其次,地理因素对经济增长的影响可能仅仅通过国际贸易这个渠道来实现,故满足外生性。,例六:制度对经济增长的影响。好的制度能促进经济增长,但制度变迁常常也依赖于经济增长。因此,制度本身是一个内生变量。Acemoglu et al(2001)使用“殖民者死亡率”(settler mortality)作为工具变量。当近代欧洲的殖民者在全世界进行殖民时,由于各地的气候及疾病环境(disease environment)不同,欧洲殖民者的死亡率十分不同。在死亡率高的地方(比如,非洲),殖民者难以长期居住,故在当地建立掠夺性的制度(extractive institutions)。,而在死亡率低的地方(比如,北美),则建立有利于经济增长的制度(比如,较好的产权保护)。这种初始制度上的差异一直延续到今天。因此,“殖民者死亡率”与今天的制度相关,满足“相关性”。另一方面,“殖民者死亡率”除了对制度有影响外,不再对当前的经济增长有任何直接影响,故满足“外生性”。,

    注意事项

    本文(工具变量回归ppt课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开