欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    回归诊断专业知识讲座培训课件.ppt

    • 资源ID:1641685       资源大小:1.09MB        全文页数:77页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    回归诊断专业知识讲座培训课件.ppt

    回归诊断专业知识讲座,回归诊断专业知识讲座,回归诊断专业知识讲座,2,回归诊断专业知识讲座2,在实际中这些假定是否合理?如果实际数据与这些假设偏离比较大,那么前面讨论的有关参数的区间估计,假设检验就不再成立。如果经过分析,已经确认对所研究的具体数据,上面的假设不成立,那么我们又希望探讨对数据作怎样的修正后,能使它们满足或近似满足这些假设。这些就是回归诊断中所要解决的第一个问题。回归诊断的另一个研究的问题是对数据的诊断,探查对统计推断有较大影响的试验点,这样的点称为强影响点。,回归诊断专业知识讲座,3,在实际中这些假定是否合理?如果实际数据与这些假设偏离比较大,,3.1 残差及残差图,回归诊断专业知识讲座,4,3.1 残差及残差图回归诊断专业知识讲座4,回归诊断专业知识讲座,5,回归诊断专业知识讲座5,回归诊断专业知识讲座,6,回归诊断专业知识讲座6,回归诊断专业知识讲座,7,回归诊断专业知识讲座7,回归诊断专业知识讲座,8,回归诊断专业知识讲座8,回归诊断专业知识讲座,9,回归诊断专业知识讲座9,回归诊断专业知识讲座,10,回归诊断专业知识讲座10,回归诊断专业知识讲座,11,回归诊断专业知识讲座11,统计诊断的内容和意义,我们所选择的模型能不能大体上反映所要研究的实际问题?我们收集的数据会不会由于收集过程中的疏忽或其它种种原因而出现较大的误差?这些错误数据会不会严重干扰我们对实际问题所作的结论?,回归诊断专业知识讲座,12,统计诊断的内容和意义 我们所选择的模型能不能大体上反映所要研,统计诊断是针对上述问题发展起来的一种分析方法。寻找一种诊断方法,判断实际数据与既定模型是否有较大偏离,并采取相应的对策是统计诊断的主要内容。,回归诊断专业知识讲座,13,统计诊断是针对上述问题发展起来的一种分析方,识别、判定和检验异常点。区分出对统计推断影响特别大的点(影响分析)。残差分析和残差图能用于研究既定模型与实际数据是否能很好拟合。其中包括:模型线性诊断、模型误差方差齐性诊断、模型误差独立性诊断、模型误差正态性诊断等。,综合以上所述回归诊断有如下主要内容:,回归诊断专业知识讲座,14,识别、判定和检验异常点。综合以上所述回归诊断有如下主要内容:,3.2 回归诊断一(数据的诊断),回归诊断专业知识讲座,15,3.2 回归诊断一(数据的诊断) 回归诊断专业知识讲座15,(一)、统计诊断的两个基本概念,(1)异常点 在回归模型中,异常点是指对既定模型偏离很大的数据点。但究竟偏离达到何种程度才算是异常,这就必须对模型误差项的分布有一定的假设(通常假定为正态分布)。,回归诊断专业知识讲座,16,(一)、统计诊断的两个基本概念(1)异常点回归诊断专业知识讲,目前对异常点有以下两种较为流行的看法:,把异常点看成是那些与数据集的主体明显不协调,使得研究者大感惊讶的数据点。这时,异常点可解释为所假定的分布中的极端点,即落在分布的单侧或双侧分位点以外的点,而通常取很小的值(如:0.005 ),致使观察者对数据中出现如此极端的点感到意外。,回归诊断专业知识讲座,17,目前对异常点有以下两种较为流行的看法:把异常点看成是那些与数,(2)强影响点 数据集中的强影响点是指那些对统计量的取值有非常大的影响力的点。在考虑强影响点时,有几个基本问题需要考虑:首先必须明确“是对哪个统计量的影响?”例如,线性回归模型所考虑的是对回归系数的估计量的影响;不是对误差方差的估计影响;或是对拟合优度统计量的影响等等。分析目标不同,所考虑的影响亦有所不同。,回归诊断专业知识讲座,18,(2)强影响点回归诊断专业知识讲座18,其次,必须确定“度量影响的尺度是什么?”为了定量地刻划影响的大小,迄今为止已提出多种尺度,基于置信域的尺度,基于似然函数的尺度等等。在每一种类型中又可能有不同的统计量,例如基于影响函数就已提出多种“距离”来度量影响,有Cook距离、Welsch - Kuh距离、Welsch距离等等。每一种度量都是着眼于某一方面的影响,并在某种具体场合下较为有效。这一方面反映了度量影响问题的复杂性,另一方面也说明了影响分析的研究在统计诊断中是一个甚为活跃的方向,还有大量有待解决的问题。,回归诊断专业知识讲座,19,其次,必须确定“度量影响的尺度是什么?”为了定量地刻划影响的,强影响点通常是数据集中更为重要的数据点,它往往能提供比一般数据点更多的信息,因此需引起特别注意。强影响点和异常点是两个不同的概念,它们之间既有联系也有区别。强影响点可能同时又是异常点也可能不是;反之,异常点可能同时又是强影响点也可能不是。,回归诊断专业知识讲座,20,强影响点通常是数据集中更为重要的数据点,它往往能提供比一般数,(二)、影响分析,回归诊断专业知识讲座,21,(二)、影响分析回归诊断专业知识讲座21,回归诊断专业知识讲座,22,回归诊断专业知识讲座22,回归诊断专业知识讲座,23,回归诊断专业知识讲座23,回归诊断专业知识讲座,24,回归诊断专业知识讲座24,回归诊断专业知识讲座,25,回归诊断专业知识讲座25,回归诊断专业知识讲座,26,回归诊断专业知识讲座26,回归诊断专业知识讲座,27,回归诊断专业知识讲座27,3.3 回归诊断二(模型的诊断),回归诊断专业知识讲座,28,3.3 回归诊断二(模型的诊断)回归诊断专业知识讲座28,回归诊断专业知识讲座,29,回归诊断专业知识讲座29,回归诊断专业知识讲座,30,回归诊断专业知识讲座30,回归诊断专业知识讲座,31,回归诊断专业知识讲座31,回归诊断专业知识讲座,32,回归诊断专业知识讲座32,回归诊断专业知识讲座,33,回归诊断专业知识讲座33,(2)模型修正 为了修改模型,我们再作以 为横坐标的残差图,回归诊断专业知识讲座,34,(2)模型修正 为了修改模型,我们再作以 为横坐,回归诊断专业知识讲座,35,回归诊断专业知识讲座35,模型修改后的预测值及残差,回归诊断专业知识讲座,36,模型修改后的预测值及残差回归诊断专业知识讲座36,模型修改后的残差图,回归诊断专业知识讲座,37,模型修改后的残差图回归诊断专业知识讲座37,误差方差齐性诊断,回归诊断专业知识讲座,38,误差方差齐性诊断回归诊断专业知识讲座38,回归诊断专业知识讲座,39,回归诊断专业知识讲座39,回归诊断专业知识讲座,40,回归诊断专业知识讲座40,回归诊断专业知识讲座,41,回归诊断专业知识讲座41,回归诊断专业知识讲座,42,回归诊断专业知识讲座42,回归诊断专业知识讲座,43,回归诊断专业知识讲座43,回归诊断专业知识讲座,44,回归诊断专业知识讲座44,回归诊断专业知识讲座,45,回归诊断专业知识讲座45,回归诊断专业知识讲座,46,回归诊断专业知识讲座46,回归诊断专业知识讲座,47,回归诊断专业知识讲座47,回归诊断专业知识讲座,48,回归诊断专业知识讲座48,回归诊断专业知识讲座,49,回归诊断专业知识讲座49,三、误差的独立性诊断,在不少有关时间问题中,观测值往往呈相关的趋势。如河流的水位总有一个变化过程,当一场暴雨使河流水位上涨后往往需要几天才能使水位降低,因而当我们逐日测定河流最高水位时,相邻两天的观测间就不一定独立。,回归诊断专业知识讲座,50,三、误差的独立性诊断在不少有关时间问题中,观测值往往呈相关的,回归诊断专业知识讲座,51,回归诊断专业知识讲座51,回归诊断专业知识讲座,52,回归诊断专业知识讲座52,回归诊断专业知识讲座,53,回归诊断专业知识讲座53,回归诊断专业知识讲座,54,回归诊断专业知识讲座54,回归诊断专业知识讲座,55,回归诊断专业知识讲座55,回归诊断专业知识讲座,56,回归诊断专业知识讲座56,回归诊断专业知识讲座,57,回归诊断专业知识讲座57,回归诊断专业知识讲座,58,回归诊断专业知识讲座58,回归诊断专业知识讲座,59,回归诊断专业知识讲座59,回归诊断专业知识讲座,60,回归诊断专业知识讲座60,回归诊断专业知识讲座,61,回归诊断专业知识讲座61,四、误差的正态性诊断,回归诊断专业知识讲座,62,四、误差的正态性诊断回归诊断专业知识讲座62,回归诊断专业知识讲座培训课件,回归诊断专业知识讲座,64,回归诊断专业知识讲座64,回归诊断专业知识讲座,65,回归诊断专业知识讲座65,回归诊断专业知识讲座,66,回归诊断专业知识讲座66,回归诊断专业知识讲座,67,回归诊断专业知识讲座67,回归诊断专业知识讲座,68,回归诊断专业知识讲座68,回归诊断专业知识讲座,69,回归诊断专业知识讲座69,回归诊断专业知识讲座,70,回归诊断专业知识讲座70,回归诊断在SAS上的实现,用语句plot r.*p. (r是residual的缩写,p是predicted的缩写)可以作残差r相对于拟合值p之间的散点图。如果此散点图在0水平线上下均匀散布,且对p没有趋向性,则可认为 满足方差齐性假设、且认为回归函数线性假设合理。,回归诊断专业知识讲座,71,回归诊断在SAS上的实现用语句plot r.*p. (r是,model y=x/dw r; 选项里加上dw表示计算DW检验的值。 r表示计算学生化残差,并计算Cook距离,若Cook距离相对较大,则课认为是强影响点。若学生化残差的绝对值大于2,则可认为是异常点。从学生化残差也可判断误差的正态性假设是否满足。,回归诊断专业知识讲座,72,model y=x/dw r;回归诊断专业知识讲座72,例子. 给10只大白鼠注射内霉素(30mg/kg)后,测得每只大鼠红细胞x与血红蛋白含量Y数据(见下页SAS文件),试对X和Y进行回归分析。,回归诊断专业知识讲座,73,例子. 回归诊断专业知识讲座73,data mouse;input x y;cards;654 130786 168667 143605 130 761 158642 129 652 151706 153602 151539 109;proc reg;model y=x;run;proc reg;model y=x/noint dw r cli clm;plot r.*p.;run;,回归诊断专业知识讲座,74,data mouse;回归诊断专业知识讲座74,残差图,回归诊断专业知识讲座,75,残差图回归诊断专业知识讲座75,误差的独立性诊断,回归诊断专业知识讲座,76,误差的独立性诊断回归诊断专业知识讲座76,第九个为异常点、强影响点,Output Statistics Std Error Student Cooks Obs Residual Residual -2-1 0 1 2 D 1 9.279 -1.129 | *| | 0.136 2 9.056 -0.0913 | | | 0.001 3 9.259 -0.0288 | | | 0.000 4 9.350 0.00543 | | | 0.000 5 9.101 -0.600 | *| | 0.054 6 9.297 -0.957 | *| | 0.094 7 9.282 1.180 | |* | 0.148 8 9.196 0.148 | | | 0.003 9 9.354 2.319 | |* | 0.480 10 9.437 -0.718 | *| | 0.036 Sum of Residuals 1.36513 Sum of Squared Residuals 857.80435 Predicted Residual SS (PRESS) 1031.32594,回归诊断专业知识讲座,77,第九个为异常点、强影响点 Output Statistics,

    注意事项

    本文(回归诊断专业知识讲座培训课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开