欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    SPSS统计分析基础入门(含多重线性回归分析)ppt课件.ppt

    • 资源ID:1999568       资源大小:6.65MB        全文页数:87页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    SPSS统计分析基础入门(含多重线性回归分析)ppt课件.ppt

    SPSS统计分析基础入门,SPSS,数据无处不在 - 将数据转化为信息 现象、问题在演绎 - 通过调查,求真,为什么学 SPSS Statistics?,SPSS SAS,SPSS,SPSS Statistics是什么?,Statistical Package for the Social Sciences “社会科学统计软件包”:原名 Statistical Product and Service Solutions “统计产品与服务解决方案” :2000年更改,世界上最早的统计分析软件:1968年,由美国斯坦福大学的3位研究生于研制,广泛应用于自然科学、技术科学、社会科学的各个领域 世界上应用最广泛的专业统计软件:目前世界上流行的三大统计分析软件之一(SAS、SPSS及SYSTAT)。全球约有28万家产品用户,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞 影响和信誉极高:在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法目前最新版本:IBM SPSS Statistics 20.0多国语言版,SPSS,SPSS Statistics的基本特点,易用性强:“易学易用易普及” 操作界面极为友好,操作简单,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成 良好的帮助系统和自学功能 适用于非专业统计分析人员 也为高级用户提供编程功能 兼容性好 数据输入:Excel、Lotus、 Oracle、SQL Server、Access、dBASE、文本,以及各类统计软件的数据形式SAS,Stata文件 数据输出:Word、HTML、XML、 Excel、 PowerPoint、PDF,功能强大 全面、成熟的统计过程:非常全面地涵盖了数据分析的整个流程,提供了数据获取、数据管理与准备、数据分析、结果报告这样一个数据分析的完整过程。 全面的统计技术:自带11种类型136个函数,提供了如数据汇总、计数、交叉分析、分类、描述性统计分析、因子分析、回归及聚类分析等广泛的基本统计分析功能。 全新的演示图形系统,能够产生更加专业的图片:高分辨率、色彩丰富的饼图、条形图、直方图、散点图、三维图形以及更多图表都是 SPSS Statistics中的标准功能。,SPSS,怎么学习SPSS Statistics?,理论是研究的基石: SPSS只是一个统计工具,需掌握统计学理论基础模仿是最好的学习选一种适合自己的学习途径: 网络资源教程上课培训班,自习参考书 1. SPSS统计分析基础、应用与实战精粹. 王璐、王沁. 化学工业出版社. 2012-3(非常适合初学者) 2. SPSS统计分析基础教程(第2版). 张文彤, 邝春伟. 高等教育出版社; 第2版 (2011年11月1日, 20.0) 3. 问卷统计分析实务-SPSS操作与应用.吴明隆. 重庆大学出版社. 2010-5-1.(读秀有全文,14.0) 4. SPSS统计分析与数据挖掘. 谢龙汉,尚涛. 电子工业出版社. 2012-1-1. (19.0,有光盘) 5. 统计分析与SPSS的应用(第三版). 薛薇.中国人民大学出版社. 2011-1-1(教材,入门) 6. SPSS在生物统计中的应用(第二版). 张力。厦门大学出版社。2008.8, 内容情况:一般SPSS教程1225章,200600页SPSS软件自带教程:大于1000页人大经济论坛: SPSS初中级视频课程张文彤主讲;15讲12h SPSS高级视频课程张文彤主讲;17讲15hSPSS官方初中级培训班:3天,SPSS,图书馆电子参考资料,图书馆主页数据导航中文资源非书资料管理系统安装虚拟光驱下载 图书馆主页书目查询光盘下载,SPSS,进行统计分析前不对数据进行整理和归纳。得到数据文件后,直接进行统计分析或绘制图表,根本没有对数据属性进行定义,也没有对数据文件进行科学必要的预处理。乱用各类统计方法。没有从实际问题的要求出发,不注意方法的使用条件,认为只要能输出结果即可。例如,定性数据采用连续性数据的统计方法,没有对数据标准化等。对分析结果输出的图表不知道其统计意义,更不知输出量的实际意义,因此无法对数据处理结果进行深层次的分析研究。,SPSS软件使用时常犯的错误,SPSS,基础知识介绍,SPSS界面与菜单介绍 数据准备 描述性统计分析 简单统计推断 相关分析 回归分析 图形的实现,SPSS Statistics,图书馆购买: IBM SPSS Statistics 20.0(简称SPSS20.0) 下载路径:图书馆主页帮助与指南常用软件,SPSS,1. SPSS界面与菜单介绍,4个主要窗口:数据编辑窗口、结果输出窗口、语法编辑窗口、脚本编辑窗口,变量视图:定义数据的格式(变量名、类型、宽度等),每一行代表对一个变量的定义,每一列则代表定义该变量时用到的某种属性,数据编辑窗口: 建立新数据、编辑和显示已有数据文件; 两个视图区,SPSS,结果查看窗口: 随执行统计分析命令打开,显示分析结果、统计报告、图表等 如果在运行时产生错误,也会输出提示信息 允许对输出结果进行常规编辑整理,窗口内容可以直接保存,“*.spv”,SPSS,菜单介绍,数据准备,二,要利用SPSS进行数据统计分析,首要的工作就是建立SPSS数据文件; 实际中收集、调查得到的数据资料往往是零乱的,不能直接进行统计分析; 主要由菜单栏中的【数据】和【转换】命令来实现 规范化操作中不可忽略的一步。,SPSS,2.1 数据文件的建立,四种创建数据文件的方法: 新建数据文件 直接打开已有数据文件:*.sav、*.sys,*.xls,*.sas7bdat,*.txt等 使用数据库查询:与大型数据库进行数据交换,如SQL、Oracle,也适用于Excel 从文本向导导入数据文件,SPSS,实例2-1:Excel数据的导入,1. 整理excel文档,第一行设置为变量,与spss格式相同2. 打开SPSS软件,菜单栏中选择【文件】【打开】【数据】命令,弹出【打开数据】对话框3. 选择2-1.xls文件4. 点选【从第一行数据读取变量名】5. 【确定】,文件2-1.xls是上证指数从2007年1月4日至2008年10月16日的数据资料,包括了开盘价、当日最高价、当日最低价和收盘价等选项,请将该数据导入至SPSS中。,SPSS,SPSS,2.2 SPSS数据文件的属性,SPSS数据文件是一种有结构的数据文件,包括文件结构和数据,在软件中创建好数据后,首先应该进行数据文件的属性定义或者结构定义。,SPSS,实例2-2: 左边是对人们信息获取情况的一个调研表,请定义问卷调查表的变量信息。,打开新数据表:文件新建数据,变量视图,变量名,数据类型,描述性的变量标签,描述性的值标签,用户定义的缺失值,SPSS, 缺失值:如果直接进行数据分析,SPSS将把缺失数据作为正常数据,造成非常大的误差 数据中存在漏填数据 数据中存在明显错误或明显不合理的数据(如年龄130) 缺失数据处理步骤: 1、指定缺失数据,指明哪些数据属于缺失数据(空缺数据,首先填一个特定标记数据) 2、统计分析时对缺失数据进行一定处理(选择缺失数据处理方法),SPSS,数据视图,变量名称,个案或观查值,SPSS数据文件中的一列数据称为一个变量,每个变量都应有一个变量名。 SPSS数据文件中的一行数据称为一条个案或观测量。,SPSS,2.3 数据管理和转换,通常情况下,刚刚建立的数据文件并不能立即进行统计分析,这是因为收集到的数据还是原始数据,还不能直接利用分析,需要对原始数据进行进一步的加工、整理。 数据变换是正式分析前的重要一步,通过数据变换,一个优秀的统计分析员可以将原始记录整理成所需的任何格式,从而为后面的精确分析打下坚实的基础。张文彤,变量级别的数据管理主要集中了一些对变量进行变换的过程,如对原始数据进行排序、转置、四则运算、对数据重新编码、求出变量的秩次等,这些功能往往在统计分析的预处理中起着非常重要的作用。 文件级别的数据管理对数据进行加工整理,比如根据统计分析的要求对数据文件进行分组、合并、加权、筛选等操作,观察值的名次:如3、5、-2、0、7数列各观测量的秩为:3、4、1、2、5,SPSS,案例2-3:文件合并,问题:已知2-3-1.sav和2-3-2.sav中的数据是北京、天津、河北等省市在2005年部分行业的固定投资额(亿元)数据,请将2-3-1.sav和2-3-2.sav的数据文件纵向合并。,SPSS,例:我国城市和农村居民消费价格分类指数数据见右表。 由于不同产品的价格涨跌不同,请找出城市和农村居民消费价格指数都较去年上涨超过 1%(指数101)的项目数。,案例2-4:变量值计数(消费价格指数的上涨项目),变量值计数:计算一些变量在同一个观测量中满足要求的特定变量值出现的次数。,Step1:转换对个案内的值计数;Step2:输入目标计数变量(x,增加率)Step3:选择计数变量,Step4:设置计数规则;Step5:完成操作,结果输出,描述性统计分析,三,统计分析的目的:研究总体的数量特征。研究者一般通过样本来研究总体。首先了解数据的整体情况,随后才能考虑做深入的推断两种方式实现: 第一,数值计算,计算常用的基本统计量的值,准确反映数据的基本统计特征; 第二,图形绘制,即绘制常见的基本统计图形,直观展现数据的分布特点。,SPSS,描述性统计分析是统计分析的第一步和先决条件在进行统计分析和建模前,常需对数据做一些描述性统计,了解数据的基本统计指标 定量数据:均数、标准差、标准误等 计数或分类数据:频率、比率等 SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在描述菜单中:【分析】【描述统计】,1.基本统计量 频率(F):该过程产生频数表; 描述(D):进行一般性统计描述; 探索(E):用于对数据概况不清时的探索性分析,3 描述性统计分析,3.1 频数分析,使用目的:了解变量取值的状况,对把握数据分布特征非常有用,是描述性统计中最常用的方法之一。例如,了解某班学生考试的学习成绩、了解某地区居民的收入水平等都可以借助于频数分析。作用: (1)编制频数表,按要求给出某百分位点的数值 频率:各类别的记录数 有效百分比:即各记录数占有效样本数的百分比,有效样本数总样本缺失样本数 累计百分比:即各百分比逐级累加起来的结果。最终取值为100 (2)绘制常用的条图、饼图等统计图 (3)还可以进行分位数、描述集中趋势的基本统计量等计算功能,案例3-1:利用频数分析产品销售信息,假设某公司每周大约卖出2000万件产品,但市场的需求不稳定,该公司的生产经理想更好的掌握近期该产品的分布情况。利用频数分析你能得到什么有助于生产及销售的的信息? 近期公司该产品每周的销售数据(单位:百万):24 18 18 26 24 23 16 18 21 20 21 24 19 19 14 22 21 26 27 15 19 17 20 20 19 22 23 16 23 21 15 19 21 20 22 15 24 19,Step1:打开 “3-1”(sav、xls)【分析】【描述统计】【频率】,Step2:设置“统计量”、“图表”内容,Step3:结果输出,描述分析目的:获取数据的均值、标准差、峰度等数据,进一步把握数据的集中趋势、离散程度和分布形状。,3.2 描述分析,基本描述统计量:(1)表示数据的中心位置(集中趋势) :均值、中位数、众数等(2)表示数据的离散程度(离散趋势):全距、方差、标准差、极差、变异系数等(3)刻画分布形态的描述统计量(与正态分布比较):数据分布是否对称,偏度、峰度等,众数:就是数据中出现次数或出现频率最多的数值中位数:即一组数据按升序排序后,处于中间位置上的数据值全距:也称极差,是数据的最大值与最小值之间的绝对离差偏度:描述变量取值分布形态对称性的统计量,0:对称;0:右偏;0:左偏峰度:描述变量取值分布形态陡峭程度的统计量,0:同正态分布;0:尖峰分布; 0:平峰分布。,Step:打开数据文件(3-2.sav)【分析】【描述统计】【描述】,3.2 描述分析,例3-2: 请你分析不同性别演员获奥斯卡金奖的年龄差异性。 男:32 37 36 32 51 53 33 61 35 45 55 39 76 37 42 40 32 60 38 56 48 48 40 43 62 43 42 44 41 56 39 46 31 47 45 60 女:50 44 35 80 26 28 41 21 61 38 49 33 74 30 33 41 31 35 41 42 37 26 34 34 35 26 61 60 34 24 30 37 31 27 39 34,3.2 描述分析,输出结果:,结果:男演员的获奖年龄波动幅度小于女演员,且都不服从正态分布。,3.3 探索分析,基本思想 从数据本身出发,不拘泥于模型的假设而采用非常灵活的方法来探讨数据分布的大致情况,从复杂的数据中分离出数据的基本模式和特点,让分析者发现其中的规律,为传统的统计推断提供良好的基础和减少盲目性主要内容(1)检查数据是否有错。过大或过小的数据均可能是异常值、影响点或错误值。要检查这样的数据,并分析原因,然后决定是否从分析中剔除这些数据(2)获得数据分布特征。很多统计方法模型对数据的分布有要求,如方差分析就需要数据服从正态分布(3)对数据的初步观察,发现一些内在规律用途:用于计算指定变量的探索性统计量和有关的图形。既可以对观测量整体分析,也可以进行分组分析。从这个过程可以获得箱线图、茎叶图、直方图、各种正态检验图、频数表、方差齐性检验等结果,以及对非正态或正态非齐性数据进行变换,并表明和检验连续变量的数值分布情况。,3.3 探索分析,例3-3:对中国南北城市的温度差异性作探索性分析,数据准备1:“变量视图”定义变量 数据准备2:“数据视图”输入数据,3.3 探索分析,Step1:打开数据(3-3.sav)【分析】【描述统计】【探索】,Step2:选择标签值 Step3:选择输出的描述性统计量 Step4:结果输出,3.3 探索分析,分析样本数据的稳健性,求出中心趋势的最大似然比的稳健估计值 4种稳健估计量:Huber(稳健估计量)、Hampel(非降稳健估计量),Andrew(波估计量),Tukey(复权估计量),结果:1. 北方城市的标准差大于南方城市,说明北方年平均温度变化较南方更大。2. 从分布形态看,南方城市年均气温呈尖峰、右偏特征;北方城市则为平峰、左偏。,3.3 探索分析,Step4:结果输出,结果:由M值差异可以得出,南北方数据差异明显。,茎叶图:第一列:频数,表示所在行观察值频数;第二列:茎,实际观察值除以图下方茎宽后的整数部分第三列:叶,实际观察值除以图下方茎宽后的小数部分它在反映数据整体趋势的同时,还能精确反映数值的大小,分析小样本时优势明显,在国外非常流行。,SPSS,箱 图,箱图:中间粗线为中位数;方框的两端分别表示四分位数(75%)和下四分位数(25%),两者间的距离为四分位数间距;方框外上、下两个细线分别表示除去异常值外的最大、最小值;凡是与四分位数值的距离超过1.5倍的都定义为异常值。,简单统计推断,四,均值比较-T检验 方差分析 非参数检验-卡方检验,假设的简单分类,SPSS,4.1 均值比较-T检验,总体中的每个个体之间存在差异,即使严格遵守随机抽样原则,也会由于抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同:两个变量均值不同的样本是否来自同一总体?其差异是否有统计学意义?,4.1 均值比较-T检验,类型: 均值分析:用于分组计算、比较制定变量的描述性统计量,如总和、均值、方差、标准差、观测数等,还可以给出方差分析表和线性检验结果。区别与“描述”,必须分组求均值,目的在于比较 单样本T检验:某个变量的样本均数与给定总体的已知均数相比,其差异是否有显著(例:周岁儿童的平均身高是否为75厘米) 非配对或独立T检验:检验由两个独立样本估计的总体均数之间的差异是否显著(如两种不同饵料养殖罗非鱼) 配对T检验:两组样本彼此不独立,又称为成对样本(如家兔接种某疫苗前后体温),T检验的先决条件是:样本的抽样呈正态分布,方差齐性(F检验) T检验是0假设,即总体均值与指定检验值之间不存在显著差异 T检验的结果:如果在置信度为95下,显著性水平0.05,则接受假设;如果0.05,拒绝假设,案例4-1:10只家兔接种某疫苗后体温是否有显著变化?,确定样本情况:自身配对的成对样本SPSS数据准备【分析】【比较均值】【配对样本T检验】,结果输出,不存在线性相关关系,P0.01,说明接种前后兔子体温有极显著差异,接种疫苗可使体温极显著升高,几个重要概念(1)因素:是指所要研究的变量(销售方式),它可能对因变量产生影响。(2)水平:水平指因素的具体表现,如销售的四种方式就是因素的不同取值等级。(3)单因素方差分析:只针对一个因素进行方差分析(4)多因素方差分析:同时针对多个因素进行方差分析,4.2 方差分析,案例: 某公司产品销售方式所对应的销售量,4种销售方式,就是多个总体均值是否相等的假设检验问题,需要采用的方法是方差分析,4.2 方差分析,基本假设(1)独立性:各组观察数据,是从相互独立的总体中抽取的(2)正态性:因变量在影响因素的各个水平上的分布必须服从正态分布(3)方差齐性:各个水平下的总体具有相同的方差 组间方差:水平之间的方差, 既包括系统性差异,也包括随机性差异; 组内方差:水平内部的方差,仅包括随机性差异,单因素方差分析 SST(总的离差平方和)=SSA(组间离差平方和)+SSE(组内离差平方和) SPSS将自动计算检验统计量和相伴概率P值,若P值小于等于显著性水平,则拒绝原假设,认为因素的不同水平对观测变量产生显著影响;反之,接受零假设,认为因素的不同水平没有对观测变量产生显著影响。,多因素方差分析,基本原理 对一个独立变量(因变量)是否受多个因素或变量影响而进行的方差分析 受到多个控制变量独立作用、控制变量交互作用及随机因素等三方面的影响 例如,对稻谷产量进行分析时,不仅单纯考虑耕地深度和施肥量都会影响产量,但同时深耕和适当的施肥可能使产量成倍增加,这时,耕地深度和施肥量就可能存在交互作用 Q表示各部分对应的离差平方和 采用F检验,其零假设是H0:各因素不同水平下观测变量的均值无显著差异。SPSS将自动计算F值,并依据F分布表给出相应的概率P值。我们可以根据相伴概率P值和显著性水平的大小关系来判断各因素的不同水平对观测变量是否产生了显著性影响。,案例:单因素方差分析,案例4-2: 某机构的各个级别的管理人员需要足够的信息来完成各自的任务。最近,一项研究调查了信息来源对信息传播的影响。在这项特定的研究中,信息来源是上级、同级和下级。在每种情况下,对信息传播进行测度:数值越高,说明信息传播越广。检验信息来源是否对信息传播有显著影响?你的结论是什么?,分析:信息来源是因素,“上级、同级和下级”是因素的三种不同水平,信息传播测度是因变量(观测变量)。由于这里有三个水平,因此不能采用两样本的均值检验过程,故考虑采用单因素方差分析法。 进行如下假设检验: H0:三种不同信息来源对信息传播测度平均值没有显著性影响; H1:三种不同信息来源对信息传播测度平均值存在显著性影响。,LSD:最小显著差数法。用t检验完成各组均数间的比较;S-N-K:Student Newman Keuls Test法,运用比较广泛的一种两两比较法,选择不同的均值多重比较方法:“两两比较”,“选项”,结果输出,组间显著性大于0.05,满足方差分析的前提条件2. 多重比较表明,各种途径信息来源对信息传播的影响均无显著影响,多因素方差分析案例4-3,数据准备: GMAT成绩.sav分析-一般线性模型-单变量分数因变量; 学校、课程固定因子,输出结果,4.3 非参数检验-卡方检验,SPSS,4.3 非参数检验-卡方检验,在实践中,常碰到一些样本的总体分布不明确,或者总体参数的假设条件不成立,或不服从正态分布时,采用非参数检验 非参数检验:不假定总体分布情况下,来实现对总体参数的推断 包括:卡方、二项式分布、游程、单样本K-S检验,以及两个独立样本、多个独立样本、两个相关样本、多个相关样本非参数检验,与参数检验相比,优势如下: 稳健性。总体分布的约束条件大大放宽,对个别偏离较大的数据不至于太敏感。 对数据的测量尺度无约束,对数据的要求也不严格,什么数据都可以做。 适用于小样本、无分布样本、数据污染样本、混杂样本等。 但是,如果参数检验模型的所有假设在数据中都能满足,且达到所要求的水平,那么用非参数检验可能导致低效率,最终浪费数据。,4.3 非参数检验-卡方检验,1.使用目的卡方检验(Chi-Squar Test)也称为卡方拟合优度检验,是K.Pearson给出的一种最常用的非参数检验方法。它用于检验观测数据是否与某种概率分布的理论数值相符合,进而推断观测数据是否是来自于该分布的样本的问题。如:根据投掷骰子实验中出现的点数检验骰子是否均匀,即各点出现的概率是否均为1/6。 2.基本原理 进行卡方检验时,首先提出零假设 :样本X来自的总体分布服从期望分布或某一理论分布。接着,利用实际观测值的频数与理论的期望频数之间的差异来构造检验统计量,它描述了观察值和理论值之间的偏离程度。 3.软件使用方法【分析】 【非参数检验】【旧对话框】【卡方】,案例4-4某公司经营多年,形成了一套成熟的企业文化和管理体系,例如根据多年的运营经验,经理层、监察员、办事员三种职务类别人员比例大约在15:5:80为宜,这样运行效率最高。目前公司进行人事调整,公司人员结构发生变动,有员工担心是否人事调整已经导致职务类型比例的失调。三种职务的期望构成比为15、5和80。而目前样本中观察到的三种职务的人数比为84:27:363,构成比分别是17.7、5.7和76.6,和理论值有差异。那么这种差异是由随机误差造成的,还是真的构成比和以前有所变化?该问题就可以用2检验来实现。相应的假设检验如下。 H0:目前三个职业的总体构成比仍然是15、5和80。 H1:目前三个职业的总体构成比不再是15、5和80 。,4.3 非参数检验-卡方检验,Step1:打开数据(4-4.sav)【分析】【非参数检验】【旧对话框】【卡方】 职务类别:“1”表示办事员,“2”表示监察员,“3”表示经理。Step2:选择检验变量 在左侧的候选变量列表框中选择“Employment Category(职务)”变量作为检验变量,将其添加至【检验变量列表】列表框中。Step3:选择期望值 在【期望值】选项组中点选【值】单选钮,以指定期望概率值。接着在【值】的文本框中分别输入0.8、0.05和0.15这三个数值,并且单击【添加】按钮加以确定。Step4:完成操作,4.3 非参数检验-卡方检验,结果输出:P值0.174大于显著性水平0.05。因此接受零假设,认为目前三个职业的总体构成比仍然是15、5和80,人数的调动只是随机误差造成的,公司人员结构没有显著性改变。,5. 相关分析,相关分析:研究变量相互关系的密切程度和变化趋势,并用适当的统计指标描述。 最常见的是两两相关分析,例如:鱼的体长与体重、作物的产量与施肥量等问题 统计关系常见类型:线性相关:两变量呈线性共同增大; 呈线性一增一减非线性相关:曲线相关; 两变量存在相关趋势不相关常用方法:l 散点图l 计算相关系数:区间是-1,1,是两个变量之间的线性关联的一个度量,相关分析案例,某科技人员饲养了35尾团头鲂,共重7.2kg,在水温29的条件下,测量摄食量与耗氧率之间的关系,请对摄食量与耗氧率作相关行分析。,SPSS操作步骤:数据准备【分析】【相关】【双变量】,结果输出:P=0.0000.01,差异极显著,表明摄食量和耗氧量之间存在极显著的正相关关系,耗氧量随着摄食量的增加而增加,Pearson 简单相关系数:适用于双变量正态分布资料(一般用字母r表示) Spearman 等级相关系数:适用于有序数据和不满足正态分布假设的等间隔数据,非参数统计 Kendall 等级相关系数:对有序变量或两个秩变量间相关程度的度量统计量,非参数统计,6. 回归分析,探察变量之间的数量变化规律,并通过一定的数学表达式来描述这种关系,进而确定一个或几个变量的变化对另一个变量的影响程度只要系数之间是线性组合的,并可通过变换可转换为线性方程的,都可尝试用线性模型进行拟合,回归分析与相关分析的关系二者均为研究两个或两个以上变量之间关系的方法。从广义上说,相关分析包括了回归分析。二者有区别:1、相关分析的两个变量平行,不一定存在因果关系;回归分析变量之间存在因果关系,自变量是因,因变量是果,一个回归方程内因变量只有一个,自变量可以有多个。2、相关分析仅仅研究变量之间的相互关系的密切程度和变化趋势,并用适当的统计指标描述。如果用一个或多个变量的取值来估计另一个变量的取值,这就是回归分析。,回归分类,一元线性回归分析,一元线性回归(简单线性回归):研究两个变量间的统计关系。一元线性回归方程,前提假设 线性趋势:自变量和因变量的关系是线性的,如果不是,则不能采用线性回归来分析。可以通过散点图来加以判断; 独立性:因变量y的取值相互独立,之间没有联系。反映到模型中要求残差间相互独立,不存在自相关,否则应采用自回归模型来分析 正态性:自变量的任何一个线性组合,因变量y均服从正态分布。反映到模型中要求残差服从正态分布 方差齐性:就自变量的任何一个线性组合,因变量y的方差均相同。反映到模型中要求残差的方差齐性。以上假定条件全部满足时,回归方程才有意义,一元线性回归分析,分析步骤,案例在四川白鹅的生产性能研究中,得到如下一组关于雏鹅重与70日龄重(g)的数据,试建立70日龄重(y)与雏鹅重(x)的直线回归方程,数据准备【分析】【回归】【线性】,R2(判定系数或决定系数)R2越接近1,拟合度越好多元回归用调整的R2,添加多个自变量,可以进行多重线性分析,输出结果,残差:观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。 回归直线意义的F检验 统计量F=平均回归平方和/平均残差平方和。 若F值过小说明自变量对因变量的解释力度很差,拟合的回归直线没有意义,相反若概率值(SPSS中以sig表示,越小越好)。,系数b,回归系数B21.712;截距(常数)582.185得出回归方程:y=582.185+21.712X,多重线性回归分析,研究一个因变量与多个自变量之间得线性依存关系 多元线性回归方程,常数,偏回归系数,随机误差,前提:因变量Y与自变量X1、X2、Xm之间呈线性趋势(t检验、F检验,查看其p值是否显著,得出其线性回归方程是否最优)举例:土壤中钙、磷、氮含量分别对30d番茄植株高度的影响。 SPSS操作步骤:数据准备【分析】【回归】【线性】,曲线回归分析,变量间的相关关系并非一定是线性的,更多的是个中曲线关系(只能分析一个变量)例:细菌繁殖的速率与温度的关系、鱼的体长与体重关系、药物的致死浓度与致死率关系、作物的施肥量与产量的关系、光照强度合光合作用效率的关系等等在许多情况下,曲线回归还可以通过变量转换化成线性形式,SPSS可拟合模型:线性方程;对数曲线方程;反函数曲线方程;二次曲线方程;三次曲线方程;复合曲线方程;复合曲线方程;幂函数曲线方程;S形曲线方程;生长曲线方程;指数曲线方程;Logistic曲线方程,S形生长曲线,7. 图形的实现,7. 图形的实现,案例:几种动物性食品营养成分(饼图),打开”几种动物性食品营养成分“(sav)【图形】【旧对话框】【饼图】,双击图框,更改图表属性: 图表大小、颜色、角度 坐标轴刻度间隔 显示数据标签 变换表格形式,图表编辑窗口 双击修改图表属性,小 结,SPSS使用注意事项掌握统计学的基本知识先对数据进行宏观把握正确定义变量根据数据以及分析思路选择合适的SPSS命令,SPSS其他功能: 因子分析、分类分析、生存分析、信度分析、时间序列分析、对数线性模型、对应分析等,研 究,假 设,数据收集,数据收集,数据处理,结 论,假设检验,SPSS处理,统计流程,实验设计,

    注意事项

    本文(SPSS统计分析基础入门(含多重线性回归分析)ppt课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开