欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    SPSS统计分析与应用》教学讲义.ppt

    • 资源ID:5449265       资源大小:1.16MB        全文页数:322页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    SPSS统计分析与应用》教学讲义.ppt

    SPSS统计分析与应用,新疆财经大学应用数学学院亚生海力力2011.9,1.1 SPSS 17.0概述,关于SPSS:SPSS是“社会科学统计软件包”(Statistical Package for the Social Science)的简称,是一种集成化的计算机数据处理应用软件。广泛分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个领域和行业。SPSS是世界上公认的三大数据分析软件之一(SAS、SPSS和SYSTAT)。由原来单一统计产品开发转向企业、教育科研及政府机构提供全面信息统计决策支持服务。伴随SPSS服务领域的扩大和深度的增加,SPSS公司已决定将其全称更改为Statistical Product and Service solutions(统计产品与服务解决方案)。SPSS的发展:60年代:美国斯坦福大学三位研究生研制70年代:SPSS总部成立于芝加哥,推出SPSSX中小型机版80年代:SPSS公司(SPSS/PC+微机版13)90年代:SPSS公司(SPSS WINDOWS版514)|2000年以后:SPSS公司(SPSS WINDOWS版1518),第1章 SPSS 17.0 概述,SPSS 主要特点:,操作简便。绝大多数操作是通过菜单、按钮、对话框完成的。无需计算机编程、需记忆大量命令和参数。分析方法丰富、分析结果清晰、直观。可以直接读取其他软件格式的数据文件,如:dbf、xls、sas等。最新版本采用分布式分析系统,适应互联网,支持动态收集、分析数据和HTML报告与一般的办公软件直接兼容不方便,1.1.1 SPSS 17.0的新增功能,全新的语法编辑器。SPSS 17.0对语法编辑器进行了重新设计,语法编辑器增加了自动完成、颜色编码、书签和分界 点等功能,提高了用户的编辑效率。定制对话框生成器。定制对话框生成器可以满足用户生成命令语法创建和管理定制对话框的操作要求,用户可以从多个命令生成语法,从而实现更强的个性化扩展功能的要求。增加了多重插补、最近邻元素分析、RFM 分析。最近邻元素分析利用元素相似性实现个案分类的方 法。缺失数据值的多重插补可以在运行其他过程时方便地进行缺失值的处理并获取汇聚结果。RFM分析是一种用于标识最可能对新产品做出反应的现有客户的方法,多用于市场分析和调研。增强了导出输出功能。SPSS 17.0提供了 更多的输出导出格式选项和更多导出内容。,1.1.2 SPSS 17.0对运行环境的要求,运行SPSS 17.0对计算机的要求并不高,但是如果用户希望获得较快的处理速度则需要配置较大的内存。对于较大的数据处理和复杂的统计运算,计算机最好具有较大的内存。SPSS 17.0对计算机硬件的基本要求如下:(1)Pentium系列或等同性能的处理器。(2)至少256 MB内存。对于复杂的统计分析和数据量较大的运算,需要512 MB 或1GB 内存.(3)至少800 MB 的剩余硬盘空间。如果需要安装SPSS 17.0 的全部模块,则大约需要1.1 GB 的硬盘空间。(4)VGA 显示器和与Windows 2000/XP/Vista 兼容的图形适配卡。(5)CD-ROM 光盘驱动器。(6)网络接入设备。用于访问SPSS公司的网站获得相应的技术支持和软件升级。,1.1.3 SPSS 17.0的启动与退出,1.SPSS 17.0的启动,启动SPSS 17.0可以双击桌面上的SPSS Statistics 17.0图标,也可以在“开始”菜单中依次选择“程序”|“SPSS Statistics”命令。启动后会出现如左图所示的启动界面,启动界面给出了SPSS的版本等信息。然后会出现启动选项界面,如右图所示。出现这个界面,表示SPSS 17.0已经成功启动。,SPSS 启动选项包含6单选按钮,分别是:“运行教程”、“输入数据”、“运行现有查询”、“使用数据库向导创建新查询”、“打开现有数据源”和“打开其他文件类型”,2.SPSS 17.0的退出,在菜单栏中选择“文件”|“退出”命令或者单击数据编辑窗口右上角的“关闭”按钮,都可以退出 SPSS。,1.1.4 SPSS 17.0的常用界面与窗口,SPSS的基本界面包括:数据编辑窗口(主窗口)、结果输出窗口、对象编辑窗口、语法编辑器窗口和脚本编写窗口,下面分别介绍如下:(1)数据编辑窗口功能:对SPSS的数据文件进行录入、修改、管理等基本操作的窗口。组成:标题栏、菜单栏、常用工具按钮、数据编辑显示区、系统状态栏、视图转换栏、数据单元格信息显示栏、窗口控制按钮。特点:SPSS运行过程中自动打开SPSS中各统计分析功能都是针对该窗口中的数据进行的窗口中的数据文件以.sav存于磁盘上两个视图:数据视图和变量视图,如果在启动选项中选择“输入数据”或“打开现有数据源”,进入 SPSS后的第一个窗口就是数据编辑窗口,如下图所示,(2)结果输出窗口(一)功能:SPSS统计分析报表及图形的输出的窗口。组成:标题栏、菜单栏、常用工具按钮、结果显示区、状态显示区、导航窗口。特点:在进行第一次分析时自动打开,也可手工打开可以手工打开若干个可相互切换的viewer(观测)窗口;状态栏上的!表示当前输出窗口输出窗口可以关闭,窗口内容以.spv存于磁盘上两个视图:目录视图和内容视图,结果输出窗口,驾驭(yu)数据输出窗口一般操作结果文件的打开和保存驾驭加密保存窗口元素的移动和删除标准的拖放式操作在大纲视图中操作最方便结果的导出以纯文本格式导出、以HTML格式导出如何在WORD中引用分析结果统计表格:拷贝或拷贝对象统计图:拷贝对象,表格的编辑表格状态的确定单元格内容编辑行列转置自动调整表格样式的变换,结果输出窗口(二),(3)对象编辑窗口,在结果输出窗口的显示窗口中,直接双击其中的表格或图形均可打开该输出结果对应的对象编辑窗口,如下图所示,几种常见的对象编辑窗口,在对象编辑窗口中我们可以对表格、图表等进行相应的编辑操作。具体的编辑操作,后面相关章节将做详细介绍。,窗口标题:语法编辑器 功能:编写和修改SPSS程序的窗口。特点:打开:文件-新建-语法或文件-打开-.SPS扩展名窗口中的程序以.SPS存于磁盘上。菜单项运行中提供四种程序执行方式:全部、选择、逐步前进、至结束。,(4)语法编辑器窗口,依次选择菜单“文件”|“新建”|“语法”命令或“文件”|“打开”|“语法”命令均可打开语法编辑器窗口,如下图所示。,用户可以在语法编辑器窗口输入或修改SPSS命令,或单击任何分析对话框上的粘贴按钮将使用对话框设计的各种命令或选项粘贴到语法编辑器窗口。,(5)脚本编写窗口 依次选择菜单“文件”|“新建”|“脚本”命令或“文件”|“打开”|“脚本”命令均可打开脚本编写窗口,如下图所示。,1.2 SPSS基本运行方式,完全窗口菜单方式:所有分析操作过程都是通过菜单和按钮及对话框方式进行的。是经常使用的一种运行方式,适用于一般分析和SPSS的初学者。,程序运行方式:手工编写SPSS命令程序一次性提交计算机运行适用于大规模的分析工作和熟练的SPSS程序员.实现方法:(1)打开语法语句窗口并编写和修改SPSS程序(2)点击语句窗口中的运行菜单项,选择运行方式运行,菜单程序混合运行方式:先通过菜单选择分析过程和参数,不立即提交(确定)执行,而是按动粘贴按钮。计算机自动将用户刚定义的分析过程和参数转换成SPSS的命令,并显示到语法语句窗口中。用户可对其进行必要的修改后再提交给计算机执行。一般适用于熟练的SPSS程序员.,1.3 利用SPSS进行数据分析的步骤,建立SPSS数据文件定义数据文件结构录入修改和编辑待分析数据数据的统计分析统计分析之前的预处理统计分析数据和分析结果的保存结果的说明和解释,思考复习,SPSS有哪几个主要窗口?功能是什么?有哪些特点?SPSS有哪些运行方式?特点是什么?,第2章 SPSS 17.0 基本操作与数据管理,2.1 SPSS 17.0 基本概念,2.1.1 数据编辑器与数据文件,SPSS的数据编辑器是用户进行数据处理与分析的主要窗口界面。用户可以在数据编辑器窗口进行数据输入、观察、编辑和统计分析等操作。如果在启动选项中选择“输入数据”或“打开现有数据源”,进入 SPSS后的第一个窗口就是数据编辑窗口,如下图所示,“数据编辑”窗口,(1)标题栏 标题显示窗口名称和编辑的数据文件名。如果当前数据编辑器中是一个新建的文件,其显示为“未标题1数据集0-SPSS Statistics 数据编辑器”。,(2)菜单栏 菜单栏,包括“文件”、“编辑”、“视图”、“数据”、“转换”、“分析”、“图形”、“实用程序”、“附加内容”、“窗口”和“帮助”菜单,这些菜单可以实现编辑数据与变量、定义系统参数、设计显示方式、绘制图形、进行各项数据分析和查阅帮助等功能。,(3)数据单元格信息显示栏 该显示栏用于显示单元格位置和单元格的内容等信息。灰色显示的区域为提示区,显示单元格的位置,空白区域为数据编辑器,该区域内显示当前选中的单元格的内容,用户可以在该区域输入或修改相应的内容。,(4)数据编辑显示区 在窗口的中部是编辑显示区,该区最左边列显示单元序列号,最上边一行显示变量名称。选定的单元格呈反色显示,其内容将出现在数据和单元格信息显示栏中。用户可以在该区域内输入或修改单元格内容。,(5)视图转换栏 该栏用于进行变量和数据视图的切换,用户只需要单击相应的选项卡便可以完成变量与数据视图的切换。,(6)系统状态栏 该栏显示当前的系统操作,用户可以通过该栏了解SPSS当前的工作状态。,2.1.2 常量、变量、操作符和表达式,一、常量与变量,1.SPSS常量SPSS中的常量在一定阶段内其取值不随观测而改变的值。有3种类型(1)数值型:数据型常量是一个数值。他有两种书写方式:一是普通书写方式,如:53、74.2等;二是科学计数书写方式,其使用指数表示数值,通常用于表示贴别大或特别小的数值。如:1.2E+05 表示1.2105(2)字符型:字符型常量是被单引号或双引号括起来的一串字符。如果本身带有单引号或半个单引号,则必须使用双引号括起来。如:beijing 处理时用双引号扩起来,即“beijing”(3)日期型:按特定格式存储日期数据,一般使用较少 格式很多,如:20-AUG-1999,2.SPSS变量的类型和显示宽度对不同的对象其取值发生变化的量称为变量。有3种类型(1)数值型:数据型变量一般由数字、分隔符和一些特殊符号(如美元符号)构成,有6种形式。标准数值型:默认类型 8.2如:12345678、12345.67、-1234.56 逗号数值型:从个位开始三位一个逗号,默认类型 8.2如:1,234.56圆点数值型:他与带逗号的数值型相反,默认类型 8.2 如:1.234,56科学计数法型:表示很大或很小的数据 8.2如:1.2E+05美元符号:表示货币格式很多,如:$12.30自定义货币型:用户可以创建5种自定义数据显示格式,系统自动将自定义数据显示名称,命名为CCA、CCB、CCC、CCD和CCE,这只是5种命名,用户可以自行设定这5种类型。,(2)字符型:字符型编变量由字符串组成,可以包含数字、字母和一些特殊符号。字符型变量的默认长度为8,大于8个字符的称为长字符型变量,少于8个字符的称为短字符型变量,字符型变量最长为32767个字符。他不能参与运算,区分大小写字母。(3)日期型:日期型变量用于表示日期和时间,他有29种不同的日期和时间格式,不能参与运算,要参与必须通过日期函数进行转换。如:1-12-2009、等,二、变量名与变量标签变量名和变量标签是用户用于识别变量的标志。1.变量名变量名用于区分不同的变量。起名规则:不能超过64个字符不区分大小写默认变量名为VARn,如:var00001首字符必须是字母、中文或特殊符号“”、“$”、“#”。变量名中不能出现“?”、“!”、“-”、“+”、“=”、“*”和空格。变量名不能与保留字相同,保留字有:AND,BY,EQ,GE,GT,LT,NE,NOT,OR,WITH和ALL。,2.变量标签变量标签用于对变量名和变量值的辅助说明,包含变量名标签和变量值标签。(1)变量名标签:对变量名的一些解释说明,增强分析结果的可视性,可以省略.不超过256个字符。(2)变量值标签:对变量所取值的一些解释说明,增强分析结果的可视性,可以省略。不超过120个字符。一般用于品质数据。如:1-男 2-女、1-高 2-中 3-低,三、运算符与表达式 1.运算符 SPSS的基本运算有3种:数学运算、关系运算和逻辑运算,相应运算的运算符和表达式如下图所示。表 SPSS的运算符,2.表达式表达式的具体形式有以下3种:(1)算术表达式算数表达式是数学运算符连接用数值型的常量、变量和函数的表达式,其运算结果一般为数值,如:表达式23+45,输出结果68。(2)比较表达式比较表达式是利用关系运算符建立起的两个变量间的比较关系,要求相互比较的两个量类型一致,他的结果一般逻辑型。如:x=2,则表达式“x0”为真,系统返回1(true)。(3)逻辑表达式逻辑表达式由逻辑运算符、逻辑型的变量或取值为逻辑型的比较表达式构成。他的值为逻辑型常量。如:对于表达式“true AND true”系统返回“true”,“true OR false”系统返回“true”。,1.变量列格式对齐方式左对齐:字符型默认。右对齐:数值型默认。居中对齐列宽度默认值为变量的总长度。2.缺失值(1)什么是缺失值?漏填数据,明显错误的数据(2)对缺失值的一般处理 事先指定:指定某个特定值为缺失值(用户缺失值)其他处理方法,如:以均值、众数替代等(3)SPSS缺失值 用户缺失值 系统缺失值:数值型:点()字符型:空,2.1.3 变量列格式、缺失值和变量计量尺度,3.变量计量尺度尺度:定距数据,一般为数值型数据。如:收入、人数。序号:有固有顺序的顺序水准的数值型或字符型数据。如:职称、年龄段标称:无固有顺序的名义水准的数值型或字符型数据。如:性别、民族,2.2 数据和变量的基本操作,2.2.1 数据文件的打开与保存,1.数据文件的打开,打开数据文件的具体操作步骤如下:(1)在菜单栏中依次选择“文件”|“打开”|“数据”命令或单击工具栏中的 按钮,打开如右图所示的“打开数据”对话框。,(2)选择相应的文件。,(3)双击需要打开的文件或单击“打开”按钮打开文件。,2.数据文件的保存,在菜单栏中依次选择“文件”|“保存”命令、“文件”|“另存为”命令或单击工具栏中的 按钮实现数据文件的保存操作。如果保存的是新建的数据文件,当进行以上操作时,会弹出如左下图所示的“将数据保存为”对话框。用户可以保存所有的变量,也可以单击“变量”按钮,在弹出如右下图所示的“数据保存为:变量”对话框中选择要保存的变量。,录入时应注意:黑框确定当前数据单元录入带有变量值标签的数据:手工输入代码,屏幕显示变量值标签冻结第一列数据保存:操作保存格式:(1)*.sav:SPSS数据文件(默认)。(2)*.dbf:dbase数据文件。(3)*.xls:Excel工作表文件。注意:有些信息会丢失,SPSS数据的编辑,(一)打开数据文件菜单选项:文件-打开-数据(二)数据定位按个案号码定位菜单:数据-Go to case-输入样本号按值定位光标定位到某列变量上-Edit-Find.,SPSS数据的编辑,(三)插入和删除一个个案插入:数据-insert case删除:选定待删行,鼠标右键找到Cut(四)插入和删除一个变量插入:光标定位到某列变量上-Data-Insert Variable(插到某列前)或鼠标右键删除:选定列,鼠标右键Cut项,SPSS数据的编辑,(五)数据移动、复制和删除定义源数据块鼠标右键:剪切、复制、清除确定目标单元鼠标右键:粘贴,数据文件的合并,目的:将两个SPSS数据文件合并到一个数据文件中文件合并的方式:纵向合并横向合并,(一)纵向数据合并(1)含义:将磁盘上的一个SPSS数据文件追加到当前data editor窗口中的数据文件中。(2)前提:两个SPSS数据文件应可以合并的内容,且最好有相同的变量名和变量类型。(3)菜单选项:数据-合并文件-添加个案,数据文件的合并,数据文件的合并,(二)横向数据合并(1)含义:将磁盘上的一个SPSS数据文件中的若干个变量增加到当前数据编辑器窗口的数据文件中。(2)前提:a.两个数据文件必须有一个共同的变量名为关键字段-合并的依据;b.两个数据文件应事先按关键字段升序排序。,数据文件的合并,(二)横向数据合并(3)菜单选项:data-merge file-add variable(4)选项说明:math cases on key variables in sorted files:以关键字作为合并标志。Both files provide cases:合并后的文件的数据由两个文件共同提供。External file is keyed table:以data editor的数据为基础。Working data file is keyed table:以磁盘文件的数据为基础。,与其他软件数据共享,共享dbf和xls格式文件菜单选项:Data-Open(1)*.dbf:dbase数据文件。字段名、字段类型自动转成SPSS数据文件中的变量名和类型。一条记录为一个个案。(2)*.xls:Excel文件(Read variable name选项)共享数据库文件建立ODBC数据源,第三章 SPSS数据文件的基本加工和处理,SPSS数据文件的基本加工和处理,数据文件的整理 个案排序、个案选取数据加工 变量计算、计数数据分组 自动分组、手工分组数据文件的其他处理功能 指定加权变量,目的:将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列。菜单选项:data-sort cases注意:(1)Ascending:升序、Descending:降序。(2)多重排序,选择变量名的次序很关键。,个案排序,排序在数据分析中的作用?,个案选取,目的:从现有数据中挑选出部分数据。菜单选项:data-select cases选取个案的几种不同方式(1)选择符合一定条件的个案(If condition is satisfied)(2)随机选取个案(Random sample of cases)近似选取、精确选取(3)选取某一区域内的个案(Based on time or case range)(4)使用过滤变量(use filter variable)注意:以后的操作和分析都在该个案选取的基础上进行.,个案选取在数据分析中的作用?,变量计算,目的:产生新变量或对原变量进行必要的转换处理(如:预测问题 产生比率数据 偏态数据的正态处理 时间序列的平稳处理等)(1)含义:根据用户给出的SPSS算术表达式,对所有或部分样本数据进行加工。(2)菜单选项:transform-compute if 按钮(3)SPSS算术表达式(Numeric Expression):由算术运算符(+、-、*、/、*)、SPSS函数以及SPSS变量名组成的式子。,变量计算,算术函数统计函数分布函数逻辑函数字符串函数缺失值函数日期时间函数其他函数,(4)SPSS函数,算术函数Abs():求绝对值sqrt():求平方根rnd():四舍五入后取整trunc():截取小数部分取整mod():取余Ln():自然对数Lg10():以10为底的对数,(4)SPSS函数,变量计算,统计函数:mean():均值sd():标准差sum():求总和cfvar():求变异系数max()min():求最大最小值,(4)SPSS函数,变量计算,分布函数:normal():产生服从标准正态分布的随机数序列uniform():产生均匀分布的随机数序列rv.():产生指定分布的随机数序列,如:rv.t(10)cdf.():计算指定分布的累计概率值idf.():计算指定分布的临界值,(4)SPSS函数,变量计算,逻辑函数:range():判断变量值是否在指定的区间内any():判断变量值是否为指定的若干值字符串函数:index(S1,S2):判断字符串S2在S1中首次出现的位置length():求字符串长度lower()upcase():字符串的大小写转换lpad():用指定字符补齐字符串为指定长度ltrim():压缩字符串空格substr():取子串,(4)SPSS函数,变量计算,缺失值函数missing():判断变量是否取系统或用户缺失值sysmis():判断变量是否取系统缺失值其他函数:Lag():便于进行差分计算,(4)SPSS函数,变量计算,变量转换,(5)SPSS条件表达式:条件表达式:由SPSS关系运算符、逻辑运算符、SPSS函数以及SPSS变量名组成的式子。关系运算符:(大于)、=(大于等于)、32、sr=700,逻辑运算符:&(AND):并且|(OR):或者(NOT):非 如:(nl32)and(sr700)not xb=1,计数,(1)含义:对所有或部分个案,计算若干个变量中有几个变量的值落在指定的区域内,并将结果存入新变量中。(2)菜单选项:transform-count-define value,产生计数变量,(3)指定区域的定义Value:指定一个值system-missing:系统缺失值system-or user missing:系统或用户缺失值range through:指定一个闭区域,给出最大和最小值range:lowest through n:最小值到某个给定值range:n through highest:某个给定值到最大值,数据文件的分类汇总,(1)含义:按指定的分类变量的变量值对个案分组;计算每组个案的汇总变量的基本统计量;将计算结果生成到一新文件中,即:在新文件中对应分类变量的每一个分类值产生一个个案。,原始数据,按性别变量汇总数据,数据文件的分类汇总,(2)菜单选项:data-aggregate(3)说明:多重分组时,变量名的选择顺序。生成的新文件名默认为:aggr.sav。可修改。生成的新变量名默认为原变量名后加_1。可修改。可以在新文件中存贮个分组个案数.,数据分组,目的:了解数据的总体分布状况思路:指定按哪个变量分组,即:指定分组变量定义分组变量的分组区间(不重、不漏)指定一个存放分组结果的标志变量分组方法:自动分组手工分组,数据分组,(一)自动分组单变量值分组(1)含义:分组变量值相同的个案分在同一组,同组中的标志变量相同。标志变量依照分组变量值的大小次序给定。(单变量分组,通常只适合于离散变量且变量值较少的情况)(2)菜单选项:transform-automatic recode分位值自动分组(1)含义:将定距型变量按分位数要求自动划分成相应类(2)菜单选项:transform-categorize variables,数据分组,(二)手工分组(组距分组)(1)含义:人工定义分组区域,对所有个案或符合一定条件的个案进行等距或非等距分组。(2)方法:分组结果存入原变量、分组结果存入新变量,数据分组,(3)分组结果存入原变量:定义分组区域:定义某一区间的原变量值分组后所对应的新值是什么.未定义的原变量值保持不变。菜单选项:transform-recode-into same variables说明:可以指定对符合一定条件的个案进行分组。,数据分组,(4)分组结果存入新变量:定义分组区域:定义某一区间的原变量值分组后所对应的新值是什么.未定义的原变量值在新变量中为系统缺失值。菜单选项:transform-recode-into different variables定义原变量分组后产生的相应新变量(CHANGE钮)可以指定对符合一定条件的个案进行分组。单值区间可以实现数据转换(问卷分析中的反向题重新计分),问卷分析中的反向题重新计分举例,性格打分(内向、一般、外向)1、与生人交往会“自来熟”(1)从不(2)偶尔(3)有时(4)经常 2、与不熟悉的异性交往,会脸红(1)从不(2)偶尔(3)有时(4)经常3、在公众场合下你会大声发表自己的意见(1)从不(2)偶尔(3)有时(4)经常极为内向:3分 较为内向:6分 较为外向:9分 极为外向:12分,指定加权变量,(1)含义:指定某一变量为加权变量。如:平均蔬菜价格、男足打分(2)菜单选项:data-weight case(3)说明 如果取消加权变量应重新定义:data-weight casedo not weight cases,作业,根据给定的两个关于学生成绩的SPSS数据文件做如下处理:合并两个数据文件(数据不一定是一一对应的)计算每个同学的总成绩、平均成绩、标准差计算每个同学的得优率和得良率根据得优率排名将各门课程的成绩按优、良、中、及格和不及格重新分组分别计算男生和女生的各科的平均成绩、标准差,并保存计算结果到SPSS数据文件。,第四章 SPSS的基本统计分析,基本统计分析,频数分析计算基本描述统计量(分布特征测度)图形分析工具列联分析,频数分析,目的粗略把握变量值的分布状况。例:研究被调查者的特征(如:性别、年龄、收入)研究被调查者对某个问题的总体看法(如:教学方式、选修课程)研究被调查者某方面的状态(如:购买家电的类型、居民月支出状况)采用的方法计算频分布表:包括计算频数、百分比、累计百分比绘制统计图形:条形图、饼图,频数分析,基本操作步骤(1)菜单选项:analyze-descriptive statistics-frequencies(2)选择几个待分析的变量到variables框.(3)chart选项,选择所需要的图形,频数分析,应用举例储户的职业分析特点:定类数据频数分布表输出按频数升降序输出储户收入水平分析特点:定序数据除使用频数、百分比、总数外,还可以充分使用累计百分比,频数分析,频数分析中的其他分析计算分位数:适用于定距数据数据按升序排序后,找到若干个分位点上的变量值quartiles:计算四分位数25%(QL)、50%(中位数)、75%(QU)cut points for n equal groups:n等份percentile:自定义百分位点分位数的应用 在排除极端值影响的条件下,通过计算分位数差,比较两组样本数据的离散程度例:(QL=50,QU=80)和(QL=70,QU=75)的比较分位数、中位数、众数的应用举例不同户口所在地的储户取款金额比较利用分位数(不显示频数分析表),计算描述统计量,目的精确把握变量的总体分布状况,了解数据的集中趋势、离散趋势、对称程度、陡峭程度。基本方法计算基本描述统计量,计算描述统计量,描述集中趋势的统计量均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。适用于定距数据。特点:利用了全部数据,易受极端值的影响。描述离散程度的统计量标准差(standard deviation-Std Dev):表示某变量的所有变量值离散程度的统计量。SPSS中计算的是样本标准差。方差(variance):标准差的平方。SPSS中计算的是样本方差。极差(range):最大值(maximum)最小值(minimum),计算描述统计量,描述对称程度的统计量 偏度(skewness):描述某变量分布形态的偏斜程度和方向的统计量.偏度为0表示对称;大于0表示正偏差大(右偏),频数最大的值比均值小,极值大于均值;小于0表示负偏差大(左偏),计算描述统计量,描述陡峭程度的统计量峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。峭度为0表示与标准正态分布峭度相同。大于0表示比标准正态分布陡,尖峰。小于0表示比标准正态分布缓;平峰。,计算描述统计量,其他统计量 标准误差(standard error S.E):抽样分布中的标准差,反映样本误差。均值标准误差(means of S.E)中心极限定理认为:样本均值N(u,2/n)反映样本均值与总体真值间的平均离散程度样本数越大,样本均值的离散程度越小,对真值的估计越准确,计算描述统计量,基本操作步骤(1)菜单选项:analyze-descriptive statistics-descripive(2)选择将参加计算的数值型变量名到variables框。分析比较不同户口所在地储户取款情况比较集中趋势比较离散趋势比较偏斜程度比较陡峭程度实现方式:数据拆分,其他功能数据标准化处理新变量的均值为0,标准差为1;小于0表示在平均水平下,大于0反之.正态分布的数据标准化后呈标准正态分布(68.2%,95.4%,99.7%)save standardized values as variables选项将变量作标准化后,结果存入名为“Z+原变量名”的新变量中.数据标准化处理应用举例你能以较简便的方法快速找到取款数目出众的储户吗?,计算描述统计量,基本统计分析的图形工具,以制作条形图为例,以制作条形图为例第一种模式下的三种图形:用于某变量在各分类情况的比较,基本统计分析的图形工具,以制作条形图为例第二种模式下的三种图形:用于若干变量的统计量的比较,基本统计分析的图形工具,箱线图(箱线图中以四分位差的1.5倍为标准剔除值),基本统计分析的图形工具,直方图和P-P图,基本统计分析的图形工具,交叉分组下的频数分析,目的 了解不同变量在不同水平下的数据分布情况 例:学习成绩与性别有关联吗?(两变量)例:职业、性别、爱逛商店有关联吗?(三变量)分析的主要步骤产生交叉列联表分析列联表中变量间的关系,产生交叉列联表,基本操作步骤(1)菜单选项:analyze-descriptive statistics-crosstabs(2)选择一个变量作为行变量到row框.(3)选择一个变量作为列变量到column框.(4)可选一个或多个变量作为控制变量到layer框.控制变量的层次设置:同层为水平数加;不同层为水平数积.(5)是否显示各分组的棒图(display clustered bar charts),产生交叉列联表,应用举例户口与收入水平有关联吗吗?行变量:户口;列变量:月收入不同户口不同收入水平的储户对物价水平的看法一致吗?行变量:收入水平;列变量:物价水平;控制变量:户口,产生交叉列联表,应用举例,不同户口不同收入水平的储户对物价水平水平的看法一致吗?,产生交叉列联表,进一步计算 cells选项:选择在频数分析表中输出各种百分比.row:行百分比(Row pct);column:列百分比(Col pct);total:总百分比(Tot pct);,分析列联表中变量间的关系,目的:通过列联表分析,检验行列变量之间是否独立。方法:卡方检验:对品质数据的相关性进行度量,分析列联表中变量间的关系,卡方检验 年龄与工资收入交叉列联表 低 中 高 青 400 00 中 0 5000 老 0 0600 低 中 高 青 0 0500 中 0 6000 老 400 00,分析列联表中变量间的关系,卡方检验基本步骤(1)H0:行列变量之间无关联或相互独立(2)构造卡方统计量统计量服从(r-1)*(c-1)个自由度的卡方分布count:观察(实际)频数expected count:期望频数(期望频数反映的是H0成立情况下的数据分布特征)Residual:剩余(观察频数-期望频数),分析列联表中变量间的关系,卡方检验基本步骤(3)计算卡方统计量的值,并得到该统计量值的概率P值(4)决策。概率P与显著性水平比较,小于等于则拒绝H0,否则不能拒绝实现步骤statistics选项cells选项,分析列联表中变量间的关系,应用举例户口对平均收入水平的分布会产生影响吗?独立性检验:从一个总体中随机抽样。按某两个属性变量将样本进行分类不同行业人对的自己职业的选择标准是否存在差异?一致性检验:从两个总体中独立抽样,根据一个属性变量将样本进行分类。制造业 服务业 物质报酬 105 45 稳定性 40 35,分析列联表中变量间的关系,卡方检验的要求:一般要求列联表中期望频数小于5的格子数不超过20%,否则会夸大卡方值,容易得出拒绝结论,可以合并单元格。卡方值会受样本数的影响,分析列联表中变量间的关系,行列变量相关性的其他测度指标phi系数:适用于22列联表当行列变量独立时:有:当行列变量完全相关时:有:越接近于1,相关性越强。越接近0,相关性越弱,分析列联表中变量间的关系,行列变量相关性的其他测度指标列联C系数(contingency coefficient),通常为0,1),取值受到行列数的影响(见EXCEL)V系数 0,1值越大表示行列变量的相关性越大,多选项分析,多选项分析的基本思路定义多选项变量集多选项频数分析多选项交叉分组下的频数分析,多选项分析,定义多选项变量集目的:将已分解的变量定义为一个集合,便于进行多选项分析菜单选项:analyze-multiple response-define sets从原变量中选取被分解的变量(数值型)到variables in sets框指定被分解的变量是按多选项二分法(dichotomize)分解还是按多选项分类法(categories)分解的为变量集命名。系统自动在名字前加字符$.,多选项分析,多选项频数分析菜单选项:analyze-multiple response-frequencies多选项交叉分析下的频数分析菜单选项:analyze-multiple response-crosstabs,多选项分析,多选项分析实例分析居民的储蓄目的采用多选项分类法组织数据在某次市场调查中收集了北京、上海和广州三个城市的受访者对几种常见饮料的喜好情况,可选的饮料有茶、牛奶、咖啡、果汁、矿泉水。(数据是从原始数据库中抽出的一小部分资料),作以下分析:采用二分法组织数据受访人群中最受欢迎的饮料是哪种?男、女喜爱的饮料有无差异?三个城市的人群对饮料的喜好有无差异?,作业,根据第三章的关于学生成绩的合并后的SPSS数据文件做以下处理:对各门课程分组后,做频数分析,绘制某两门课程成绩的直方图绘制男女生构成的饼图分别计算男女生各门成绩的基本描述统计量,并对数据的集中趋势、离散程度和偏度加以比较(数字和图形的对比),第五章 SPSS参数检验,假设检验概述,假设检验是一种根据样本数据来推断总体的分布或均值、方差等总体统计参数的方法。根据样本来推断总体的原因:总体数据不可能全部收集到。如:质量检测问题收集到总体全部数据要耗费大量的人力和财力假设检验包括:参数检验非参数检验,假设检验的基本原理,基本信念:利用小概率原理进行反证明。小概率事件在一次实验中不可能发生。例如:对人民大学男生平均身高进行推断H0:平均身高为173样本平均身高为178,由于存在抽样误差,不能直接拒绝H0。而需要考虑:在H0成立的条件下,一次抽样得到平均身高为178的可能性有多大。如果可能性较大,是个大概率事件(与相比较),则不能认为H0不正确。否则,如果可能性较小,是个小概率事件,但确实发生了,则只能认为H0不正确。概率P值即为观测结果或更极端现象在零假设成立时出现的概率,假设检验的基本步骤,(1)根据检验的目标,对待推断的总体参数或分布作一个基本假设H0(2)构造检验统计量,且该统计量服从某种已知分布.(3)利用收集到的样本数据和基本假设计算检验统计量的值,并得到相应的相伴概率P值,即:检验统计量在某个特定的极端区域取值在H0成立时的概率.(4)如果概率P值小于用户给定的显著性水平a,则拒绝H0.否则,不拒绝H0.,SPSS中的参数检验方法,单样本t检验两独立样本t检验两配对样本t检验,SPSS单样本t检验,(一)含义:检验某变量的总体均值与指定的检验值之间是否存在显著差异。例如:周岁儿童的平均身高是否为75厘米(二)要求:样本来自的总体服从正态分布,为什么?,SPSS单样本t检验,(三)基本思路:H0:u=u0,总体均值与检验值之间不存在显著差异.构造检验统计量.从样本均值的分布出发,即:N(u0,2/n).于是:总体方差未知时构造t统计量D=X-u0t统计量服

    注意事项

    本文(SPSS统计分析与应用》教学讲义.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开