欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    [PPT模板]第3章数据的图表展示.ppt

    • 资源ID:4595807       资源大小:726.50KB        全文页数:97页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    [PPT模板]第3章数据的图表展示.ppt

    第3章 数据的图表展示,数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。,3.1 数据的预处理,3.1.1 数据审核数据整理时,首先需要进行审核,以保证数据的质量,为进一步的整理与分析打下基础。,3.1 数据的预处理,对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。(1)完整性。应调查单位是否有遗漏,所有的调查项目或指标是否填写齐全。(2)准确性。主要审查数据资料是否真实地反映了客观实际情况,如内容是否符合实际;检查数据是否有错误;计算是否正确,是否存在异常值等。,3.1.1 数据审核,对于通过其他渠道取得的二手数据,除了对其完整性和准确性进行审核外,还应着重审核数据的适用性和时效性。(1)适用性。有些二手数据可能是为特定目的通过专门调查而取得的,或者是已经按特定目的的需要做了加工整理。对于使用者来说,首先应弄清楚数据的来源、数据的口径以及有关的背景材料,以便确定这些数据是否符合自己分析研究的需要,是否需要重新加工整理等,不能盲目生搬硬套。(2)时效性。对于有些时效性较强的问题,如果所取得的数据过于滞后,可能失去了研究的意义。,3.1.1 数据审核,审核中发现的错误应尽可能予以纠正。如果对数据中发现的错误无法纠正,就需要对数据进行筛选。,3.1.1 数据审核,3.1.2 数据筛选 一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除。,3.1 数据的预处理,例3-1 表3-1是8名学生4门课程的考试成绩数据(单位:分)。试找出统计学成绩等于75分的学生,英语成绩最高的前三名学生,四门课程成绩都大于70分的学生。,EXCEL操作(演示)数据筛选自动筛选统计学下拉三角选75确定数据筛选自动筛选英语下拉三角前10名将“10”改为“3”确定创建条件区域(字段,条件)数据筛选高级筛选选查询数据区域选条件区域确定,3.1.2 数据筛选,3.1.3 数据排序 数据排序是按一定顺序将数据排列,以便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。排序还有助于对数据检查纠错,以及为重新归类或分组提供方便。,3.1 数据的预处理,在某些场合,排序本身就是分析的目的之一。如美国的财富杂志每年都要在全世界范围内排出500强企业,通过这一信息,不仅可以了解自己企业所处的地位,清楚自己的差距,还可以从一定侧面了解到竞争对手的状况,从而有效制定企业发展的规划和战略目标。排序后的数据称为顺序统计量。,3.1 数据的预处理,3.1.3 数据排序,如对表3-1按总分数从高到低排序。(见例3.1)数据排序主要关键字段中列降序确定(演示),3.1.3 数据排序,3.1.4 数据透视表利用数据透视表可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合需要的交叉表(列联表)。在利用数据透视表时,数据源表中的首行必须有列标题。,3.1 数据的预处理,例3.2 在某大学随机抽取30名学生,调查他们的性别、家庭所在地、平均月生活费支出、平均每月买衣物支出和购买衣物时所考虑的首要因素等,得到的数据如表3-2所示。试建立一个数据透视表,在表的行变量中给出性别和购买衣物首选因素,在列变量中给出学生的家庭所在地,对平均月生活费支出和月平均购买衣物支出进行交叉汇总。,3.1.4 数据透视表,数据数据透视表和数据透视图选数据透视表,下一步选输出到新工作表或现有工作表,如选现有,要指定位置选布局,性别拖入行标志,买衣物首选因素拖入行标志,家庭所在地拖入列标志,两个支出数据拖入数据区确定完成。(演示),数据透视表操作步骤:,注意:行字段、列字段、数据项的选择,不同的选择就会得到不同的数据透视表。本例中,性别和买衣物首选因素作为行字段,家庭所在地作为列字段,平均月生活费和月平均衣物支出作为数据字段。,3.1.4 数据透视表,3.2 品质数据的整理与展示,品质数据包括分类数据和顺序数据;不同类型的数据采取不同的处理方法;对品质数据做分类整理,对数值型数据则主要是做分组整理。,分类数据本身就是对事物的一种分类,因此在整理时除了列出所分的类别外,还要计算出每一类别的频数、频率或比例、比率,同时选择适当的图形进行显示,以便对数据及其特征有一个初步的了解。,3.2.1 分类数据的整理与图示,1.频数与频数分布(1)频数(frequency)频数也称次数。频数是落在各类别中的数据个数。我们把各个类别及其相应的频数全部列出,并用表格形式表现出来,就是频数分布。将频数分布用表格的形式表现出来就是频数分布表。,3.2.1 分类数据的整理与图示,频数分布表的作法:第一步,单击“工具”菜单,选择“数据分析”选项。若无数据分析选项,可在工具菜单下选择“加载宏”,在弹出的对话框中选择“分析工具库”,便可出现数据分析选项;第二步,在“数据分析”中选择“直方图”;第三步,“输入区域”,“接收区域”,“输出区域”等的选择;选择“柏拉图”可以在输出表中同时按降序排列频数数据;选择“累积百分率”可在输出表中增加一列累积百分比数值,并绘制一条百分比曲线;,表3-3 顾客性别及购买饮料类型,表3-4 不同类型饮料及顾客性别的频数分布(数据透视表),表3-5 不同类型饮料的频数分布,表3-6 不同性别顾客的频数分布,(2)比例一个样本(或总体)中各个部分的数值占全部数值的比重,通常用于反映总体的构成或结构。假定总体N个数据分成K个部分,每一部分的数据分别为 N1,N2,N3,NK 比例:Ni/N(i=1,2,K)显然,N1/N+N2/N+NK/N=1,3.2.1 分类数据的整理与图示,(3)百分比 将比例乘以100就是百分比或百分数,它是将对比的基数抽象化为100而计算出来的,用%表示。当分子的数值很小而分母的数值很大时,我们也可以用千分数“”表示比例,如人口出生率、死亡率、自然增长率等都用千分数表示。,3.2.1 分类数据的整理与图示,(4)比率比率是各不相同类别数值之间的比值。比率可以是一个样本(或总体)中各不同部分的数量之比。比如,国内生产总值中第一、二、三产业之比等。比率也可以是同一现象在不同时间或空间上的数量之比,比如本年国内生产总值与上年国内生产总值进行对比,可以计算出经济增长率。不同地区国内生产总值进行对比,反映两个地区的经济发展水平差异。,3.2.1 分类数据的整理与图示,2.分类数据的图示用图形来显示频数分布,就会更形象直观。一张好的统计图表,往往胜过冗长的文字表述。,3.2.1 分类数据的整理与图示,(1)条形图条形图是用宽度相同的条形的高度或长短来表示数据多少的。本节中条形图是用矩形的高度和长度来表示各类别数据的频数或频数分布的图形。条形图可以纵置或横置。当分类变量在不同时间或空间上有多个取值时,可以绘制对比条形图。演示例3.14,3.2.1 分类数据的整理与图示,图3-14 饮料类型和顾客性别的复式条形图,(2)帕累托图(Pareto chart)帕累托图是以意大利经济学家V.Pareto的名字命名的。它是按各类别数据出现的频数多少排序后绘制的柱形图。容易看出哪类数据出现的多,主要用于分析各个类别的影响顺序。它的绘制可参见频数分布表中最后一步只需选中柏拉图即可。(演示),3.2.1 分类数据的整理与图示,(2)饼图(pie chart)饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组数据占全部数据的比例,对于研究结构性问题十分有用。,3.2.1 分类数据的整理与图示,图3-16 不同类型饮料构成的饼图,图3-17 按性别绘制的不同类型饮料构成的复式饼图,上面介绍的分类数据的频数分布和图示方法,也都适用于顺序数据的整理和显示。但一些适用于顺序数据的整理和显示方法,并不适用于分类数据。对于顺序数据,还可以计算累积频数和累积频率。,3.2.2 顺序数据的整理与图示,3.2.2 顺序数据的整理与图示,1.累积频数和累积频率累积频数就是将各有序类别或组的频数逐级累加起来。累积频率或累积百分比是将各有序类别或组的百分比逐级累加起来。,向上累积,从小到大(或从低到高)的方向把频数顺序累加。向下累积,从大到小(或从高到低)的方向把频数顺序累加。通过累积频数,可以很容易看出某一类别以下或某一类别以上的频数之和。,3.2.2 顺序数据的整理与图示,【例3.5】在一项有关城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个是问题是:“您对您家庭目前的住房状况是否满意?”要求回答的类别依次如下:1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意.结果如表3-6和表3-7所示.,2.顺序数据的图示(1)累积频数分布图 根据累积频数或累积频率,可以绘制累积频数分布或频率图。,图3-19 甲城市对住房状况评价的累积分布图,向上累积,向下累积,(2)环形图(doughnut chart)环形图与饼图类似,但又有区别。环形图的圆心是空的,样本或总体中的每一部分数据用环中的一段表示。饼图只能显示一个样本或总体各部分所占的比例,而环形图可以同时绘制多个样本或总体的数据系列。环形图有利于进行比较研究。,非常不满意,甲乙两城市对住房状况的评价,乙城市,甲城市,3.3 数值型数据的整理与展示,数据分组是根据统计研究的需要,将原始数据按照某种标准化分成不同的组别,分组后的数据称为分组数据。主要目的是观察数据的分布特征。数据分组方法有两种:单变量值分组和组距分组。,3.3.1 数据分组,单变量值分组(要点),1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况,频数分布表的编制(实例),117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121,某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,单变量值分组表(实例),组距分组(要点),将变量值的一个区间作为一组适合于连续变量或变量值较多的情况必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组,组距分组(步骤),确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按斯特格斯(Sturges)提出的经验公式来确定组数K,确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距(最大值-最小值)组数K,根据分组整理成频数分布表,组距分组(几个概念),1.下 限:一个组的最小值2.上 限:一个组的最大值3.组 距:上限与下限之差4.组中值:下限与上限之间的中点值,分组的原则:不重复不遗漏 上组限不在内,组距分组(分组原则),等距分组1(上下组限重叠)(演示),等距分组2(上下组限重叠),【例3.1】分组步骤:1.确定组数:2.确定组距:(最大值-最小值)组数=(139-107)7=4.571 则组距为53.根据频数分布表得出频数。,等距分组表(上下组限重叠),在组距分组中,如果全部数据中的最大值和最小值与其他数据相差悬殊,为了避免出现空白组或者个别极端值被遗漏,所以将第一组和最后一组采用以下和以上的这样的开口组,注意的是开口组通常以相邻组的组距作为其组距的。,开口组,等距分组表(使用开口组),组距分组掩盖了各组内的数据分布情况,为反映各组数据的一般水平,通常用组中值作为该组的代表值,即,满足假定条件:各组数据在本组内呈均匀分布或在组中值两侧呈对称分布,否则会有一定的误差。,组中值,适合连续变量或变量值较多的情况下,将全部变量值依次划分为若干个区间,上限,下限,适合离散变量且变量值较少,把每一个变量值作为一组,分组方法,单变量值分组,组距分组,数值型数据分组小结,数据的整理与显示(基本问题),要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的;对分类数据和顺序数据主要是做分类整理;对数值型数据则主要是做分组整理;适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据。,3.3.2 数值型数据的图示条形图、饼图、环形图及累积分布图都适用于数值型数据。除此之外,还有直方图、茎叶图、箱线图、线图、散点图、气泡图、雷达图等。,1.分组数据:直方图直方图是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)来表示频数分布的。方法:利用平面直角坐标系,横轴表示分组,纵轴表示频数或频率。,用表3-13的分组数据绘制直方图,直方图与条形图不同:面积长度连接分开展示数值数据展示分类数据直方图的宽度和长度都有意义。,分组数据直方图(直方图的绘制),2.未分组数据:茎叶图和箱线图(1)茎叶图茎叶图是反映原始数据分布的图形;叶末位同位数 茎除末位外的高位数 茎在左,叶在右,横置。茎叶图既能给出数据的分布状况,又能 给出每一个原始数值;茎叶图适用于小批量数据。,电脑销售额 Stem-and-Leaf Plot Frequency Stem&Leaf 3.00 14.134 1.00 14.9 5.00 15.02334 4.00 15.5689 8.00 16.00112334 8.00 16.55567888 13.00 17.0112222233444 14.00 17.55556677888999 7.00 18.0012234 13.00 18.5667777888999 6.00 19.001244 11.00 19.55666667788 5.00 20.01233 5.00 20.56789 6.00 21.001134 2.00 21.58 1.00 22.3 3.00 22.568 4.00 23.3344 1.00 Extremes(=237)Stem width:10 Each leaf:1 case(s),(2)箱线图(box plot)由一组数据的最大值、最小值、中位数、两个四分位数这五个特征值绘制而成,它主要用于反映原始数据的分布特征,还可以进行多组数据分布特征的比较。绘制方法:先找出一组数据的这五个特征值;然后连接两个四分位数画出箱子;最后将最大值与箱子相连接,中位数在箱子中间。,箱线图,最小值,最大值,中位数,上四分位数,下四分位数,分布的形状与箱线图,图3-11 不同分布的箱线图,未分组数据多批数据箱线图(实例),【例3.7】从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表3-8。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征,8门课程考试成绩的箱线图(由SPSS绘制的多批数据箱线图),11名学生考试成绩的箱线图(由SPSS绘制的多批数据箱线图),3.时间序列数据:线图线图主要用于反映现象随时间变化的特征。,绘制线图时,时间一般绘在横轴,观测值绘在纵轴。,资料来源:中国统计年鉴 2004,357页,北京,中国统计出版社,2004,绘制线图注意事项,绘制线图时,时间一般绘在横轴,观测值在纵轴。一般应绘成横轴略大于纵轴的长方形,其长宽比例大致为10:7。比较美观,利于理解。纵轴下端从0开始,便于比较,数据与0间距过大,可以采取折断的符号将纵轴折断。,4.多变量数据的图示 当有两个或两个以上的变量时,可以采用散点图、气泡图、雷达图等的图示方法。(1)散点图 散点图是用二维坐标展示两个变量之间关系的一种图形。每组数据(xi,yi)用一个点表示,n组数据形成n个点,故称散点图。注意散点图中x轴与y轴的位置关系。,(2)气泡图,气泡图能用于展示三个变量之间的关系。方法:一个变量放横轴,另一变量放纵轴,第三个变量则用气泡的大小来表示。,产量,(3)雷达图雷达图是展示多个变量的常用图示方法,也称为蜘蛛图。在显示或对比各变量的数值总和时十分有用,利用雷达图还可研究多个样本间的相似程度。,【例3.10】2003年我国城乡居民家庭平均每人各项生活消费支出构成数据如表3-16所示。试绘制雷达图。,3.4 合理使用图表,图3-31 数据的类型与图示方法,3.4.1 鉴别图形优劣的准则 设计图形时,应绘制得尽可能简洁,以能够清晰地显示数据、合理地表达统计目的为依据。,一张好的图形应具有的特征(Tufte):显示数据让读者把注意力集中在图形的内容上,而不是制作图形的程序上避免歪曲强调数据之间的比较服务于一个明确的目的有对图形的统计描述说明,一张好的图形优劣的准则:精心设计,有助于洞察问题的实质使复杂的问题得到简明、确切、高效的阐述在最短的时间内以最少的笔墨给读者提供最大量的信息多维的表述数据的真实情况,3.4.2 统计表的设计表头行标题列标题数字资料,表头放在表的上方,它说明的是表的主要内容。行标题和列标题通常安排在统计表的第一列和第一行。它表示所要研究问题的类别名称和变量名称。表外附加通常放在统计表的下方,如数据来源、变量注释和必要的说明。数字资料放在表的中心部位。,概括为:科学、实用、简练、美观。,设计和使用统计表时要注意以下几点:合理安排统计表的结构,如行标题、列标题和数字资料的位置安排要合理。表头一般应包括表号、总标题和表中数据的单位等内容。表中的上下两条横线一般用粗线,中间的其他线要用细线。通常统计表的左右两边不封口,列标题之间必要时可用竖线分开,而行标题之间通常不必用横线隔开。尽量少用横竖线。必要时在表的下方加上注释,特别要注意注明数据来源,备读者查阅使用。,

    注意事项

    本文([PPT模板]第3章数据的图表展示.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开