欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    统计学2.数据的收集与整理ppt课件.ppt

    • 资源ID:1467660       资源大小:1.49MB        全文页数:93页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学2.数据的收集与整理ppt课件.ppt

    统计学的研究对象是客观现象总体数量的数量特征和数量关系,具有数量性、总体性和单位的变异性三个主要特点。统计研究的方法:大量观察法、统计分组法、综合指标法、统计模型法、归纳推断法等方法。统计总体:组成统计活动研究对象的所有事物的全体集合,简称总体(或母体);总体单位:总体中的各个个体事物,简称单位(或个体);样本:从总体中抽取的一部分元素(单位)的集合,也称抽样总体,或者子样;,第一章 要点回顾,标志:总体各单位具有的属性或者特征;是用来说明总体单位特征的名称。不变标志&可变标志品质标志&数量标志;品质标志与标志值的区别统计指标(指标):说明总体的综合数量特征的概念和数值。数量指标:说明总体规模和水平的指标,又称总量指标质量指标:反映相对关系和工作质量的指标,包括相对指标和平均指标指标与标志的关系与区别数据(统计指标)的四种计量尺度:定类尺度、定序尺度、定距尺度、定比尺度;国内生产总值(GDP):一国(或地区)的常驻单位在一定时期内所生产和提供的最终产品和服务的价值和,是各部门的增加值之和。,第一章 要点回顾,统计研究的过程,收集数据(取得数据),整理数据(处理数据),实际问题,统计设计,第二章 数据的搜集与整理,统计学,主要内容,教材内容:2.1. 统计数据的搜集2.2.数据整理2.3.变量数列补充内容:统计数据的显示,学习目标,重点:统计调查的种类和形式统计分组的种类、方法、原则频数分布数列及累计分布数列的特点与编制,2.1 统计数据的搜集,一、统计数据搜集概述二、统计调查体系三、统计调查的各种形式四、统计调查的方案设计五、调查误差六、二手统计资料的主要来源,2.1 统计数据的搜集,一、统计调查的方案设计(四)二、统计数据搜集概述(一)三、统计调查的各种形式四、统计调查体系(二)五、调查误差六、二手统计资料的主要来源,一、统计调查方案设计工作方案、调查基础1、确定调查目的(为什么调查) ,总体:根本性问题;确定研究的现象2、确定调查对象和调查单位(向谁调查),即确定调查形式;调查对象即调查总体;调查单位即要调查的总体单位,标志的承担者;(区别)报告(填报)单位:向上报告提供资料的单位3、确定调查项目(调查什么) :根据目的确定标志;调查项目:调查中所要登记的调查单位的特征;一系列品质标志和数量标志,第一节 统计数据的搜集,一、统计调查方案设计工作方案、调查基础4、选择调查方法调查表格:调查项目按一定顺序排列在一定表格上一览表:许多调查单位填写在同一表格上,项目较少单一表:每个单位单独填写一张表格,可容纳较多项目调查问卷:书面文字、表格。问题等形式了解被调查者的意见;主题明确、形式简明、文字通俗、容易理解、便于回答5、确定调查时间和调查期限:调查时间(客观时间):调查资料所属的时点或时期;调查期限:调查工作进行的起讫时间。6、制定调查的组织实施计划:确定机构、组织培训人员、经费来源与开支、资料报送方法和公布时间,第一节 统计数据的搜集,第一节 统计数据的搜集,二、统计数据搜集概述:概念:根据统计的目的和任务,运用科学的调查方法,有计划、有组织地向客观实际搜集和登记统计数据的过程。(基础)两种方式:统计调查:直接向调查对象搜集反映调查单位的统计资料(原始资料);次级资料的搜集:根据 研究目的,搜集已经加工、整理过的、说明总体现象的资料(次级资料)。,第一节 统计数据的搜集,二、统计数据搜集概述:七种调查方法:直接观测法:调查人员到现场观察,农产量抽样调查;报告法(通讯法):被调查者填写表格,统计报表;采访法:被调查者答复(口头询问、自填),;登记法:当事人到机构登记,出生、死亡、流动人口登记;电话访问法:电话询问、交谈,电脑辅助电话访谈(CATI);网络调查法:传统调查+网络技术;试验设计法:控制的条件下测试新产品、新工艺或新方法使用效果。,第一节 统计数据的搜集,二、统计数据搜集概述:统计调查的分类:按调查对象包括的范围不同:全面调查:对调查对象的全部个体一一调查登记,如普查。非全面调查:对调查对象的部分个体调查登记,如抽样调查、重点调查、典型调查等。按照调查登记的时间是否连续:经常性调查/连续性调查:连续不断地调查登记,适用于时期现象的调查。一次性调查/间断性调查:间隔一段时间,不连续地调查,(并非调查一次之后再不调查)。适用于时点现象的调查。,第一节 统计数据的搜集,三、统计调查的各种形式:统计调查的形式:指统计调查的组织形式,即组织统计调查,搜集信息资料的方式。普查、统计报表制度、抽样调查、重点调查和典型调查。核心在于如何选取调查对象。统计调查方法:获取数据的方法。直接观测法、报告法(通讯法)、采访法、登记法、电话访问法、网络调查法、试验设计法。核心在于如何获取数据。,第一节 统计数据的搜集,三、统计调查的各种形式:1、普查:普查是专门组织的一种全面调查,主要用以搜集某些不能或不宜用报表搜集的统计资料。对国情国力的调查一般用普查,如人口、工业和农业普查。普查的特点:全面调查;非经常性调查。我国的普查制度: 每逢末尾数字为“0”的年份进行人口普查; “1”或“6”的年份基本统计单位普查;“逢3、逢8的年份经济普查; “5”的年份工业普查;“7”的年份进行农业普查。,三、统计调查的各种形式: 1、普查:组织普查必须遵循三项原则:必须统一规定调查资料所属的标准时点,避免重复和遗漏,保证资料的准确性。(第六次人口普查 2010年11月1日零时)在普查范围内各调查单位或调查点尽可能同时进行,并尽可能在最短时限内完成,以便在方法上、步调上一致。(调查时限:数据搜集和报送的时间)调查项目一经确定,不能随意改变或增减,以免影响汇总总和,降低资料质量。普查的组织形式:专门组织普查机构并配普查人员直接登记(人口普查);利用原始资料由调查单位自填表格(物资库存普查),第一节 统计数据的搜集,三、统计调查的各种形式:2、统计报表制度:统计报表是依照国家有关法规(中华人民共和国统计法),自上而下的统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计数据的一种调查方式。是搜集国民经济和社会发展状况统计数据的主要方式。 主要特点:资料来源建立在基层单位的各种原始记录的基础上,基层单位可利用其资料;逐级上报和汇总,各级领导能了解其辖区的情况属于经常性调查,项目相对稳定,利于积累资料,动态对比。,第一节 统计数据的搜集,三、统计调查的各种形式:2、统计报表制度:主要种类:(1)范围:全面统计报表和非全面统计报表。(2)时间:定期报表(进度报表日报、旬报、月报、季报、半年报)和年报(总结性报表)。(3)单位:基层报表和综合报表(逐级汇总而来)。(4)方式:电讯报表(电报、电话、电视、传真、网络等方式)和邮寄(书面)报表。(5)管理系统:国家统计报表(国民经济基本统计报表)、业务部门统计报表和地方统计报表 。,第一节 统计数据的搜集,三、统计调查的各种形式: 3、抽样调查:(随机)抽样调查:是一种专门组织的非全面调查,它是按照随机原则在全部调查单位中抽取一部分单位组成样本进行调查,以样本数据推断总体数量特征的一种调查方法。是相对最科学、应用最广的调查方式。三个基本特征:按照随机的原则抽取单位,排除个人主观意图的影响;对一部分单位(样本)做深入细致的调查研究,取得数据,并据此从数量上推断总体。抽样误差可以事先计算并加以控制。,第一节 统计数据的搜集,三、统计调查的各种形式: 3、抽样调查:适用范围:不可能或很难进行全面调查的现象,必须采取抽样调查方法。如产品寿命等;没必要进行全面调查的社会现象,也可采用抽样调查。其他作用:对全面调查结果的检验修正。 优点:经济性:调查单位少,专业化;时效性:专业队伍,直接取样;准确性:自上而下,随机抽样;灵活性:项目可多可少,范围可大可小。广泛应用,第一节 统计数据的搜集,三、统计调查的各种形式: 3、抽样调查:抽样调查的原则:随机原则:所有调查单位都有相同的被抽取概率,才符合概率论的要求,从而进行统计推断;最大抽样效果原则:既定的费用下是抽样误差最小,或者在给定的精确度下使费用最小。思考题:以下调查应采用什么调查方式?为什么?对河水水质进行检测;推断种子的发芽率;推断食品的保质期;民意测验,第一节 统计数据的搜集,三、统计调查的各种形式: 4、重点调查:重点调查:在调查对象范围内选择部分重点单位进行的非全面调查。重点单位标志(值)总量所占比重很大,数量一般不多;从数量上反映总体在该标志总量方面的情况。重点单位的标准:在所研究现象的标志总量中所占的比重很大。先进或者重点管理单位不是重点调查单位。优点:单位较少,调查可较详细;部分单位集中反映基本情况时适用。例:我国银行业中的重点单位 截至2004年底,工、农、中、建四家国有商业银行各项贷款近13万亿元,占我国银行业贷款总额的72,存款近25万亿元,占银行业存款总额的77。从统计学的角度,四大国有商业银行就是重点调查中的重点单位。,第一节 统计数据的搜集,三、统计调查的各种形式: 5、典型调查:典型调查:在对调查对象全面分析的基础上,有意识地选取若干具有典型意义的或有代表性的单位进行深入、细致调查的一种非全面调查。特点:取决于调查者的主观判断与决策;调查范围小,调查单位少,可对某些复杂的专门问题进行深入、细致的调查。调查单位有代表性和典型性。中心问题:典型单位的选择要具有充分代表性这些单位的标志表现(标志值)最能反映总体中各个单位的一般水平。,第一节 统计数据的搜集,第一节 统计数据的搜集,四、统计调查体系:计划经济时期:统计报表制度为主,全面调查、层层汇总;统计口径难统一;基层统计人员不足;客观性市场经济:必要的周期性普查为基础,经常性的抽样调查为主体,同时辅以重点调查、科学推算和部分全面报表综合应用的统计调查方法体系。普查:搜集全面详细的数据,提供基础资料;耗费大抽样调查:调查单位少,专业人员,科学推断;重点调查、典型调查、统计报表:传统形式,仍发挥作用。,五、调查误差:对统计调查数据的基本要求:准确性、及时性、系统性、完整性、经济性总体要求:以准确为前提,准中求快,力争以较少的投入取得完整、系统的数据资料。调查误差:衡量统计调查数据的准确性;费用既定下误差越小越好,第一节 统计数据的搜集,五、调查误差:调查误差的分类抽样误差:产生于抽样调查中,由于随机的原因导致样本的结构不能完全代表总体的特征而产生的误差;随机抽样的抽样误差可估算并控制非抽样误差:其他误差,原因众多、难以估量确定总体或抽样框:重复、包含异质单位、丢失单位数据搜集:问卷设计不佳、调查者工作欠缺、被调查者不配合数据整理:数据处理失误、被调查者提供数据不实减小误差的手段:完善调查方案、科学选取调查方式方法、提高人员素质、完善统计制度,第一节 统计数据的搜集,六、二手(次级)统计资料的主要来源:统计年鉴:中国统计年鉴、国际统计年鉴、地方统计年鉴、中国县(市)社会经济统计年鉴、中国金融年鉴、中国人口和就业统计年鉴、中国统计摘要外文出版物:世界银行各年度的世界发展报告、联合国的联合国统计年鉴、联合国粮农组织生产年鉴、国际货币基金组织的国际金融统计月报、亚太经合组织的亚太统计数字有关期刊:中国经济数据分析、经济预测分析有关网站:中国统计信息网、国研网、中国经济信息网、中国经济时报网,第一节 统计数据的搜集,课堂练习,第一节 统计数据的搜集,( )全面调查和非全面调查是根据调查结果所得到的资料是否全面来划分的。,( )对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果,规定的时间是调查时间。,( )我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。,( )采用重点调查搜集资料时,选择的调查单位是标志值较大的单位。,课堂练习,第一节 统计数据的搜集,( )统计调查误差就是指由于错误判断事实或者错误登记事实而发生的误差。,( )重点调查与抽样调查的目的是一致的,即都是通过对部分单位的调查,来对总体数量特征进行推断估计。,( )连续调查与不连续调查的划分依据是A、调查的组织形式不同 B、调查登记的时间是否连续C、调查单位包括的范围是否全面 D、调查资料的来源不同,B,课堂练习,第一节 统计数据的搜集,( )对一批商品进行质量检验,最适宜采用的方法是A、全面调查 B、抽样调查 C、典型调查 D、重点调查,B,( )下列调查中,调查单位与填报单位一致的是 A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查,D,( )抽样调查的主要目的是A、计算和控制抽样误差 B、推断总体总量C、对调查单位作深入研究 D、广泛运用数学方法,B,( )下述各项调查中属于全面调查的是 A、对某种连续生产的产品质量进行检验 B、某地区对工业企业设备进行普查C、对全面钢铁生产中的重点单位进行调查 D、抽选部分地块进行农产量调查,B,2.2 数据整理,一、数据整理的内容二、统计分组,一、统计整理的意义和内容:统计整理:对统计调查阶段所搜集到的大量原始资料进行分组、汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。是统计工作的第二阶段。作用:统计资料整理是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,是统计工作中一个十分重要的中间环节,起着承前启后的作用,即既是统计调查阶段的继续和深入,又是统计分析阶段的基础。,第二节 数据整理,统计整理的内容:整理汇总方案的设计:统计分组&统计指标;汇总:计算各项指标;描述整理结果:统计表或者统计图的形式程序:调查资料的审核和筛选:发现、处理数据中的错误,保证数据的完整性与准确性;资料的分组和汇总:统计分组&统计指标;编制统计表和统计图(第三节);统计资料的积累、保管和公布。,第二节 数据整理,二、统计分组:统计分组:根据统计研究目的和客观现象的内在特点,按照选定的某个或几个标志,将被研究的总体数据分成若干部分的科学分类。统计分组是基本的统计方法之一。目的:把同质总体中的具有不同性质的单位分开,把性质相同的单位合在一起;保持各组内统计资料的一致性和组与组间资料的差异性,以便进一步运用各种统计方法,研究现象的数量表现和数量关系,从而正确地认识事物的本质及其规律性。,第二节 数据整理,二、统计分组:关键:分组标志的选择一种(标志)分组突出一种差异或矛盾,忽略其他矛盾;不同分组方法得出不同结论;根据研究目的选取。如学历与资历对收入的影响统计分组的基本作用:1)、划分现象的类型;2)、揭示现象内部结构;3)、分析现象之间的依存关系;4)、反映事物的数量特征和发展规律。,第二节 数据整理,二、统计分组:统计分组的原则: (P53)穷尽原则:每个单位都分到某一组;互斥原则:每个单位都只能属于一个组。统计分组的种类:标志的多少:简单分组和复合分组(后详);标志的性质:品质分组(定类、定序尺度)和数量分组(定距、定比尺度) (后详),第二节 数据整理,二、统计分组:简单分组、复合分组和分组体系:简单分组又称单一分组,特点:只能反映现象在某一标志特征方面的差异情况,说明的问题比较简单明了。复合分组就是对同一总体选择两个或两个以上标志层叠起来进行分组。特点:可从几个不同角度了解总体内部的差别和关系,因此能更全面、更深入地研究问题;复合分组的组数随着分组标志的增加而成倍地增加。(例:工业企业分组)采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,在统计上叫做分组体系。,第二节 数据整理,第二节 数据整理,复合分组和复合分组体系,品质分组与数量分组:品质分组:分组标志确定后,组名和组数确定;数量分组:单项式分组与组距式分组。1)、单项式分组:每个变量值作为一组;适用于离散型变量且变量变动范围不大的场合。比如某市居民家庭按家庭人口数分组 。,第二节 数据整理,2)、组距式分组:按变量值的区间分组。组距:区间的距离;组限:相邻两组的界限;适合于连续型变量或者变动范围较大的离散型变量。连续组距式分组与间断组距式分组连续型变量只能采用连续组距式分组( 注意“上限不在内”原则的应用):比如产值、身高、体重。 如果变量值只是在整数间变动,可采用间断组距式分组,也可采用连续组距式分组。比如企业数、职工人数等。等距分组与异距分组:等距分组适用标志值变动比较均匀的情况。异距分组适用:标志值分布很不均匀的场合;标志值相等的量具有不同意义的场合(月对于婴儿和成人);标志值按一定的比例发展变化的场合。,第二节 数据整理,组距式分组相关指标:组距=本组上限-前组上限 =本组上限-本组下限(连续组 距分组)=本组上限-本组下限+1(间断式)组数:组距小组数多,组距大组数多;经验上以520之间为好,组数不要太多,否则每组的数据太少;确定组数K的斯特格斯(Sturges)经验公式: (仅供参考)习惯上组限用5、10、,第二节 数据整理,组距式分组相关指标:组中值(本组下限值本组上限值)/2 连续式 (本组下限值后组下限值)/2 间断式计算平均指标等时,组中值一般用来代替组内平均水平;组内分布越均匀代表性越强。开口组组中值的确定方法开口组:上限或下限不确定(组距不确定)的组;以相邻组的组距作为本组的组距组中值: “以上”组: 组中值本组下限值相邻组组距/2 “以下”组: 组中值本组上限值相邻组组距/2,第二节 数据整理,课堂练习,第二节 数据整理,( )对统计资料进行分组的目的就是为了区分各组单位之间质的不同。,( )组中值是根据各组上限和下限计算的平均值,所以它代表了各组的平均分配次数。,( )某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。,( )统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。,课堂练习,第二节 数据整理,( )下列分组中属于按品质标志分组的是A、学生按考试分数分组 B、产品按品种分组C、企业按计划完成程度分组 D、家庭按年收入分组,B,( )有一个学生考试成绩为80分,在统计分组中,这个变量值应归到以下哪组A、6070分 B、7080分C、8090分 D、90100分,C,( )某主管局将下属企业先按轻、重工业分组,再按规模分组,这种分组属于分组。A、简单分组 B、复合分组C、分析分组 D、结构分组,B,2.3 变量数列,一、变量数列的基本概念二、频数和频率 补充:统计表、统计数据的图示三、累计频数和累计频率四、频数分布的类型,第三节 变量数列,一、分配数列的概念和种类在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数(频数)分配或分布(分配)数列。分布数列的相关概念:两个要素一个是总体按某种标志所分的组,另一个是各组所出现的单位数、即频数。 频数与频率:分布在各组的个体单位数叫次数,又称频数;各组次数与总次数之比叫比率,又称频率。频率非负且和为1.频数密度(=频数/组距)与频率密度( =频率/组距)。,分配数列是统计分组的一种重要形式,它可以反映总体的结构分布状况和分布特征。根据分组标志的不同,分配数列可分为两种:品质分布数列;变量分布数列(单项数列和组距数列)。由各组名称和次数组成。 例1、品质数列:某班学生的性别构成情况,第三节 变量数列,例2、单项数列:某厂第二季度工人平均日产量,第三节 变量数列,例3、等距组距数列:某工厂工人完成生产定额情况表,第三节 变量数列,例4、异距组距数列:某地区人口分布状况,第三节 变量数列,例5、开口组数列:我国土地状况分组表,第三节 变量数列,二、品质数列的编制和图示补充内容: 1、品质数列的编制:只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:,第三节 变量数列,【例】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?” 1商品广告;2服务广告;3金融广告;4房地产广告;5招生招聘广告;6其他广告。,二、品质数列的编制和图示补充内容: 2、品质数列的图示条形图:,第三节 变量数列,条形图是用宽度相同的条形的高度或长短来表示数据变动的图形条形图有单式、复式等形式在表示品质数据的分布时,是用条形图的高度来表示各类别数据的频数或频率绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图,二、品质数列的编制和图示补充内容: 3、品质数列的图示饼形图补充内容:,第三节 变量数列,也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为360025.5%91.80,其余类推,三、组距数列的编制和图示:,第三节 变量数列,确定组数,确定组距,计算频数,编制表格,图示说明,117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121,【例】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,第三节 变量数列,三、组距数列的编制和图示:,1)、确定组数:K=1+3.3*log(50)=6.64=72)、确定组距:全距/组数=5;排序(单项式分组表),第三节 变量数列,三、组距数列的编制和图示:,3)、计算频数;4)、编制表格(上限不在内!),第三节 变量数列,三、组距数列的编制和图示:,三、组距数列的编制和图示:5)、组距数列的图示直方图补充内容:用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在平面直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图直方图下的总面积等于1,第三节 变量数列,三、组距数列的编制和图示:5)、组距数列的图示直方图补充内容:,第三节 变量数列,频数(人),15,12,9,6,3,日加工零件数(个),某车间工人日加工零件数的直方图,一眼就能看出大多数人的日加工零件数在120125之间!,3,5,8,14,10,6,4,三、组距数列的编制和图示:5)、组距数列的图示折线图补充内容:折线图也称频数多边形图(Frequency polygon)是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的,第三节 变量数列,三、组距数列的编制和图示:5)、组距数列的图示折线图补充内容:,第三节 变量数列,15,12,9,6,3,105,110,115,120,125,130,135,140,日加工零件数(个),频数(人),某车间工人日加工零件数的折线图,第三节 变量数列,四、统计表(补充内容)一)、统计表的作用统计表是统计用数字说话的一种最常用的形式。1、能使大量的统计资料系统化、条理化,因而能更清晰地表述统计资料的内容。2、利用统计表便于比较个项目(指标)之间的关系,而且也便于计算。3、采用统计表表述统计资料比用叙述的方法表述统计资料显得紧凑、简明、醒目,使人一目了然。4、利用统计表易于检查数字的完整性和正确性。,二)、统计表的结构从内容上看,统计表由主词和宾词两部分组成。主词说明总体及其分组,宾词说明总体的统计指标。从构成要素看,统计表包括以下三个部分:1、总标题。2、分标题(又叫做标目):横标目和纵标目3、纵、横栏组成的本身及表中的数字。(附注) 2005年全国工业增加值资料来源:中国统计摘要,中国统计出版社2006年版,第133页。,第三节 变量数列,三)、统计表的种类(按主词)1、简单表:表的主词未经任何分组的统计表。 表的主词一般按时间顺序或按总体各单位名称排列。2、分组表:表的主词按照某一标志进行分组的统计表。3、复合表:表的主词按照两个或两个以上标志进行复合分组的统计表。,第三节 变量数列,2006年某公司所属两企业自行车合格品数量表 厂别 合格品数量(辆) 甲厂 5000 乙厂 7000 合计 12000 2005年某地区工业增加值和职工人数 项目 增加值(万元) 职工人数(人) 大型 9750 13800内资企业 中型 8600 45000 小型 4200 10050外商投资 大型 7300 7500经营企业 中型 5200 10400 小型 4400 4500,第三节 变量数列,四)、宾词指标的设计大致有两种设计方式:一种是简单设计,将宾词指标做平行配置,一一排列;另一种是复合设计,把各个指标结合起来,做层叠配置,分层排列。,第三节 变量数列,某地区工业企业的工人性别和工龄(2005年底) 企业按所有 企 工 性别 工龄 制形式分组 业 人 男 女 1年 1-3年 3-5年 5-10年 10年 数 数 以下 以上 (甲) (1) (2) (3) (4) (5) (6) (7) (8) (9) 国有单位 集体单位 合计,第三节 变量数列,某地区工业企业的工人性别和工龄(2005年底)企业按所 企 工龄有制形式 业 工人数 1年以下 1-3年 3-5年 5-10年 10年以上 分组 数(百人) 男 女 计 男 女 计 男 女 计 男 女 计 男 女 计 男 女 计 (甲) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19国有单位集体单位 合计,第三节 变量数列,五)、编制统计表应注意的问题1、统计表的标题(包括总标题和分标题)应十分简明地概括所要反映的内容。2、表中主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各个项目,后列总体。3、表中必须注明数字资料的计量单位。4、表中数字上下位置要对齐。5、统计表的表式,一般是开口式,即表的左右两端不画纵线,表的上下通常用粗线封口。6、必要时,统计表应加以注解,连同数字的资料来源等一般都写在表的下端。,第三节 变量数列,五、累计频数分布数列:1、累计频数分布数列:总体中各单位数在各组间的分布,称为次数分布。将变量数列各组的次数和比率逐组累计相加而成累计次数分布。累计次数分布的两种计算方法:向上累计:以下累计或较小制累计:上限以下向下累计:以上累计或较大制累计:下限以上 累计次数的特点:同一数值的向上累计和向下累计次数之和等于总体总次数,而累计比率之和等于1(或100%)。,第三节 变量数列,例:某班统计学考试成绩次数分布,第三节 变量数列,例:某班统计学考试成绩次数累计分布图,第三节 变量数列,五、累计频数分布数列:2、累计频数分布曲线:,五、累计频数分布数列:3、洛伦兹曲线与基尼系数(补充):最早由美国洛伦茨博士提出的累计分布曲线图,用以研究社会财富、收入等分配的平等程度。绘制方法如下:将分配的对象(如收入)和接受分配者的数量均化成结构相对数并进行向上累计;纵轴和横轴均为百分比尺度,纵轴自下而上,用以测定分配的对象(如一国的财富、土地或收入等),横轴由左向右用以测定接受分配者(如一国的人口);根据计算所得的分配对象和接受分配者的累计百分数,在图中标出相应的绘示点,连接各点并使之平滑化,所得曲线即所要求的洛伦茨曲线。,第三节 变量数列,3、洛伦兹曲线与基尼系数(补充):例:某国收入所得分配情况,第三节 变量数列,3、洛伦兹曲线与基尼系数(补充):绘制洛仑兹曲线图的过程:先将人口、收入的数量(第(1)、(4)栏)计算成为结构相对数(第(2)、(5)栏),再求出累计百分比(第(3)、(6)栏);然后在制好的比率曲线图格上依累计百分比标出绘示点,连接各绘示点即为分配曲线见图;图中的曲线为实际收入分配曲线,对角线为绝对平等线;根据实际收入分配线与绝对平等线或绝对不平等线进行对比,可衡量其不平等程度。离绝对平等线越远分配越不平等;反之,越靠近绝对平等线分配越平等。,第三节 变量数列,3、洛伦兹曲线与基尼系数(补充):如果某国绝大多数人口占有很少的收入(财富),而一小部分人占有绝大部分的收入(财富),则该国的洛伦茨曲线就靠近右下方。一般的国家,收入不是绝对平均的,即不是对角线,也不是绝对不平均的。洛伦茨曲线可以分析收入(财富)分配的平均程度。,第三节 变量数列,3、洛伦兹曲线与基尼系数(补充):基尼系数:20世纪初意大利经济学家基尼(G. Gini)根据洛伦茨曲线给出了衡量收入分配平均程度的指标A:实际收入曲线与 绝对平均线之间的面积 B:实际收入曲线与 绝对不平均线间的面积,第三节 变量数列,3、洛伦兹曲线与基尼系数(补充):基尼系数:如果A=0,则基尼系数=0,表示收入绝对平均如果B=0,则基尼系数=1,表示收入绝对不平均一般情况下,基尼系数在0和1之间取值一般认为,基尼系数小于0.2,表明分配平均;基尼系数在0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。,第三节 变量数列,六、次数分布的主要类型(一)钟型分布:“两头小,中间大”1、对称分布2、偏态分布:右偏(上偏);左偏(下偏),第三节 变量数列,六、次数分布的主要类型(二)U型分布:“两头大,中间小”(三)J型分布:“一边小,一边大”1、正J型分布 2、反J型分布,第三节 变量数列,课堂练习,第三节 变量数列,( )分配数列的实质是把总体单位总量按照总体所分的组进行分配。,( )任何一个分布都必须满足:各组的频率大于0,各组的频数总和等于1或100%,( )在次数分配数列中A、总次数一定,频数和频率成反比B、各组的频数之和等于100C、各组频率大于零,频率之和等于1D、频率越小,则组的标志值所起的作用越小E、频率表明各组标志值对总体的相对作用程度,C D E,课堂练习,第三节 变量数列,B C D E,、品质分配数列 、变量分配数列、组距式变量分配数列 、等距变量分配数列、次数分配数列,简单次数分布数列的编制实例,练习、例数据资料 某车间40名工人日产零件如下: 65 72 66 57 90 86 83 68 75 65 84 66 59 67 70 79 51 81 54 68 78 86 94 64 77 74 76 96 62 76 98 85 71 79 84 65 72 89 75 78,简单次数分布数列的编制实例,编制步骤之一数据排序并确定全距 将数据从低到高排列,形成如下变量序列: 51 54 57 59 62 64 65 65 66 66 67 68 70 71 72 72 74 75 75 76 76 77 78 78 79 81 83 84 84 84 85 86 86 88 89 90 93 94 96 98 计算全距=98-51=47 编制步骤之二确定变量数列的形式 因变量值较多、变动幅度较大,适宜采用组距式数列。,简单次数分布数列的编制实例,编制步骤之三确定组数和组距 分析 全距为47,分为5组,组距为10。编制步骤之四确定组限 分析 离散型变量分组,相邻组的组限可以重叠,也可间断,本例选择重叠。编制步骤之五计算各组的频数和频率 分析 根据排序后的变量序列清点各数据区间的频数并计算比重,也可利用Excel统计软件进行。,简单次数分布数列的编制实例,编制步骤之六绘制表格某车间工人日产零件分组表,累计次数分布数列的编制实例,累计次数分布表:,某车间工人日产零件累计数表表,第二章 小结,一、统计数据的搜集:统计调查的分类:全面调查统计报表&专门调查调查组织方式统计调查的各种形式:普查、统计报表制度、抽样调查、重点调查和典型调查。(我国以必要的周期性普查为基础,经常性的抽样调查为主体,辅之以重点调查、科学推算和部分全面报表),第二章 小结,二、数据整理:统计分组原则:穷尽性和互斥性。分类:简单分组&复合分组标志的多少 ;品质分组&数量分组标志的性质;数量分组有单项式和组距式两种。组距式分组又有离散型与连续型、等距与异距分组之分,对于组距式分组要计算组距、组数、组中值。,第二章 小结,三、变量数列:要素:一个是总体按某种标志所分的组,另一个是各组所出现的单位数、即频数。分配数列(统计表)的编制:分配数列的图示(了解):累积分配数列的编制与图示:,第二章 作业,P66,习题2.5967 895 921 978 821 924 651 850 926 946 938 800 864 919 863 981 916 818 900 893 890 954 1006 926 900 999 886 1120 905 866 816 978 1000 918 1040 854 1100 900 928 1027946 999 950 864 1050 927 949 852 928 886,第二章 作业答案,P66,习题2.5651 800 816 818 821 850 852 854 863 864 864 866 886 886 890 893 895 900 900 900 905 916 918 919 921 924 926 926 927 928 928 938 946 946 949 950 954 967 978 978 981 999 999 1000 1006 1027 1040 1050 1100 1120,

    注意事项

    本文(统计学2.数据的收集与整理ppt课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开