欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载
     

    统计ppt课件9抽样与参数估计.ppt

    • 资源ID:1436907       资源大小:1.18MB        全文页数:103页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计ppt课件9抽样与参数估计.ppt

    第九章抽样与参数估计,统计推断是统计学研究的重要内容。抽样是进行统计推断的基础性工作。参数估计是统计推断的重要内容之一。,本章主要内容,第一节 抽样与抽样分布第二节 参数估计的一般问题第三节 一个总体的参数区间估计第四节 两个总体的参数区间估计第五节 样本容量的确定,第一节 抽样与抽样分布,一、几个基本概念二、概率抽样方式三、总体分布、样本分布、抽样分布四、一个总体的抽样分布五、两个总体的抽样分布,统计推断的过程,统计推断是在对样本数据进行描述的基础上,对总体的未知数量特征作出以概率形式表述的推断。,一、几个基本概念,总体、个体、样本总体是所要研究的事物或现象的全体,也称全及总体、母体。个体是组成总体的各个基本单位或元素。样本是从总体中按一定抽样技术抽取的若干个体组成的集合体,也称抽样总体、子样。总体容量和样本容量总体容量是总体全部单位总数,用N表示。样本容量是一个样本所包含的单位数,通常用n表示。根据容量大小样本有大样本和小样本之分,一般当n30时为小样本,n30时为大样本。,总体参数和统计量,总体参数是根据总体各单位数据计算的量,又称全及指标。常用的有总体均值、总体比例(成数)、总体方差、总体标准差等。统计量是由样本构造出的且随样本变化而变化的量,又称样本指标或抽样指标,常用的有样本均值、样本比例(成数)、样本方差、样本标准差等。在一个总体中,总体参数是一个确定的量,而样本统计量因样本是随机抽取的可以有多个,因此统计量的值不是唯一确定的,是个随机变量。,二、概率抽样方式,抽样方式按是否根据已知概率抽选样本单位(按抽样的随机性)可分为概率抽样(随机抽样) 和非概率抽样(非随机抽样)。统计推断主要是概率推断,下面主要介绍概率抽样。概率抽样(随机抽样)方式主要有:简单随机抽样,分层抽样,整群抽样,系统抽样,多阶段抽样。 (如第二章所述)本课程主要介绍简单随机抽样条件下统计推断方法。,重置抽样和不重置抽样,从总体抽取样本的方法有重置抽样和不重置抽样两种。1.重置抽样又称重复抽样、有放回抽样,是每次从总体中抽取一个单位,观察记录后又放回,再抽取下一个。因此重复抽样的样本是由n次相互独立的连续试验所组成的,每次实验在相同条件下进行,在整个抽样过程中总体单位数始终不变,各单位被抽中的机会前后相等。若重置抽样并考虑各单位的排列顺序,则样本的可能数目为Nn。, 不重置抽样,又称不重复抽样、无放回抽样,是每次从总体中抽取一个单位,观察记录后不放回,再抽取下一个。因此不重复抽样的样本虽由n次连续试验所组成,而实质等于一次同时从总体中抽n个单位组成一个样本,每次实验不是相互独立的,在整个抽样过程中每抽一次总体单位就少一个,各单位被抽中的机会前后不等,越往后被抽中的机会越大。若不重复抽样也不考虑各单位的顺序,则样本的可能数目为 。在实践中当总体单位数很大,样本单位数相对较小时,可以把不重复抽样看成重复抽样,这时的计算比较简单。,是总体中各元素的观察值所形成的频数或频率分布 总体分布通常是未知的可以假定它服从某种分布,三、总体分布、样本分布、抽样分布总体分布(population distribution),是一个样本中各观察值的频数或频率分布 也称经验分布 当样本容量n逐渐增大时,样本分布逐渐接近总体的分布,样本分布(sample distribution),是某一样本统计量的全部可能取值的概率分布。现实中不可能抽出所有样本,因此统计量的抽样分布实际是一种理论概率分布。统计推断中,常用的理论概率分布:正态分布、 2分布、t分布和F分布。是样本统计量的函数。若样本是随机的,则样本统计量就是随机变量 ,如样本均值,样本比例,样本方差等为随机变量。结果来自容量相同的所有可能样本。提供了样本统计量稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据。,抽样分布(sampling distribution),抽样分布(sampling distribution),四、一个总体的抽样分布,样本均值的抽样分布样本比例的抽样分布抽样方差的抽样分布(略),样本均值的抽样分布,性质及特点是容量相同的所有可能样本的样本均值的概率分布是一种理论概率分布是推断总体均值的理论基础,举例说明样本均值抽样分布的形成过程,【例】设一个总体含有4个个体 (总体单位) ,即总体单位数N=4。各单位标志值分别为X1=1、X2=2、X3=3、X4=4 。总体标志值的分布律为:,总体均值和方差,P(X),X,样本均值的抽样分布(例题分析), 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为,样本均值的抽样分布(例题分析), 计算出各样本的均值,如下表。并给出样本均值的抽样分布。,样本均值的抽样分布(例题分析),根据表中数据求得 样本均值的均值为: 样本均值的方差为:,比较及结论:1. 样本均值的均值等于总体均值 2. 样本均值的方差等于总体方差的1/n,样本均值的抽样分布(例题分析), = 2.5 2 =1.25,总体分布,P(X),X,比较总体分布和样本均值的抽样分布,可以看出,此例尽管总体为均匀分布,但样本均值的抽样分布却是对称的钟型分布。,样本均值抽样分布的形式与特征,P(X),现实中不可能抽出所有样本,因此实际应用的样本均值抽样分布是一种理论概率分布。数理统计理论证明:当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值也服从正态分布,样本均值的数学期望为总体均值,样本均值的方差为总体方差的1/n。即xN(,2/n)。若XN (50,102),则有:当n=4,xN (50,52); 当n=16, xN (50,2.52),中心极限定理(central limit theorem),当总体为非正态分布时依据以下中心极限定理。中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大(通常n30)时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布。,中心极限定理(central limit theorem),的分布趋于正态分布的过程,抽样分布与总体分布的关系,样本均值的数学期望样本均值的方差重复抽样不重复抽样,样本均值的数学期望与方差(简单随机样本),均值的抽样平均误差,是所有可能的样本均值的标准差,用于测度所有样本均值的离散程度,描述以样本均值推断总体均值的平均误差程度。其数值小于总体标准差。简单随机重置抽样下计算公式为:,比例(proportion)是总体或样本中具有某种属性的单位数与全部单位总数之比。例如:不同性别的人数与全部人数之比合格品(或不合格品) 数与全部产品总数之比总体比例可表示为样本比例可表示为总体或样本中具有某种特征的单位数服从二项分布。,样本比例的抽样分布,样本比例的抽样分布是容量相同的所有可能样本的样本比例的概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似是一种理论概率分布是推断总体比例的理论基础,样本比例抽样分布的性质及特点,样本比例的数学期望样本比例的方差重复抽样不重复抽样,样本比例的数学期望与方差 (简单随机样本),五、两个总体的抽样分布,两个总体的样本均值之差的抽样分布两个总体的样本比例之差的抽样分布两个总体的样本方差比的抽样分布(略),若两个总体都为正态分布,即 则可以证明,抽自两个总体的两个样本的均值之差 的抽样分布服从正态分布其分布的数学期望为两个总体均值之差其方差为各自的方差之和,两个总体的样本均值之差的抽样分布,两个样本均值之差的抽样分布,若两个总体都服从二项分布,则可以证明,分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差p1-p2的抽样分布可用正态分布来近似其分布的数学期望为总体比例之差其方差为各自的方差之和,两个总体的样本比例之差的抽样分布,第二节 参数估计的一般问题,估计量与估计值点估计与区间估计评价估计量的标准,参数估计在统计方法中的地位,估计量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等例如: 样本均值x 就是总体均值 的一个估计量总体参数用 表示,估计量用 表示估计值:估计参数时计算的统计量的具体值如果样本均值 x=80,则80就是的估计值,一、估计量与估计值 (estimator & estimated value),二、点估计与区间估计,用样本统计量对总体参数进行估计基本方法可分为两大类:点估计和区间估计,点估计(point estimate),又称定值估计,用样本统计量的值直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例:在某城市,随机抽取100户,调查其家庭收入,用这100户的平均家庭收入估计该城市所有家庭的平均收入。例如:用样本比例直接作为总体比例的估计例:某工厂要检验其产品的合格率,随机抽取了50个产品进行检测,发现有3个产品不合格,则样本产品合格率为94,据此估计整批产品的合格率为94。,点估计,点估计的特点:能明确估计总体参数,但没有给出估计值接近总体参数程度的信息,无法知道估计的可靠性。点估计的方法有:矩估计法、顺序统计量法、最大似然法、最小二乘法等(略)。对于同一参数采用不同方法来估计,可能得到不同的估计量。,区间估计(interval estimate),在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量的值加减抽样极限误差得到根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。比如,根据样本统计量估计某次考试平均分数在7585之间,估计的可靠程度(置信水平)是95%,区间估计的图示,区间估计,区间估计有三项要素:估计值 ,置信区间 ,置信概率(又称置信水平)1-。置信区间 是由样本统计量所构造的总体参数的估计区间,表达了区间估计的精确性。可以在某种程度上确信这个区间包含总体参数的真值。为允许误差或抽样极限误差、边际误差。置信概率(置信水平)1-指若将构造置信区间的步骤重复很多次,其中置信区间内包含总体参数真值的次数的比例,表达了区间估计的可靠性。称为显著性水平,是总体参数真值未包含在置信区间内的比例,是参数估计不准确的概率。用一个样本构造的区间是一个特定区间,无法知道这个区间是否包含总体参数的真值,只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含总体参数真值的区间中的一个。,置信区间与置信水平,均值的抽样分布,(1 - ) % 区间包含了 % 的区间未包含,影响区间宽度的因素,以总体均值为例,估计区间为:可以看出影响区间宽度的因素:总体数据的离散程度,用总体标准差 来测度样本容量n,影响样本均值的标准差(抽样平均误差),即置信水平 (1 - ),影响 z 的大小,三、评价估计量的标准(估计量的优良性准则),用于估计总体参数的估计量可以有很多,如可以用样本均值、样本中位数作为总体均值的估计量。应选择估计效果最好的估计量进行估计。统计学家给出了评价估计量的标准。1.无偏性(Unbiasedness)2.有效性(Effectiveness)3.一致性(Consistency),1.无偏性(unbiasedness),若估计量抽样分布的数学期望等于被估计的总体参数,即E( )=,则称估计量 为的满足无偏性准则的估计量。可以证明,样本均值x是总体均值的一个无偏估计量。,2.有效性(efficiency),对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。,3.一致性(consistency),若随着样本容量的增大,估计量 的值越来越接近被估计的总体参数,则称估计量 为总体参数的满足一致性要求的估计量。,第三节 一个总体的参数区间估计,一、总体均值的区间估计二、总体比例的区间估计三、总体方差的区间估计(略),一、总体均值的区间估计,总体方差2 已知时总体均值 的区间估计总体方差2 未知时总体均值 的区间估计,总体方差2已知时总体均值的区间估计,1.当总体为正态总体时,重复抽样 简单随机样本的样本均值分布为: 若总体方差已知,建立 置信区间用Z统计量:(Z称为概率度) 在给定显著性水平下,查标准正态分布表可构造一定概率下总体均值的置信区间: 也可表示为:,总体方差2已知时总体均值的区间估计,2.当总体为正态总体时,不重复抽样 简单随机样本的样本均值分布为: 当N很大时可近似为: 若总体方差已知,建立置信区间用Z统计量,在给定显著性水平下,查标准正态分布表可构造一定概率下总体均值的置信区间:式中(1n/N)为未抽取单位数占总体单位数比重,称为有限总体修正系数,总是小于1。因此不重复抽样平均误差总是小于重复抽样平均误差。当n相对于N很小时,(1n/N)接近于1。因此对于无限总体,不重复抽样时也不必用修正系数;对于有限总体,一般当n/N0.05时采用修正系数,当n/N0.05时则可以省略。,总体方差2已知时总体均值的区间估计,3.当总体为非正态总体时,由中心极限定理可以证明,若样本容量足够大,样本均值近似服从正态分布。经验上n30即为样本容量足够大。,正态总体方差2已知总体均值的区间估计(例题),【例】一家食品生产企业生产袋装食品,日产量约8000袋,规定每袋重量为100克。为对产品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表。已知产品重量的分布服从正态分布,且总体标准差为10克。试估计该批产品平均重量的置信区间,置信水平为95%。,正态总体方差2已知总体均值的区间估计(例题),解:已知N(,102),n=25,1- = 95%,查标准正态分布表得 z/2=1.96。 根据样本数据计算得: 总体均值在1-置信水平下的置信区间为,该食品平均重量的置信区间为101.44克109.28克,非正态总体大样本总体方差2已知总体均值的区间估计(例题),【例】一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人平均年龄90%的置信区间(已知总体标准差为8)。,非正态总体大样本总体方差2已知总体均值的区间估计 (例题分析),解:总体分布形式未知,但为大样本,已知n=36, 8,1- = 90%,查表得z/2=1.645。 根据样本数据计算得: 总体均值在1-置信水平下的置信区间为,投保人平均年龄的置信区间为37.31岁41.69岁,课堂练习一:,为了了解某地区目前居民收入情况,现随机抽取50人登记其月收入,得资料如下:收入(百元)人数(人) 10以下 41020 122030 213040 1140以上 2若该地区居民收入服从XN(,100)分布,试以95%的置信水平估计目前该地区居民月收入的可能范围。,课堂练习一参考答案:,解:已知:XN(,102),n=50,1-=95%,查表得 z/2=1.96。 根据样本数据计算得: 总体均值在1-置信水平下的置信区间为,该地区居民月收入的置信区间为2123元2677元。,总体方差2 未知时总体均值 的区间估计,当总体服从正态分布,总体方差未知时,要用样本方差代替总体方差来建立置信区间,这时用t分布统计量: 在给定显著性水平下,查t分布表可构造一定概率下总体均值的置信区间:,t 分布,t分布是类似正态分布的一种对称分布,通常比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布。,正态总体小样本总体方差2未知总体均值的区间估计 (例题),【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。试建立该批灯泡平均使用寿命95%的置信区间,正态总体小样本总体方差2未知总体均值的区间估计 (例题分析),解:已知N(,2),n=16,1-=95%,查t分布表得:t/2=2.131。 根据样本数据计算得: , 总体均值在1-置信水平下的置信区间为,该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时。,课堂练习二:,某电池厂生产的某种型号电池,其使用寿命长期服从正态分布,均值为25小时。为了提高产品竞争能力,该厂家对生产线进行了改造,并声称产品寿命有所提高。现随机抽取10只电池进行测试,得其使用寿命为:(单位:小时) 26,27,28,25,24,23,27,28,25,27。 要求以95%的置信水平建立该种电池平均使用寿命的置信区间。,正态总体大样本总体方差2未知总体均值的区间估计,当总体为非正态总体,且总体方差未知时,只要样本足够大,一般当n30时,仍可用上式近似的建立总体均值的置信区间。 一般书后所附t分布表只有n45情况下的数据,因为n很大时,t分布近似于正态分布。所以当n45时,可查正态分布表作近似计算。,总体均值区间估计归纳说明:,进行区间估计时,一般有两种方法:对于一项估计值先提出估计的可靠程度要求,如 然后利用概率积分表查出与此概率保证程度相应的概率度z或t;再估计总体参数的置信区间,如,一般抽样估计,概率保证程度应达到90%95%,对于特别重大问题,如重要产品的质量指标或涉及人身安全的指标等,为保证估计安全可靠,可提出99及以上的概率保证要求。,正态分布表中常用的概率及相应概率度: F(z/2) z/2 0.90 1.645 0.95 1.960 0.99 2.576,区间估计的图示,对于一项估计值先提出允许误差范围()即估计的准确性要求,然后求出概率度,如 再查概率积分表中相应的概率保证程度F(z/2)。,常用的正态分布表中的概率度及相应的概率: z/2 F(z/2) 1 0.6826 2 0.9545 3 0.9973,一般抽样估计,允许误差范围在12倍的抽样平均误差( )之间,即z或t在12之间,但对于要避免错误判断的估计,可以把误差范围扩大到z或t=3,以提高估计的可靠性。,例:某乡水稻面积20000亩,以不重复抽样法随机抽取400亩实割实测求得样本平均亩产为645公斤,总体标准差72.6公斤。要求允许误差不超过7.2公斤,试对该乡水稻亩产和总产量作估计。解:已知 645,72.6,7.2,n=400, N=20000,则6457.2 平均亩产置信区间为:637.8652.2公斤 总产量置信区间为:(637.820000,652.220000) =(12756000,13044000) 根据 查表得F(2)=0.9545 ,即以95.45的概率保证该乡水稻平均亩产在637.8652.2公斤之间。,二、总体比例的区间估计,总体或样本中具有某种特征的单位数服从二项分布。重复抽样下以简单随机样本估计总体中具有某种特征的单位数占总体全部单位数的比例,用二项分布律进行估计。,总体比例的区间估计,根据中心极限定理,当n很大时二项分布近似服从正态分布。经验上在大样本下,若np5,n(1-p)5,则二项分布可用正态分布近似求解。因而有 样本比例分布为: 可用Z统计量构造总体 比例的置信区间,即: 查标准正态分布表 可得置信区间:总体比例未知,可用样本比例p代替。在1置信水平下,总体比例的置信区间为:,总体比例的区间估计(例题分析),例:一项广告活动的跟踪调查,在随机调查的400人中,有240人能记起广告语。试以95的置信水平估计能记起广告语的人所占比例的置信区间。解:已知 n=400 , p=240/400=0.6,np=2405, n(1-p)=1605,1-=0.95,查表得Z=1.96, 则 即以95的概率保证,估计能记起广告语的人数所占比例在55.2%64.8%之间。,总体比例的区间估计(例题分析),【例】某城市要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。,解:已知 n=100,p65%, 1-= 0.95时,查表得z/2=1.96,该城市下岗职工中女性比例的置信区间为55.65%74.35%,课堂练习三:,某电池厂生产的某种型号电池,其使用寿命的质量标准为25小时。为提高产品竞争能力,该厂家对生产线进行了改造,现随机抽取100只电池进行测试,得其使用寿命为:23小时以下 1只2324小时 4只2425小时10只2526小时79只26小时以上 6只 要求以95%的置信水平建立该种电池合格率的置信区间。,课堂练习三参考答案:,解:已知 n=100,1-= 95%, 查表得z/2=1.96 由资料可知使用寿命在25小时以上的电池共85只,因此:p=85/100=85% 则总体比例在1-置信水平下的置信区间为,在95%的置信水平下,该种电池合格率的置信区间为:82.50%87.50%。,课堂练习四:,某彩电生产厂对某地区居民家庭购买其产品的情况进行调查,调查户数为400户,其中有40户购买了该厂生产的彩电。要求以95.45的置信水平估计该地区居民家庭购买该厂产品的比例的置信区间。,区间估计应注意:,在进行区间估计时,必须同时考虑置信概率和置信区间两个方面,二者都与概率度(z或t)有关。在样本容量一定的情况下,置信概率定得越大,估计的可靠程度就越大,概率度(z或t)就越大,则置信区间相应也越大,估计的准确性就越小。因此对于可靠性和准确性,要结合具体问题、具体要求来综合考虑。,第四节 两个总体的参数区间估计,一、两个总体均值之差的区间估计二、两个总体比例之差的区间估计三、两个总体方差比的区间估计(略),一、两个总体均值之差的估计大样本,假定条件两个总体都服从正态分布,1、 2已知若不是正态分布, 可以用正态分布来近似(n130和n230)两个样本是独立的简单随机样本建立置信区间使用正态分布统计量Z,两个总体均值之差的估计 (大样本),3.1、 2已知时,两个总体均值之差1-2在1- 置信水平下的置信区间为,4.1、 2未知时,两个总体均值之差1-2在1- 置信水平下的置信区间为,两个总体均值之差的估计(例题分析),【例】某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立地抽取两个随机样本,有关数据如下表 。建立两所中学高考英语平均分数之差95%的置信区间,两个总体均值之差的估计(例题分析),解: 两个总体均值之差在1-置信水平下的置信区间为,两所中学高考英语平均分数之差的置信区间为5.03分10.97分,两个总体均值之差的估计小样本: 12=22,假定条件两个总体都服从正态分布两个总体方差未知但相等:1=2两个独立的小样本(n130和n230)总体方差的合并估计量,估计量x1-x2的抽样标准差,两个总体均值之差的估计(小样本: 12=22 ),4.建立两个样本均值之差的置信区间用t统计量,5.两个总体均值之差1-2在1- 置信水平下的置信区间为,两个总体均值之差的估计小样本: 1222,假定条件两个总体都服从正态分布两个总体方差未知且不相等:12两个独立的小样本(n130和n230)建立置信区间使用统计量t,两个总体均值之差的估计(小样本: 1222),3.两个总体均值之差1-2在1- 置信水平下的置信区间为,两个总体均值之差的估计匹配大样本,假定条件两个匹配的大样本(n1 30和n2 30)两个总体均值之差d=1-2在1- 置信水平下的置信区间为,两个总体均值之差的估计匹配小样本,假定条件两个匹配的小样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布 两个总体均值之差d=1-2在1- 置信水平下的置信区间为,1.假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的2.两个总体比例之差1- 2在1-置信水平下的置信区间为,二、两个总体比例之差的区间估计,两个总体比例之差的估计(例题分析),【例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以90%的置信水平估计城市与农村收视率差别的置信区间。,两个总体比例之差的估计(例题分析),解: 已知 n1=500 ,n2=400, p1=45%, p2=32%, 1-=95%, z/2=1.96 1- 2置信度为95%的置信区间为,城市与农村收视率差值的置信区间为6.68%19.32%,第五节 样本容量的确定,前面讨论中都假定样本容量n已知,但在实践中需要自己设计调查方案,确定样本容量。样本容量n越大,抽样误差越小,但n越大,所需人、财、物及时间也越多;n太小,估计误差会很大。因此确定样本容量的大小要从允许误差范围、概率保证程度及经费、时间等多方面统筹考虑。一、估计总体均值时样本容量的确定二、估计总体比例时样本容量的确定,一、估计总体均值时样本容量的确定 重复抽样下估计总体均值时样本容量:,可以看出样本容量n与总体方差2、允许误差、概率度Z或t之间的关系为样本容量n 与总体方差2成正比样本容量n与允许误差成反比样本容量n与概率度Z或t成正比,估计总体均值时样本容量的确定(例题分析),例:一家广告公司想估计某类商店去年平均每店广告费支出额。经验表明,总体方差为1800000。若置信水平取95,允许误差为500元,问应抽取多少家商店作样本? 解:已知21800000,0.05, 查表得z /2 1.96,500, 则 应抽选28家商店作样本。 n应取整数。,估计总体均值时样本容量的确定 (例题分析),【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计平均年薪95%的置信区间,希望允许误差为400元,应抽取多大的样本容量?,估计总体均值时样本容量的确定 (例题分析),解: 已知 =2000,=400, 1-=95%, z/2=1.96 则,即应抽取97人作为样本,二、估计总体比例时样本容量的确定 重复抽样下估计总体比例时样本容量:,的取值一般小于0.1。 未知时,可取最大值0.5。因为对于服从二项分布的随机变量,当 =0.5时,方差达到最大值。用0.5计算得出的样本容量可以保证有足够高的置信水平和尽可能小的置信区间。,估计总体比例时样本容量的确定 (例题分析),例:某市场调研公司想估计某地区有家用计算机的家庭所占比例。希望允许误差不超过0.05,可靠程度为95,问应取多大容量的样本?没有可利用的比例 。解:已知:p0.05 , =0.05 , z /2 =1.96 , 用 =0.5计算 ,则 应抽取385户家庭进行调查。,估计总体比例时样本容量的确定 (例题分析),【例】根据以往的生产统计,某种产品的合格率约为90%,现要求允许误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本?,解:已知p=90%,=0.05, Z/2=1.96, p=5%应抽取的样本容量为,应抽取139个产品作为样本,小结,内容 置信区间,总体均值的区间估计,已知,未知(正态总体小样本),总体比例的区间估计(大样本),小结,内容 置信区间,两个总体均值之差的 估计,已知,未知,两个总体比例之差 的估计,本章学习要求,了解抽样推断的几个基本概念;理解参数估计基本方法:点估计和区间估计;理解和掌握简单随机抽样下总体均值和总体比例的区间估计方法以及必要样本单位数的确定方法。,本章到此结束,再见!,

    注意事项

    本文(统计ppt课件9抽样与参数估计.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开