欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    SPSS第5章 总体分布样本分布与参数估计(修课件.ppt

    • 资源ID:1524251       资源大小:2.12MB        全文页数:83页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    SPSS第5章 总体分布样本分布与参数估计(修课件.ppt

    第五章 总体分布、 样本分布与参数估计, 5.1 总体分布与样本分布,一、总体与总体分布 总体:反映总体特征的随机变量的取值的全体。 总体分布:反映总体特征的随机变量的概率分布。,二、随机样本与样本观测值 1、随机样本 表征n次抽取个体的随机抽样的一组随机变量X1,X2, Xn 。 2、样本观测值(样本数据) n次随机抽样的结果:x1,x2,xn (称为随机样本X1,X2, Xn 的样本观测值)。 n称为随机样本向量( X1,X2, Xn )的维度,即自由度。,样本均值的抽样分布,一个总体10,5,8,7,10,Q:若有放回地抽取2次,请画出两次均值的分布图。,有放回(with replacement)抽样,一个样本统计量的概率分布被称为该统计量的抽样分布,3、样本(累积)分布函数 设样本观测值x1 x2 , xn,ki为小于xi+1的样本值出现的累积频次, n为样本容量,则可得样本累积频率分布函数如下:,样本(累积)分布函数Fn(x)是对总体的累积分布函数F(x)的近似, n越大, Fn(x)对F(x)的近似越好。,格利文科 ( Glivenko )定理 当样本容量 n 趋于无穷大时,Fn(x)以概率1(关于 x )均匀地收敛于F(x).,思考:请举出总体均值和总体方差的合适估计量。, 5.2 统计量与统计量的分布一、统计量的定义统计量:统计量是不含未知参数的,随机样本X1,X2,, Xn的函数。统计量的值: 统计量的值是不含未知参数的, 样本观测值x1,x2,xn的函数.,二、几个重要统计量分布:2、t 与 F分布1、 2(n)分布 设随机变量 X N(0,1) , X1,X2,, Xn为 X 样本,则 2 = X2i= X21 + X22 + X2n 2 (n) 2 (n)分布的均值 E(2)= n,方差 D( 2 )= 2n。,n=1,n=4,n=10,2(n)分布图,2(n)密度函数:,其中,n为自由度。(n/2)为珈玛函数,是一个含参数n/2的积分,为:,2、t 分布,其中,X N(0,1),Y 2(n)分布,且X与Y相互独立。密度函数为:,t 分布图,3、F 分布,其中,U 2(m),V 2(n) ,且U与V相互独立。,m=100,n=20,m=15,n=20,重要性质:,密度函数形式为:,三、由一般正态分布的随机样本所构成的若干重要统计量的分布定理:若X1,X2,, Xn 是正态总体N(, 2)的一个随机样本,则:,(1) X N(, 2 / n)(2) X 与 S2 相互独立。,(3) N(0, 1),(4) 2(n-1),(5) t(n -1),(6) 2(n),(1) N(0,1),定理:若X1,X2,, Xn1 和Y1,Y2,, Yn2 分别是正态总体N(1, 12)和N(2, 22)的一个随机样本,且它们相互独立,则满足如下性质:,(3) F(n1-1,n2-1),其中,S12是容量为n1的X的样本方差, S22是容量为n2 的Y的样本方差。,(2),t(n1+n2 - 2),( 1 = 2 ),(4) F(n1,n2),四、任意分布的随机样本均值函数的均值与方差设:随机变量 X 服从任何均值为,标准差为 的分布,X是随机样本X1,X2,, Xn的均值函数。则:X = ;(2) X = / n 或 2X = 2 / n,Tips: 某类个体数量占总体数量的比例问题:0-1分布 若XB(1, p),则 E(X)= p, D(X)= p(1-p),X的均值也是总体中某类个体的比例 p,五、中心极限定理假设随机变量 X 服从任何均值为,标准差为 的分布,X是随机样本X1,X2,, Xn的均值函数。,当 n 充分大时,有:,思考:在实际问题中n多大?,Tips:当n 30, 无论总体分布形态如何,中心极限定理均适用;当n 15, 对于分布较为对称的总体,中心极限定理适用;当总体是正态分布时,无论样本大小,中心极限定理均适用。,Ex:某高校在研究生入学体检后对所有结果进行统计分析,得出其中某一项指标的均值是7,标准差2.2。从这个总体中随机选取一个容量为31的样本。(1)计算样本均值大于7.5的概率;(2)计算样本均值小于7.2的概率;(3)计算样本均值在7.2和7.5之间的概率。,解答1:,标准正态分布表,( - x ) = 1 ( x ),解答2:,统计方法,统计描述,统计推断,参数估计,假设检验,点估计,区间估计, 5.3 点估计,1、概念 设 是总体分布中一个需要估计的参数,现从总体中抽取一个随机样本X1,X2,, Xn ,记估计的统计量为,则称 为的估计量。,若得到一组样本观测值x1,x2,xn ,就可得出的估计值,记: 。,注:在选取样本统计量 作为点估计时,必须考虑到“无偏性”,这一点很重要。,总体分布参数 的点估计,就是求出 的估计值。,点估计,2、矩估计 用样本矩来估计总体矩。矩的一般形式: E(X k)表示 k 阶原点矩(以原点为中心); E(X- )k 表示k 阶中心矩(以为中心);,Q:偏度、峰度、方差、均值分别是什么矩?,2、矩估计,Ex:设某批产品的寿命在上服从均匀分布,但是参数未知,随机地抽取五个产品,测得寿命分别是1265小时,1257小时,1276小时,1269小时和1266小时,试求这批产品寿命均值和方差的矩估计值,并写出相应的分布函数。,3、极大似然估计法 若总体 X 的(累积)概率分布函数为F(x, ), 概率密度函数 f (x, ), 其中 为未知参数 。 若 X 为离散型随机变量, 则由离散型与连续型的对应关系, f (x, )对应于离散情况下的概率P(X=x).,X 为连续型随机变量时, X的随机样本X1,X2,, Xn的联合概率密度函数为,称为 的极大似然估计函数. 当 X 为离散随机变量时, L表示概率:,L关于的极大值如果存在, 极大值 就是的极大似然估计值. 其含义是: 一组观测值x1,x2,xn在一次实验中出现了, 其联合概率就应当是最大的, 所以选择 使联合密度L最大的那个.,Ex: 设x1,x2,, xn是正态总体N(, 2)的样本观测值,求 与 2 的极大似然估计值.解: 极大似然函数为,取对数, 分别对 与 2 求偏导, 并令偏导为0, 可求出 与 2的极大似然估计值如下:,如果将上述xi 换成 Xi , 上式成为极大似然估计量。, 5.3 判别点估计的优劣标准,1、无偏估计量,2、最小方差性,3、有效估计量 (1)无偏性;(2)最小方差性。,4、渐近无偏估计量,5、一致估计量,一致估计量的另一等价定义:(1) 渐进无偏的;(2),6、渐进有效性: (1) 一致估计量; (2) 比其它的估计量更小的渐进方差。渐进方差定义:,注:在实践中广泛应用的准则:(1)小样本准则 a、无偏性; b、有效性。(2)大样本准则 一致估计量。,思考:为了估计目前北京市场二手房交易的平均价格,制定相应的营销策略,某房地产中介公司某年第四季度的二手房交易中,随机抽取40个交易作为样本,得到二手房交易价格如下表所示(单位:万元)。,根据上述数据如何估计总体的平均价格?如果需要进一步推断房屋款项在43万元以上的交易占全部交易的比例,应当如何分析呢?,区间估计过程,均值是未知的,总体,随机样本,我有 95% 的把握认为 在40和50之间.,均值 = 45.54,区间估计初步,置信区间,样本统计量(点估计),置信下界,置信上界,总体参数落在某区间内的概率,1.未知总体参数所在的区间称为置信区间;2.未知总体参数落在区间内的概率为 (1,称为置信水平/置信度;3. 未知总体参数不落在区间内的概率%,称为显著性水平;4.置信水平通常取值 99%, 95%, 90% 即显著性水平为=0.01, =0.05, =0.10,Tips:,置信区间,90% 样本,95% 样本,99% 样本,影响区间宽度的因素,置信区间影响区间宽度的因素:1. 数据离散度 2. 样本容量 n3. 置信水平 (1),区间估计的步骤,以总体均值的区间估计为例: 1. 确定置信水平 2. 根据置信水平,查标准正态分布表确定其 值;3. 实际抽样,并计算样本的均值 和抽样误差 ;4. 确定置信区间:,区间估计的内容,区间估计,总体均值的区间估计,总体比例的区间估计,总体方差的区间估计,两个总体均值之差,单一总体,单一总体均值的区间估计 (X已知或大样本),1.假设已知总体标准差总体正态分布如果不是正态, 可被正态分布逼近 (样本n 30)2.置信区间,例1,沿用引例,假定房地产中介公司从上季度的二手房交易记录中得到以下信息:交易价格的标准差为15万元,于是我们假定总体标准差 =15。试在95%的置信水平下估计二手房平均价格的置信区间。,解答,已知n=40, =15;计算得到样本均值 由1-=0.95,查标准正态分布概率表得:于是在95%的置信水平下的置信区间为:即(40.89,50.19)。结果表明:在95%的置信水平下,二手房交易价格的置信区间为40.89万元50.19万元。,单一总体均值的区间估计 (X未知且小样本),1.假设 总体标准差未知总体服从正态分布2.用 t 分布3.置信区间,Z,t,t 分布 (Students t Distribution),0,t (df = 5),标准正态分布,t (自由度df = 11),自由度 (Degree of freedom ),1. 当样本统计量被计算出以后可以自由改变的观测值数目2. 举例:3 个数之和是 6X1 = 1 (或其他数)X2 = 2 (或其他数)X3 = 3 (不能改变)Sum = 6自由度df=n1=2,举例2,沿用引例,假定该房地产公司在某日随机抽取16位二手房购买者,得到二手房交易价格如下表所示(万元)。 根据以往交易情况得知:二手房交易价格服从正态分布,但总体方差未知。试在95%的置信水平下估计二手房交易平均价格的置信区间。,解答,已知n=16;计算得到样本均值 ;样本标准差 s=14.175;由1=0.95,查表得:于是在95%的置信水平下的置信区间为:即(35.923,51.027)。结果表明:在95%的置信水平下,二手房价格的置信区间为35.923万元51.027万元;即该公司可以有95%的把握认为,二手房交易价格介于35.923万元到51.027万元之间。,单一总体均值的区间估计总结,区间估计,总体均值的区间估计,总体比例的区间估计,总体方差的区间估计,两个总体均值之差,单一总体,区间估计的内容,两个总体均值之差的区间估计 (总体方差为已知),独立样本(Independent sample):两个样本是从两个总体中独立地抽取的,即一个样本中的元素与另一个样本中的元素相互独立。1.大样本条件下 (1)在两个总体的方差12和22均已知的情况下, 两个总体均值之差的置信区间为:,总体方差未知,1.大样本条件下 (2)在两个总体的方差12和22均未知的情况下,可用两个样本的方差s12和s22代替。 这时,两个总体均值之差的置信区间为:,举例3,沿用引例。从次年初开始,北京二手房交易价格急剧攀升。为对比次年第一季度与当年第四季度二手房平均价格的差异,该房地产中介公司从次年第一季度的交易中随机抽取36个,得到二手房交易价格如下表所示(单位:万元)。,举例3,将以上数据和引例中当年第四季度二手房交易价格进行整理,得到根据以上数据,试以95%置信水平估计次年第一季度与当年第四季度的二手房交易平均价格差值的置信区间。,解答,由于两个样本相互独立,且均为大样本,因此两个样本的均值之差服从正态分布。 在95%置信水平下做出区间估计如下:即(16.22,0.56)。结果表明:有95%的把握认为,总体平均价格的差异介于16.22万元0.56万元之间,即次年第一季度比当年第四季度的二手房平均交易价格显著上升。,小样本条件下区间估计,2.小样本条件下 (1)当两个总体的方差均已知时,可用上式建立两个总体均值之差的置信区间 。(2)当两个总体的方差12和22均未知,且12=22时,可用两个样本的方差s12和s22计算总体方差的合并估计量sp2 。,这时,两个样本均值之差经标准化后服从自由度为的t分布。两个总体均值之差的置信区间为:,举例4,沿用引例。为对比北京市不同地区二手房交易价格的差异,该房地产中介公司从中关村和望京地区两个营业部某年第一季度的二手房交易中各抽取8个,得到二手房交易价格如下表所示:假定两个地区的二手房交易价格服从正态分布,且方差相等。试以95%置信水平估计某年第一季度中关村和望京地区的二手房平均价格差值的置信区间。,解答,已知n=16,总体方差未知;计算得由1-=0.95, 8+8-2=14查表得于是在95%置信水平下的置信区间为,解答,即(2.041,35.591)。结果表明:有95%的把握认为,总体平均交易价格的差异介于2.041万元到35.591万元之间。本例中,所求置信区间包含0,说明我们没有足够的理由认为某年第一季度中关村地区和望京地区的二手房交易平均价格存在显著差异。,2.小样本条件下 (3)当两个总体的方差12和22均未知,且1222时,如果两个总体都服从正态分布且两个样本的容量相等n1=n2,则可用下列公式建立两个总体均值之差的置信区间:,2.小样本条件下 (3)当两个总体的方差12和22均未知,且1222时,如果两个样本的容量不相等n1n2,则两个样本均值之差经标准化后近似服从自由度为d的t分布,两个总体均值之差的置信区间为:,其中,,两个总体均值之差的区间估计,配对样本(Matched sample),即一个样本中的数据与另一个样本中的数据相对应。 1. 大样本条件下,两个总体均值之差的置信区间为:2. 小样本条件下,两个总体均值之差的置信区间为:,其中,d-为各差值的均值;当总体标准差未知时,可以用样本差值的标准差替代 。,举例5,沿用引例。为比较分析北京市同一地区不同年份二手房价格的差异,该房地产中介公司从中关村地区当年第四季度的二手房交易中,抽取了8个交易;并根据次年当月市场行情,分别对这8个房源进行重新估价,得到二手房价格如下表所示(单位:万元)。假定二手房价格服从正态分布,且方差相等。试以95%置信水平估计中关村地区次年第一季度和当年第四季度的二手房平均价格差值的置信区间。,解答,已知n=8,总体方差未知;计算得。由1-=0.95,查表得于是按照上式,在95%置信水平下的置信区间为:即(10.172,6.604)。结果表明:有95%的把握认为,总体平均价格的差异介于10.17万元6.60万元之间。即认为中关村地区次年第一季度比当年第四季度的二手房平均价格有显著提高。,区间估计的内容,区间估计,总体均值的区间估计,总体比例的区间估计,总体方差的区间估计,两个总体比例之差,单一总体,单一总体比例的区间估计,1.假设 总体服从二项分布 可以用正态分布近似估计n p 5 且 n (1 - p) 52.置信区间估计,两个总体比例之差的区间估计,1.假设 总体服从二项分布 可以用正态分布近似估计n p1 5 且 n (1 - p1 ) 5; n p2 5 且 n (1 p2 ) 52.置信区间估计,举例6,根据引例以及例3的数据,整理得出次年第一季度与当年第四季度交易价格在43万元以上的二手房交易数量及所占比例,试在95%置信水平下估计这两个时期,交易价格在43万元以上的二手房交易所占比例的差值的置信区间。整理数据如下 :,解答,已知在95%置信水平下的置信区间为:即(41.04%,2.16%)。结果表明:有95%的把握认为,两个年份价格在43万元以上的二手房交易所占比例的差异介于- 41.04 %到2.16%之间。本例中,所求置信区间包含0,说明我们没有足够的理由认为次年第一季度与当年第四季度价格在43万元以上的二手房交易所占比例存在显著差异。,区间估计的内容,区间估计,总体均值的区间估计,总体比例的区间估计,总体方差的区间估计,总体方差的区间估计,1.假设 总体服从正态分布2.用 分布3. 置信区间:,举例7,沿用引例,假定二手房的交易价格服从正态分布。试在95%的置信水平下估计二手房交易价格方差的置信区间。,解答,计算得由a=0.05在95%置信水平下总体方差的置信区间为:即(191.10,469.63);相应地,总体标准差的置信区间为(13.82,21.67)。结果表明:有95%的把握认为,当年第四季度二手房交易价格的标准差介于13.82万元到21.67万元之间。,样本容量的确定,假定E (Error)是在一定置信水平下允许的误差范围,又称边际误差,于是有: 估计总体均值时: 估计总体比例时:,样本容量的确定,估计总体均值时:估计总体比例时:估计两个总体均值之差时:估计两个总体比例之差时:,举例8,沿用引例,假定房地产中介公司想要估计当年第四季度二手房的平均交易价格。按照历史经验,总体标准差为15万元。试问:在95%的置信水平下,使二手房平均交易价格的误差范围小于5万元,样本容量应定为多少?,解答,已知:样本容量即应抽取35个交易作为样本。,作业: 请在国家统计局网站找2组相关数据(数据量可以不同),并完成如下分析:(1) 给出各组数据的特征值及其置信区间;(2) 分析二者之间是否存在显著差异;(3) 结合实际给出合理解释。 请将本次作业的word文档命名为“学号姓名(第3次作业)”发送至 (注:内容雷同的作业均为不合格),

    注意事项

    本文(SPSS第5章 总体分布样本分布与参数估计(修课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开