欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第四统计假设检验与参数估计.ppt

    • 资源ID:5711938       资源大小:1.78MB        全文页数:149页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第四统计假设检验与参数估计.ppt

    第四章 统计假设检验与参数估计,统计推断是根据样本分布规律和概率理论,由样本结果去推断总体特征。它主要包括假设检验(test of hypothesis)和参数估计(parametric estimation)两部分内容。,下一张,主 页,退 出,上一张,假 设 检 验 又叫 显著性 检验(test of significance)。显著性检验的方法很多,常用的有u检验、t检验、F检验和2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。参数估计有点估计(point estimation)和区 间 估计(interval estimation)。,下一张,主 页,退 出,上一张,例1:某一酿造厂新引进一种酿醋曲种,以原曲种为对照进行试验。已知原曲种酿出的食醋醋酸含量平均为09.75,其标准差为5.30。现采用新曲种酿醋,得到30个醋样,测得其醋酸含量平均为 11.99。试问,能否由这30个醋样的平均数 判断新曲种好于原曲种?,1 统计假设检验概述,下一张,主 页,退 出,上一张,1.1 统计假设检验的意义和基本原理,1.1.1 统计假设检验的意义,食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的?,例2:A,B两种肥料,在相同条件下各施用于5个小区的水稻上,水稻产量平均分别为,二者相差20kg,那么20kg差异究竟是由于两种肥料的不同而造成的还是由试验的随机误差造成的?,例3:小麦良种的千粒重xN(33.5,1.62),现由外地引进一高产品种,在8个小区种植,得千粒重(g):35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,平均数为,试问新引进的品种千粒重与当地品种有无显著差异?如果有显著差异,是否显著高于当地品种?,以上这几种问题的判断均是由样本去推断总体的,属于统计假设检验问题,均是来判断数据差异、分布差异是由处理引起,还是由于随机误差引起的。,样本虽然来自于总体,但样本平均数并非是总体平均数。由于抽样误差的影响(随机误差的存在),样本平均数与总体平均数之间往往有偏差。因此,仅由表面效应 是不能判断它们之间是否有显著差异。其根本原因在于 试 验 误差(或抽样误差)的不可避免性。,通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受其它诸多无法控制的随机因素的影响。所以观测值 由两部分组成,即=+总体平均数 反映了总体特征,表示试验误差。若 样本含量 为n,则 可 得 到 n 个 观 测值:,。于是样本平均数,下一张,主 页,退 出,上一张,可以看出,样本平均数并非总体平均数,它还包含试验误差的成分。,试验表面效应为,上式表明,试验的表面效应由两部分构成:一部分是试验的处理效应(即两总体平均数的差异);另一部分是试验误差。因此,仅凭表面效应来判断两总体平均数是否相同是不可靠的。,如果处理效应不存在即,则表面效应仅由误差造成,此时可以说两总体平均数无显著差异;如果处理效应存在,则表面效应不仅由误差造成,更主要由处理效应影响。所以,判断处理效应是否存在是假设检验的关健。,同理,对于接受不同处理的两个样本来说,则有:=+,=+这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫 做 试 验 的 处 理 效 应(treatment effect);另一部分是试验误差(-)。,下一张,主 页,退 出,上一张,也就是说样本平均数之差(-)包含有试验误差,它只是试验的表面效应。因此,仅凭(-)就对总体平均数、是否相同下结论是不可靠的。只有 通过 显著性检验 才能从(-)中提取结论。对(-)进行显著性检验就是要分析:试验的表面效应(-)主要由处理效应(-)引起的,还是主要由试验误差所造成。,下一张,主 页,退 出,上一张,处理效应(-)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在。,下一张,主 页,退 出,上一张,下一张,主 页,退 出,上一张,小概率事件实际不可能性原理,1.1.2 统计假设检验的基本思想,小概率事件在一次试验中被认为是不可能发生的。,小概率事件不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。,0.05 0.01 0.001称 之 为 小 概 率 事件。,下一张,主 页,退 出,上一张,举一例子,箱子中有黑球和白球,总数100个,但不知黑球白球各多少个。现提出假设H0:“箱子中有99个白球”,暂时设H0正确,那么从箱子中任取一球,得黑球的概率为0.01,是一小概率事件。今取球一次,如果居然取到了黑球,那么,自然会使人对H0的正确性产生怀疑,从而否定H0。也就是说箱中不止1个黑球。,下一张,主 页,退 出,上一张,1.1.3 统计假设检验的基本原理,1.根据研究目的,对研究总体提出假设,原假设、无效假设、零假设(null hypothesis),是被检验的假设,通过检验可能被接受,也可能被否定。,与H0对应的假设,只有是在无效假设被否定后才可接受的假设。无充分理由是不能轻率接受的。,备择假设(alternative hypothesis),如前例,原假设H0:,即假设由新曲种酿造出的食醋的醋酸含量与原菌种酿造的食醋醋酸含量相等,这个假设表明采用新曲种酿造食醋对提高醋酸含量是无效的,试验的表面效应是随机误差引起的。,对应的备择假设为,即表明采用新曲种酿造食醋能够改变醋酸含量,试验的处理效应存在。,对于来自两个总体的两个样本,原假设H0:,即两个总体的平均数相等,处理效应为零,试验表面效应仅由误差引起,处理效应不存在。,对应的备择假设是:,即假设两个总体的平均数 不相等,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。,2.在无效假设成立的前提下,构造合适的统计量,并由该统计量的抽样分布计算样本统计量的概率。,下一张,主 页,退 出,上一张,当无效假设H0成立时,表明试验表面效应纯属试验误差引起,处理效应不存在。此时,可根据题意构造适当统计量,计算样本统计量值。,对前例分析,无效假设H0:成立,试验的表面效应是随机误差引起的。那么,可以把试验中所获得的 看成是从 总体中抽取的一个样本平均数,由样本平均数的抽样分布理论可知,,N(0,2n)。,构造统计量:,N(0,1),(4-1),由样本值计算统计量u值,,由正态分布双侧分位数(u)可知,本例计算出的统计量u2.315,1.96 2.58,所以可推知其概率,0.01 0.05,本试验的表面效应 0.0224完全由试验误差造成的概率在0.01-0.05之间。,在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试 验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设H0,接受备择假设HA,即认为试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于0.05时,则说明无效假设成立的可能性大,不能被否定,因而也就不能接受备择假设。,下一张,主 页,退 出,上一张,3.根据“小概率事件实际不可能性原理”否定或接受无效假设,叫做均数差异标准误;n1、n2为两样本的含量。,对于来自两个总体的样本,研究在无效假设:=成立的前提下,统计量(-)的抽样分布。经统计学研究,得到一个统计量t:,下一张,主 页,退 出,上一张,其中,所得的统计量 t服从自由度 df=(n1-1)+(n2-1)的t分布。,t(df),根据两个样本的数据,计算得:-=11-9.2=1.8;,下一张,主 页,退 出,上一张,进一步估计|t|2.426的两尾概率,即估计P(|t|2.426)是多少?查附表3,在df=(n1-1)+(n2-1)=18时,两尾概率为0.05的临界值:两尾概率为0.01的临界t值:,下一张,主 页,退 出,上一张,=2.101,,=2.878,,即:P(|t|2.101)=P(t2.101)+P(t 2.878)=P(t2.878)+P(t-2.878)=0.01,由两样本数据计算所得的t值为2.426,介于两个临界t值之间,即:t0.052.426t0.01 所以,|t|2.426的概率P介于0.01和0.05之间,即:0.01 P 0.05。如图所示,|t|2.426的两尾概率,说明无效假设成立的可能性,即试验的表面效应为试验误差引起的可能性在0.01 0.05之间。,下一张,主 页,退 出,上一张,按所建立的:=,试验的表面效应是试验误差的概率在 0.01 0.05 之间,小于0.05,故有理由否定:=,从而接受:。可以认为两个总体平均数 和 不相同。综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。,下一张,主 页,退 出,上一张,在统计假设检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准 叫 显 著 水 平(significance level),记作。在试验研究中常取=0.05或=0.01。,下一张,主 页,退 出,上一张,1.1.4 统计假设检验的显著水平,假设检验时选用的显著水平,除=0.05和 0.01为常用外,也可选=0.10 或=0.001等等。到底选哪个显著水平,应根据试验的要求或试验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即值取大些。反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即值应该小些。显著水平对假设检验的结论是有直接影响的,所以在试验开始前应给以确定。,下一张,主 页,退 出,上一张,若|t|0.05,即表面效应属于试验误差的可能性大,不能否定:=,统计学上把这一检验结果表述为:“两个总体平均数 与 差异不显著”,在计算所得的t值的右上方标记“ns”或不做任何标记;,下一张,主 页,退 出,上一张,统计假设检验结果说明(两个样本):,若t0.05|t|t0.01,则 说明 试验的表面效应属于试验误差的概率P在0.010.05之间,即0.01 P0.05,表面效应属于试验误差的可能性较小,应否定:=,接受:,统计学上把这一检验结果表述为:“两个总体平均数 与 差异显著”,在计算所得的t值的右上方标记“*”;,下一张,主 页,退 出,上一张,若|t|t0.01,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P 0.01,表面效应属于试验误差的可能性更小,应否定:=,接受:,统计学上把这一检验结果表述为:“两个总体平均数 与 差异极显著”,在计算所得的t值的右上方标记“*”。,下一张,主 页,退 出,上一张,1.2 统计假设检验的步骤,建立假设。对样本所属总体提出假设,包括无效假设H0和备择假设HA;确定显著水平。常用的显著水平0.05和0.01;从无效假设H0出发,根据样本提供信息构造适宜统计量,并计算统计量值或概率;由附表查出相应的统计量临界值,比较样本统计量值与临界值大小,根据小概率原理做出统计推断(或由概率大小做出判断)。,1.3 统计假设检验的几何意义与两类错误,1.3.1 统计假设检验的几何意义,统计假设检验从本质上来说,就是根据显著水平将统计量(数)的分布划分为接受区和否定区两部分。前者为接受原假设H0的区间,后者为否定H0,而接受HA的区间。当试验结果落入接受区,就接受H0;反之,否定H0,而接受HA。否定区的概率为,接受区的概率为1-。,是否否定无效假设 或,用实际计算出的统计量u或t的绝对值与显著水平对应的临界值ua 或ta比较。若|u|ua 或|t|ta,则在水平上否定;若|u|ua或|t|ta,则不能在水平上否定。区间 和 或称为水平上的否定域,而区间()则称为水平上的接受域。,下一张,主 页,退 出,上一张,图4-1 双侧检验时H0的接受域和否定域,对前例分析:,所以在a0.05水平上的接受域为,(0.0785 0.1165),否定域为 0.0785,0.1165,试验结果 0.1199,落入否定区间,所以否定,接受,结论:采用新曲种酿造食醋,其醋酸含量有显著改变。,统计假设检验的是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。也就是说,在检验无效假设时可能犯两类错误。第一类错误:H0本身是成立,但通过检验却否定了它,犯了“弃真”错误,也叫型错误(type error)、错误。型错误,就是把非真实差异错判为真实差异,即 为真,却接 受了。,下一张,主 页,退 出,上一张,1.3.2 统计假设检验的两类错误,第二类错误:H0本身不成立,但通过检验却接受了它,犯了“纳伪”错误,也叫型错误(type error)、错误。型错误,就是把真实差异错判为非真实差异,即 为真,却未能否定。统计检验是基于“小概率事件实际不可能性原理”来否定H0,但在一次试验中小概率事件并不是绝对不会发生的。如果我们抽得一个样本,它虽然来自与H0 对应的抽样总体,但计算所得的统计量却落入了否定域中,因而否定了H0,于是犯了型错误。犯这类错误的概率不会超过a。,下一张,主 页,退 出,上一张,型错误发生的原因可以用图 4-2来说明。图中左边曲线是 为真时,(-)的分布密度曲线;右边曲线是 为真时,(-)的分布密度曲线(),它们构成的抽样分布相叠加。有 时 我 们 从 抽样总体抽取一个(-)恰恰在 成立时的接受域内(如图中横线阴影部分),这样,实际是从 总体抽的样本,经显著性检验却不能否定,因而犯了型错误。犯型错误的概率用 表示。,下一张,主 页,退 出,上一张,图4-2 两类错误示意图,型错误概率 值的大小较难确切估计,它只有与特定的 结合起来才有意义。一般与显著水平、原总体的标准差、样本含量n、以及相互比较的两样本所属总体平均数之差-等因素有关。在其它因素确定时,值越小,值越大;反之,值越大,值越小;样本含量及-越大、均数标准误越小,值越小。,下一张,主 页,退 出,上一张,由于 值的大小与值的大小有关,所以在选用检验的显著水平时应考虑到犯、型错误所产生后果严重性的大小,还应考虑到试验的难易及试验结果的重要程度。若一个试验耗费大,可靠性要求高,不允许反复,那么值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,值亦应取小些。对于一些试验条件不易控制,试验误差较大的试验,可将值放宽到 0.1,甚至放宽到0.25。,下一张,主 页,退 出,上一张,在提高显著水平,即减小值时,为了减小犯型错误的概率,可适当增大样本含量。因为增大样本含量可使()分布的方差2(1/n1+1/n2)变小,使图 4-2左右两曲线变得比较“高”、“瘦”,叠加部分减少,即 值变小。由于在具体 问题中 往往不是主观能够改变的客观存在,所以通过严密的试验设计、严格的试验操作和增大样本容量n来降低均数标准误,从而降低。,下一张,主 页,退 出,上一张,注意:,在上述显著性检验中,对应于无效假设 的备择假设为。它包含了 或 两种可能。因而有两个否定域,分别为于分布曲线的两尾。这个假设检验的目的在于判断与0有无差异,而不考虑谁大谁小。,下一张,主 页,退 出,上一张,1.4 双侧检验与单侧检验,双侧检验,这样,在水平上否定域有两个 和,对称地分配在u分布曲线的两侧尾部,每侧的概率为/2,如图4-3所示。这种利用两尾概率进行的检验叫 双侧检验(two-sided test),也叫双尾检验(two-tailed test),为双侧检验的临界u值。,下一张,主 页,退 出,上一张,但在有些情况下,双侧检验不一定符合实际情况。如酿醋厂的企业标准规定,曲种酿造醋的醋酸含量应保持在12以上(0),如果进行抽样检验,样本平均数,该批醋为合格产品,但如果 时,可能是一批不合格产品。对这样的问题,我们关心的是 所在总体平均数是否小于已知总体平均数数0(即产品是否不合格)。此时,无效假设应为(产品合格),备择假设则应为HA:(产品不合格)。这样,只有一个否定域,并且位于分布曲线的左尾,为左尾检验,如图4-3B所示,左侧的概率为。,下一张,主 页,退 出,上一张,单测检验,若无效假设H0为,备择假设 HA为 0,此时H0的否定域在 u分布曲线的右尾,右尾检验。在水平上否定域为,右侧的概率为。右尾检验如图4-3A所示。例如,国家规定酿造白酒中的甲醇含量不得超过0.1。在抽样检验中,若样本平均数小于0.1,产品合格,而当平均数0.1,产品为不合格。这样的问题,H0:,HA:0。,下一张,主 页,退 出,上一张,利用一尾概率进行的检验叫单侧检验(one-sided test),也叫单尾检验(one-tailed test)。此时u为单侧检验的临界u值。单侧检验的u=双侧检验的u2。,下一张,主 页,退 出,上一张,临界值u2或t2,2 样本平均数的假设检验,在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。即检验无效假设H0:0,备择假设HA:0或0(0)的问题。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。常用的检验方法有u检验和t检验。,下一张,主 页,退 出,上一张,2.1 单个样本平均数的假设检验,实质是样本所在总体平均数与已知总体平均数差异显著性检验。,2.1.1 单个样本平均数的u 检验,u 检验(u-test),就是在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。Excel中统计函数(Ztest)。由抽样分布理论可知,有两种情况的资料可以用u检验方法进行分析:样本资料服从正态分布 N(,2),并且总体方差2已知;总体方差虽然未知,但样本平均数来自于大样本(n30)。,下边举例说明检验过程:,【例4-1】某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(单位,g)。某日随机抽查10瓶罐头,得净重为:505,512,497,493,508,515,502,495,490,510。问装罐机当日工作是否正常?,由题意知,样本服从正态分布,总体方差2 64,符合u检验应用条件。由于当日装罐机的每罐平均净重可能高于或低于正常工作状态下的标准净重,故需作两尾检验。其方法如下:,(1)提出假设。无效假设H0:0 500 g,即当日装罐机每罐平均净重与正常工作状态下的标准净重一样。备择假设HA:0,即罐装机工作不正常。,(2)确定显著水平。0.05(两尾概率),(3)构造统计量,并计算样本统计量值。,均数标准误:,样本平均数:,统计量u值:,(4)统计推断。由显著水平0.05,查附表,得临界值u0.051.96。实际计算出的 表明,试验表面效应仅由误差引起的概率P0.05,故不能否定H0,所以,当日装罐机工作正常。,下一张,主 页,退 出,上一张,2.1.2 单个样本平均数的t 检验,t 检验(t-test)是利用t分布来进行统计量的概率计算的假设检验方法。它主要应用于总体方差未知时的小样本资料(n30)。,其中,为样本平均数,S为样本标准差,n为样本容量。,例4-2 用山楂加工果冻,传统工艺平均每100 g加工500g果冻,采用新工艺后,测定了16次,得知每100g山楂可出果冻平均为 520g,标准差S12g。问新工艺与老工艺在每100g加工果冻的量上有无显著差异?本例总体方差未知,又是小样本,采用双侧t检验。(1)提出无效假设与备择假设,即新老工艺没有差异。,新老工艺有差异。,下一张,主 页,退 出,上一张,(2)确定显著水平0.01(3)计算t值,=520g,S=12g,所以,(4)查临界t值,作出统计推断 由=15,查t值表(附表3)得t0.01(15)=2.947,因为|t|t0.01,P0.01,故应否定H0,接受HA,表明新老工艺的每100g加工出的果冻量差异极显著。(在统计量t上标记*),下一张,主 页,退 出,上一张,【例4-3】某名优绿茶含水量标准为不超过5.5。现有一批该绿茶,从中随机抽出8个样品测定其含水量,平均含水量 5.6,标准差S0.3。问该批绿茶的含水量是否超标?,符合t检验条件,为单尾检验。,(1)提出无效假设与备择假设 H0:5.5,HA:(2)计算 t 值,下一张,主 页,退 出,上一张,(3)查临界t值,作出统计推断 单侧=双侧=1.895,t=1.000 0.05,不能否定H0:=5.5,可以认为该批绿茶的含水量符合规定要求。,下一张,主 页,退 出,上一张,【例】按饲料配方规定,每1000kg某种饲料中维生素C不得少于246g,现从工厂的产品中随机抽测12个样品,测得维生素C含量如下:255、260、262、248、244、245、250、238、246、248、258、270g/1000kg,若样品的维生素C含量服从正态分布,问此产品是否符合规定要求?,下一张,主 页,退 出,上一张,按题意,此例应采用单侧检验。(1)提出无效假设与备择假设 H0:246,HA:246(2)计算 t 值 经计算得:=114.5,S=1.581,下一张,主 页,退 出,上一张,所以=2.281,3、查临界t值,作出统计推断 因为单侧=双侧=1.796,t=2.281 单侧t0.05(11),P 246,可以认为该批饲料维生素C含量符合规定要求。,下一张,主 页,退 出,上一张,在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。对于两样本平均数差异显著性检验,因试验设计或调查取样不同,一般可分为两种情况。,下一张,主 页,退 出,上一张,2.2 两个样本平均数的差异显著性检验,2.2.1 成组资料平均数的假设检验非配对设计两样本平均数的差异显著性检验 成组设计:当一个试验只有两个处理的时,可将试验单元完全随机地分成两组,然后对两组试验单元各自独立地随机施加一个处理。在这种设计中两组的试验单元相互独立,所得的两个样本相互独立,其含量不一定相等。这种试验设计为处理数k2的完全随机化设计。这样得到的试验资料为成组资料。成组设计数据资料的一般形式见表4-1。,下一张,主 页,退 出,上一张,表4-1 成组设计(非配对设计)资料的一般形式,下一张,主 页,退 出,上一张,成组资料的特点:两组数据相互独立,各组数据的个数可等,也可不等,1 u 检验,如果两个样本所在总体为正态分布,且总体方差 和 已知;或者总体方差未知,但两个样本都是大样本(n1,n230),可采用u检验来分析。由两均数差抽样分布理论可知,在上述条件下,两个样本平均数之差服从正态分布,即,参数关系:,N(0,1),那 么,在H0:12下,正态离差u值为,差数标准误为,根据4-2,4-3即可对两样本均数的差异做出检验,(4-2),(4-3),如果总体方差未知,但两个样本为大样本,可由样本方差S12、S22分别估计总体方差12、22,平均数差数的标准误可由下列公式估计:,其中,S12、S22分别是样本含量为n1、n2的两个样本方差。,例4-4 在食品厂的甲乙两条生产线上各测定了30个日产量如表所示,试检验两条生产线的平均日产量有无显著差异。,表4-2 甲乙两条生产线日产量记录,(1)建立假设。即两条生产线的平均日产量无差异。,(2)确定显著水平0.01,(3)计算,故:,(4)统计推断。由0.01查附表2,得u0.012.58 实际|u|3.28u0.012.58,故P0.01,应否定H0,接受HA。说明两个生产线的日平均 产量有极显著差异,甲生产线日平均产量高于乙生产线日平均产量。,当两个样本所在总体方差未知,又是小样本,但假定 时,有,下一张,主 页,退 出,上一张,2 t 检验,t(),(4-4),由4-4式可作两样本平均数差异的t检验。,当样本含量相等时(),自由度df2(n-1),例4-5 海关抽检出口罐头质量,发现有胀听现象,随机抽取了6个样品,同时随机抽取6个正常罐头样品测定其SO2含量,测定结果见表4-3。试分析两种罐头的SO2含量有无差异。,表4-3 正常罐头与异常罐头SO2含量测定结果,(1)提出无效假设与备择假设,两种罐头SO2含量没有差异;,(2)确定显著水平0.01(两尾概率),(3)计算,(4)统计推断 由df10,0.01查附表3得t0.01(10)3.169。实得|t|22.735t0.01(10)3.169,P 0.01,故应否定无效假设H0,即两种罐头的SO2含量有高度显著差异,该批罐头质量不合格。,【例4-6】现有两种茶多糖提取工艺,分别从两种工艺中各取1个随机样本来测定其粗提物中的茶多糖含量,结果见表4-4。问两种工艺的粗提物中茶多糖含量有无差异?,表4-4 两种工艺粗提物中茶多糖含量测定结果,(1)建立假设,提出无效假设与备择假设,,两种工艺的粗提物中茶多糖含量无差异;,(2)确定显著水平0.05(两尾概率),(3)计算,因两个样本的容量不等,所以,下一张,主 页,退 出,上一张,(4)查临界t值,作出统计推断 当df=9时,查临界值得:t 0.05(9)=2.262,|t|1.381 0.05,接受,表明两种工艺的粗提物中茶多糖含量无显著差异。,在成组设计两样本平均数的差异显著性检验中,若总的试验单位数()不变,则两样 本含量相等比两样本含量不等有较高检验效率,因为此时使 最小,从 而使t的绝对值最大。所以在进行成组设计时,两样本含量以相等为好。,下一张,主 页,退 出,上一张,下一张,主 页,退 出,上一张,强调:不论样本大小,当总体方差未知时,但方差相等,都可用t检验方法进行假设检验,前提条件是样本所在总体应服从正态分布。,3 近似t检验t检验,两样本所在总体方差未知,而且两个方差不等,此时只能作近似t检验。检验原理、过程同t检验,只是计算上有区别。,均数差数标准误:,t不再准确地服从自由度为 的t分布,而只是近似地服从t分布,此时,应采用近似t检验法。此法在作统计推断时,所用临界值不是由附表直接查得的,而须进行矫正。,(4-6),实例见例4-7,P82,非配对设计要求试验单元尽可能一致。如果试验单元变异较大,如试验动物的年龄、体重相差较大,若采用上述方法就有可能使处理效应受到系统 误差的影响而降低试验的准确性与精确性。为了消除试验单元不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与精确性,可以利用局部控制的原则,采用配对设计。,下一张,主 页,退 出,上一张,2.2.2 成对资料平均数的假设检验,配对设计两样本平均数的差异显著性检验,配对设计是指先根据配对的要求将试验单元两两配对,然后将配成对子的两个试验单元随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单元的初始条件尽量一致,不同对子间试验单元的初始条件允许有差异,每一个对子就是试验处理的一个重复。配对的方式有两种:自身配对与同源配对。,下一张,主 页,退 出,上一张,自身配对:指在同一试验单元进行处理前与处理后的对比,用其前后两次的观测值进行自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。如观测某种病畜治疗前后临床检查结果的变化;观测用两种不同方法对畜产品中毒物或药物残留量的测定结果变化等。同一食品在贮藏前后的变化。,下一张,主 页,退 出,上一张,同源配对:指将非处理条件相近的两个试验单元组成对子,然后对配对的两个试验单元随机地实施不同处理或同一食品对分成两部分来接受不同处理。配对试验加强了配对处理间的试验控制(非处理条件高度一致),使处理间可比性增强,试验误差降低,因而,试验精度较高。成对资料与成组资料相比,成对资料中的两个处理间的数据不是相互独立的,而是存在某种联系。配对设计试验资料的一般形式见表4-5。,下一张,主 页,退 出,上一张,表4-5 配对设计试验资料的一般形式,下一张,主 页,退 出,上一张,两个处理的观测值一一配对,即(X11,X21),(X12,X22),(X13,X23),(X1n,X2n)。,那么,每对观测值之间的差数为diX1iX2i(i1,2,3,n),差数d1,d2,d3,dn组成容量为n的差数样本,差数样本的平均数为,(i=1,2,3,n),差数均数标准误,(4-7),下一张,主 页,退 出,上一张,(4-8),根据(4-7)式和(4-8)式即可对成对资料平均数的差异性进行检验,【例4-8】为研究电渗处理对草莓果实中的钙离子含量的影响,选用10个草莓品种进行电渗处理与 对照处理对比试验,结果见表4-5。问电渗处理对草莓钙离子含量是否有影响?,本例因每个品种实施了一对处理,试验资料为成对资料。,表4-5 电渗处理对草莓钙离子含量的影响,,即电渗处理后草莓钙离子含量与对照钙离子含量无差异,也就是说电渗处理对草莓钙离子含量无影响。,下一张,主 页,退 出,上一张,(1)建立假设,(2)确定显著水平0.01,(3)计算,将计算所得t值的绝对值与临界值比较,,(4)查临界t值,作出统计推断,根据df=n-19,查临界t值:t0.01(9)3.250,因为|t|8.358 t0.01(9),P0.01,否定 H0,接受HA,表明电渗处理后草莓钙离子含量与对照钙离子含量差异极显著,即电渗处理极显著提高了草莓钙离子含量。,【例】用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见表。设体温服从正态分布,问注射前后体温有无显著差异?(自身配对),下一张,主 页,退 出,上一张,表 10只家兔注射前后的体温,(1)提出无效假设与备择假设,即假定注射前后体温无差异,即假定注射前后体温有差异(2)计算t值 经过计算得 故 且=10-1=9,下一张,主 页,退 出,上一张,(3)查临界t值,作出统计推断 由df=9,查t值表得:t0.01(9)=3.250,因为|t|t0.01(9),P0.01,否定,接受,表明家兔注射该批注射液前后体温差异极显著,这里表现为注射该批注射液可使体温极显著升高。【例】现从 8 窝 仔猪中每窝选出性别相同、体重接近的仔猪两头进行饲料对比试验,将每窝 两头仔猪随机分配到两个饲料组中,时间30天,试验结果见表。问两种饲料喂饲仔猪增重有无显著差异?(同源配对),下一张,主 页,退 出,上一张,一般说来,相对于成组设计,配对设计能够提高试验的精确性。配对内的误差是相同的且是随机的;配对间的误差不同,但它们是独立的,可分离出来,为系统误差。在进行两样本平均数差异显著性检验时,亦有双侧与单侧检验之分。关于单侧检验,只要注意问题的性质、备择假设HA的建立和临界值的查取就行了,具体计算与双侧检验相同。,下一张,主 页,退 出,上一张,成对检验的优点,(1)由于加强了试验控制,成对观测值的可比性提高,因而随机误差将减小,可以发现较小的真实差异。(2)成对比较不受两个样本总体方差1222 的干扰,不需考虑两者是否相等。,3 二项百分率的假设检验,在食品科研中,有许多试验结果以百分率表示,例如产品合格率、食品贮藏变质率、一级出品率等等。这些百分数资料是服从二项分布的,故称为二项百分率。它们与一般百分数不同(如食品中各种营养成分的含量)。对二项百分率的检验,从理论上讲,应按二项分布进行。这样的检验方法虽然比较准确,但计算较麻烦,所以常用正态近似法来代替。,下一张,主 页,退 出,上一张,当样本含量 n较大,p不是很小,且np和nq均大于5时,二项分布接近于正态分布。所以,对于服从二项分布的百分率资料,当n足够大时,可以近似地用u检验法,进行差异显著性检验。适用于正态近似法的二项样本条件见表4-6。,下一张,主 页,退 出,上一张,表4-6 适用于正态近似法的二项样本条件,下一张,主 页,退 出,上一张,需要检验一个服从二项分布的样本百分率与已知的二项总体百分率差异是否显著,其目的在于检验一个样本百分率 所在 二项总体百分率p是否与已知二项总体百分率 p0相同。,下一张,主 页,退 出,上一张,3.1 单个样本百分率的假设检验,一个样本百分率与已知总体百分率的差异显著性检验,由第3章可知,二项百分率的总体均值,方差,标准差分别为:,在n30,np、nq 5 时,,标准化后有,在 下,u 统计量,百分率标准误,利用这样两个公式即可进行单个样本百分率检验。,(4-9),(4-10),【例4-9】某微生物制品的企业标准规定有害微生物不准超过1(p0),现从一批产品中抽取500件(n),发现有害微生物超标的产品有7件(x)。问该批产品是否合格?本例关心的是产品有害微生物是否超标,属于一尾检验。(1)提出假设,下一张,主 页,退 出,上一张,即该批产品合格;,由一尾概率0.05查附表,得一尾临界值u0.051.64,实际计算,p0.05,表明该批产品达到了企业标准,为合格产品。,(2)计算,所以,(3)作出统计推断,检验服从二项分布的两个样本百分率差异是否显著。其 目的 在 于 检 验 两个样本百分率、所在的两个二项总体百分率P1、P2是否相同。当两样本的np、nq均大于5时,可以近似地采用 u 检 验 法进行检验。两样本百分率之差近似服从正态分布。,下一张,主 页,退 出,上一张,3.2 两个样本百分率的差异显著性检验,所以,在 下,则,(4-13),可借助正态分布作两样本百分率的差异检验。,样本百分率的差数标准误为:,在 下,由于总体百分率p未知,只能由样本百分率来估计。这里用两个样本百分率的加权平均数 来估计共同的总体百分率p:,由样本获得的两样本百分率的差数标准误为:,【例4-10】葡萄贮藏试验。装入塑料袋不放保鲜片的葡萄385粒(n1),一个月后发现有25粒(x1)葡萄腐烂;装入塑料袋放保鲜片的葡萄598粒(n2),一个月后发现有20粒(x2)葡萄腐烂。问加保鲜片与不加保鲜片的两种葡萄的腐烂率是否有显著差异?,(1)提出假设,两种贮藏葡萄的腐烂率没有差异,即保鲜效果一致。,(2)计算,由0.05和0.01查附表得,临界值u0.05=1.96,u0.01=2.58。由于实际计算1.96 2.58,所以0.05 p0.01,应否定H0,接受HA,表明两种贮藏葡萄的腐烂率有显著差异,加保鲜片贮藏葡萄有利于葡萄保鲜。,下一张,主 页,退 出,上一张,(3)作出统计推断,3.3 二项样本百分率假设检验时的连续性矫正,样本容量n25,且np5时,假设检验需连续矫正。在np和(或)nq 小 于 或 等 于30时,需作连续性矫正。,附 样本方差的假设检验,(1)单个样本方差的检验,测验一个样本方差S2和某一指定方差C是否有显著差异。当样本容量n30时,S2服从2 分布,用2 检验;当n30时,因 服从u分布,可用u检验。注意附表的2值是右尾概率的临界2值,记作2,直接适用于测验H0:2 C;如果测验2 C,则显著所需的2值是21-;如测验H0:2 C,则显著所需的2值是 2/2,例1:已知蔗糖自动打包机的核定方差为C2,若该日抽取10包进行检测,其S22.5,问该打包机的变异程度是否与核定标准有显著差异?,例2:某厂生产的保健饮料中的游离氨基酸含量(mg/100ml)在正常情况下服从正态分布N(200,252)。某生产日抽测了6个样品。得数据为205,170,185,210,230,190。试问这一天生产的产品游离氨基酸含量的总体方差是否正常?,H0:2C2,蔗糖打包机变异度与核定标准没有差异;HA:2C,建立假设,测验计算,两尾检验,df9,查临界值2 1-/2 2 0.9752

    注意事项

    本文(第四统计假设检验与参数估计.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开