欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    分类变量资料的统计分析.ppt

    • 资源ID:4960031       资源大小:466.50KB        全文页数:71页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    分类变量资料的统计分析.ppt

    卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,1,分类变量资料的统计分析,第十章,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,2,主要内容,分类变量资料的统计描述,分类变量资料的统计推断,卡方检验,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,3,什么是分类变量资料?用什么指标进行描述?,甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿50人,何地较为严重?若甲地易感儿童667人,而乙地易感儿童250人。,甲地麻疹发病率为 100/667100%=15%乙地麻疹发病率为 50/250100%=20%,第一节 分类变量资料的统计描述,用相对数能较好地反映分类变量资料的特征。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,4,第一节 分类变量资料的统计描述,常用相对数应用相对数时的注意事项率的标准化法,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,5,相对数,相对数:是两个有关联的数值或指标之比。常用的相对数有:率构成比相对比,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,6,率(rate),率:是指在一定观察时间内,某现象实际发生数与可能发生该现象的总数之比,用以说明某现象发生的频率或强度。,K为比例基数,如100%、1000等。比例基数的选择主要依习惯而定或使计算结果能保留12位整数。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,7,构成比(constituent ratio),构成比:是指事物内部某一部分的观察单位数与事物内部各组成部分的观察单位数总和之比,用以说明事物内部各部分所占的比重或分布。,常用百分数表示,故又称百分比。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,8,各部分构成比之和为100%。此消彼长。,构成比的两个特点:,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,9,例10-1 2001年对某地中小学学生进行HbsAg检查,结果见表10-1,试计算各级学生HbsAg检出率及阳性者构成比,率和构成比不是同一指标,在应用时应注意加以区分。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,10,相对比,相对比:指两个有关指标之比,说明两个指标的比例关系。,两个指标可以是绝对数、相对数、平均数,可以是性质相同或性质不同,但两个指标互不包含。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,11,例10-2 某地2003-2005年不同性别新生儿数见表10-2,试计算该地不同年份新生儿性别比。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,12,应用相对数的注意事项,计算相对数时分母不宜过小 正确区分构成比和率,不能以构成比代替率 正确计算平均率对率和构成比进行比较时,应注意资料的可比性 率的标准化 样本率或构成比进行比较时要作假设检验,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,13,率的标准化,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,14,在进行两个内部构成不同的总率比较时,采用统一的标准进行校正,然后计算校正后的标准化率,再进行比较的方法称为率的标准化法。,率的标准化法,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,15,计算标准化率时,首先要选定一个比较的“标准”。如,对年龄构成进行标化时,可选用全国、全省等大范围人口构成资料作标准,也可将比较组的合并人口或以其中任一组的人口构成作标准。原则上,选定的标准人口应有代表性、较稳定,容易获得,便于比较。根据获得的资料和选定的标准不同,标准化法可分为直接法和间接法。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,16,直接法,适用情况:已知被标化组各年龄组的实际率Pi,用标准人口数或标准人口构成进行计算。,其中 为第i 组标准人口数,为标准组总人数,为第i 组的实际率,为第组标准人口构成。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,17,甲社区标准化后的患病率,乙社区标准化后的患病率,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,18,如根据选定的标准人口构成做标准,,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,19,间接法,适用情况:已知被标化组的死亡总数及年龄别人口数,但不知道各年龄组的实际死亡率。,标准化死亡比,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,20,标准化死亡比:被标化组实际死亡数与预期死亡数之比,称为标准化死亡比(standard mortality ratio),简称为SMR。若SMR1,表示被标化人群的死亡率高于标准组;反之,若SMR1,表示被标化人群的死亡率低于标准组。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,21,例10-4 某地观察了吸烟者与不吸烟者各年龄组人数如表10-6,同时观察期内吸烟者中有432人死于肺癌,不吸烟者中有210人死于肺癌,试计算吸烟者与不吸烟者的标准化死亡率。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,22,吸烟者的肺癌标准化死亡比,非吸烟者的肺癌标准化死亡比,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,23,吸烟者的肺癌标准化死亡率,非吸烟者的肺癌标准化死亡率,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,24,率的标准化应注意的问题,(1)当各比较组内部构成(如年龄、性别等)不同时,应对率进行标准化后,再作比较。(2)标准化率只表明各标化组率的相对水平,而不代表其实际水平。(3)两总率各分组对应的率有明显交叉时,则不能用标准化率进行比较。(4)如为抽样研究资料,两样本标准化率的比较也应作假设检验。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,25,第二节 分类变量资料的统计推断,率的抽样分布率的抽样误差与标准误总体率的区间估计率比较的u检验,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,26,率的抽样分布,从某个二项分类总体中随机抽取含量一定的样本,其样本率的分布概率是有规律的,这种规律为服从二项分布(binomial distribution),即样本中阳性数或样本阳性率的分布概率等于二项式展开后各项。若总体阳性率为、样本含量为n,阳性数为X,则样本中出现X个阳性事件的概率可由下式求得。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,27,已知:=0.5,n=10;=0.3,n=5;=0.3,n=10;=0.3,n=15。试根据式(10-6)求各阳性数事件的概率并作概率分布图。,图10-1 率的抽样分布图,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,28,率的抽样分布特征,1.为离散型分布;2.当=1-时,呈对称分布;3.当n增大时,逐渐逼近正态分布。一般认为,当n和n(1-)5时,可近似看作正态分布。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,29,率的抽样误差和标准误,由于抽样所引起的样本率和总体率或各样本率之间存在着差异,这种差异称为率的抽样误差。用率的标准误表示。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,30,例10-6 为了解某地人群结核菌素试验阳性率情况,某医疗机构在该地人群中随机检测了1773人,结核菌素试验阳性有682人,阳性率为38.47%,试计算其标准误。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,31,总体率的区间估计,总体率的估计:点估计区间估计正态近似法查表法,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,32,正态近似法,当样本含量n足够大,样本率p或1-p均不太小时(如np和n(1-p)均大于5),样本率的分布近似正态分布。,u是标准正态分布双侧临界值,在估计总体率的95%置信区间时,其值为1.96;99%置信区间时,其值为2.58。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,33,95%的置信区间:38.47%1.961.16%=36.20%40.74%99%的置信区间:38.47%2.581.16%=35.48%41.46%,例10-6中该地人群中结核菌素试验阳性率95%和99%的置信区间为:,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,34,查表法,当n较小,如n50,特别是p接近于0或1时,按二项分布原理估计总体率的可信区间。因其计算比较复杂,统计学家已经编制了总体率可信区间估计用表,可根据样本含量n和阳性数x查阅统计学专著中的附表。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,35,u 检验,当样本含量n足够大,样本率p或1-p均不太小时(如np和n(1-p)均大于5),样本率的分布近似正态分布。样本率和总体率之间、两个样本率之间的比较可用u检验(u test)。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,36,样本率与总体率的比较,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,37,例10-7 一般情况下,直肠癌围术期并发症发生率为30%,现某医院手术治疗了385例直肠癌患者,围术期出现并发症有100例,并发症发生率为26%,问该院直肠癌患者围术期并发症发生率与一般情况比较有无统计学差异。,本例,样本率为26%,np和n(1-p)均大于5,可采用u检验。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,38,建立检验假设 H0:=0,H1:0,=0.05,2.计算u值,3.确定P值,判断结果,本题u=1.7131.96,P0.05,按=0.05的水准不拒绝H0,差异没有统计学意义,故尚不能认为该院直肠癌患者围术期并发症发生率与一般情况不同。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,39,两个样本率的比较,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,40,例10-8 为了解某地小学生蛔虫感染率的城乡差异,抽样调查了该地小学生22792人,其中城镇小学生8207人,粪检蛔虫卵阳性数为701人,蛔虫感染率为8.54%,乡村小学生14585人,粪检蛔虫卵阳性数为2167人,蛔虫感染率为14.86%,试比较该地小学生蛔虫感染率城乡差异有无统计学意义。,建立检验假设 H0:1=2,H1:12,=0.05,2.计算u值,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,41,确定P值和判断结果 本题=13.7392.58,P0.01,按=0.05的水准拒绝H0,接受H1,差异有统计学意义。,3.确定P值,判断结果,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,42,第三节 2检验,基本思想四格表资料的卡方检验配对设计分类变量资料的卡方检验行列表资料的卡方检验,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,43,2检验(Chi-square test),是现代统计学的创始人之一,英国统计学家K.Pearson于1900年提出的一种具有广泛用途的假设检验方法。常用于分类变量资料的统计推断。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,44,基本思想,例10-9 某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治疗71例,有效52例,乙药治疗42例,有效39例,结果见表10-7。问两种药物的有效率是否有差别?,表10-7 甲、乙两种药物治疗动脉硬化的疗效比较,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,45,卡方检验的基本公式:,A:实际频数T:理论频数,由上式可以看出,x2值反映的是在检验假设H0前提下实际频数与理论频数的吻合程度。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,46,2检验的自由度,指可以自由取值的基本格子数 自由度一定时,其2值的概率分布也就确定。根据自由度和检验水准查表10-13 可得2界值,若2值20.05(),则可按=0.05的检验水准拒绝H0;若2值20.05(),则还不能拒绝H0。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,47,四格表资料的卡方检验,四格表资料,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,48,H0:两药有效率相同,即12H1:两药有效率不同,即1 2=0.05,(1)建立检验假设,确定检验水准,例10-9 甲、乙两种药物治疗动脉硬化的疗效比较,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,49,20.025(1)=5.02,20.01(1)=6.63。本例5.022=6.486.63,所以,0.025P 0.01,按=0.05水准,拒绝H0,接受H1,故认为甲、乙两药的疗效不同,乙药疗效要好于甲药。,(2)计算检验统计量和自由度,(3)确定P值,做出推论,n40,Tmin5,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,50,四格表专用公式:,本例,,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,51,校正公式:,四格表资料2检验的校正 分布是一种连续性分布,而分类变量资料属离散性分布,由此得到的 统计量也是不连续的。为改善2统计量分布的连续性,英国统计学家Yates F建议将实际频数和理论频数之差的绝对值减去0.5以作校正。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,52,例10-10 某医生研究比较A、B两种药物对急性细菌性肺炎的疗效,有关资料见表10-8,问两种药物的疗效差别有无统计学意义?,表10-8 A、B两药治疗急性细菌性肺炎的疗效比较,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,53,H0:1=2H1:12=0.05 T22=228/64=2.75 5 按=1,查2值表,20.05(1)=3.84,2=4.793.84,P0.05,按=0.05水准,拒绝H0,接受H1,认为两药的疗效差别有统计学意义,A药疗效要好于B药。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,54,在实际工作中,对于四格表资料,通常规定,(1)T5,且N40时,直接计算值,不用校正;(2)1T5,且N40时,用连续性校正检验;(3)T1或N40,不能用卡方检验,用直接计算概率的方法。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,55,配对设计分类变量资料的2检验,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,56,配对卡方检验又称McNemar检验:,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,57,例10-11 用两种血清学方法对100例肝癌患者进行检测,有关检测结果见表10-9,问两种血清学方法检测结果有无差别?,表10-9 两种血清学方法对肝癌检测的结果比较,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,58,H0:两种方法检出率相同,即B=CH1:两种方法检出率不同,即B C=0.05,查表得,P0.025,按=0.05水准,拒绝H0,接受H1,差别有统计学意义,可以认为两种方法的检出率不同,甲法较高。,(1),(2),(3),卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,59,注意事项,由于该检验只考虑了不一致的情况(b与c),而未考虑样本含量n及一致结果(a与d),因此,当n很大而且两法一致率较高(即a与d数值较大),b与c的数值相对较小时,即使检验结果有统计学意义,但实际意义并不大。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,60,行列表资料的卡方检验,行列表卡方检验的通式:,=(R-1)(C-1),卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,61,例10-12 某研究者欲比较甲、乙、丙3家医院住院病人院内感染情况,随机抽查同一时期各医院住院病人院内感染情况结果见表10-10,试比较三家医院院内感染率有无差别。,表10-10 甲、乙、丙三家医院住院病人院内感染率比较,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,62,H0:三家医院院内感染率相同H1:三家医院院内感染率不同或不全相同=0.05,(1),(2),(3),=(3-1)(2-1)=2,查2值表,20.01(2)=9.21,220.01(2),P0.01,按=0.05的检验水准,拒绝H0,接受H1,故可认为甲、乙、丙三家医院院内感染率总的来讲有差别。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,63,例10-13 某研究者欲了解白内障发病是否与ABO血型有关,收集有关资料见表10-11,问白内障组与对照组ABO血型分布有无差别?,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,64,H0:白内障组与对照组ABO血型分布相同H1:白内障组与对照组ABO血型分布不同或不全相同=0.05,查表得,20.05(3)=7.81,20.05,按=0.05的检验水准,不拒绝检验假设,尚不能认为白内障组与对照组ABO血型分布不同。,(1),(2),(3),=(2-1)(4-1)=3,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,65,理论数不宜太小。(不能有1/5以上格子的理论频数小于5或者有一个格子的理论频数小于1)。处理方法如假设检验的结果是拒绝无效假设,只能认为各总体率或构成比之间总的来说有差别。若要进一步了解哪两者之间有差别,可用卡方分割法,或者调整检验水准。对于单向有序行列表,在比较各处理组的效应有无差别时,应该用秩和检验。,行列表卡方检验的注意事项:,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,66,如:用某药治疗某病患者,5例中有3例治愈,计算治愈率为3/5100%=60.0%,如果有4例治愈,则其治愈率为80%。显然,这个结果是不稳定的。在分母例数很少的情况下,个别的偶然因素会导致结果的变化,只有分母例数较大时,计算的相对数才比较稳定。在例数较少时,通常直接用绝对数表示。如果要用相对数表示,则需列出其总体率的置信区间。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,67,某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,得以下资料,据此得出结论:“母亲年龄在2429岁时,畸形儿最多,占总数的92.2%,表明该年龄段易发生畸形儿,符合一般规律”。试分析该结论是否合理?,某地畸形儿与母亲分娩年龄的关系,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,68,表10-1 2001年某地中小学学生HBsAg检出率及构成比,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,69,在进行率或构成比比较时,除了要比较的因素外,其他影响的因素应基本一致。例如,分析比较两医院病死率的时,应注意两个医院的条件应基本相同,如果上级医院的病死率高于基层医院的病死率,并不能说明上级医院医疗水平不如基层医院,这是因为许多疑难病人均由基层医院转入上级医院所致。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,70,当比较两个总率时,若其内部构成不同,需要进行率的标准化。,卫生学(第7版)第十章 分类变量资料的统计分析7版)第十章 分类变量资料的统计分析,71,理论频数太小的3种处理方法,增大样本含量,以达到增大理论频数的目的;删去理论频数太小的格子对应的行或列;合理合并:结合专业,将理论频数太小的行或列与性质相近的行或列合并。,(黄陈平 施红英),

    注意事项

    本文(分类变量资料的统计分析.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开