580_3948826_混杂效应和随机效应模型.ppt.ppt
《580_3948826_混杂效应和随机效应模型.ppt.ppt》由会员分享,可在线阅读,更多相关《580_3948826_混杂效应和随机效应模型.ppt.ppt(37页珍藏版)》请在三一办公上搜索。
1、随机效应概念与混合效应模型(Concept of Random Effects and Mixed Effects Models),1,2,介绍内容一.统计模型的概念二.随机效应的概念与识别三.混合效应模型四.混合效应模型分析的例子,一.统计模型的概念,统计模型是对资料结构的一种数学表述.数量关系的概念化结构.包含两个元素1.函数表达式:描述结果变量与解释变量之间的关系(固定效应).2.误差表达式:描述结果变量观察值随机变异的概率分布(随机变异).例如:2种药物(A、B)治疗某种疾病的疗效分析。用均衡设计,每种药物治疗的病人数相等,都为n.反应变量:Yij表示生化测定值,i=1,为病例编号,J
2、=1,2为药物编号 自变量:药物种类(A,B),令Xj=第j种药物,传统的统计分析方法(固定效应模型,效应为常数)为:(1)用单向方差分析模型表示为:Yij=j+eij=+j+eij,eij N(0,e2),Yij N(i,e2),j=j-,H0:j=0,限制条件:j=0(2)用线形回归模型表示为:Yij=0+iXij+eij,,Yij N(0+iXij,e2),H0:i=0,限制条件:B=0 含随机效应的混合效应模型为:Yij=(0+i)+iXij+eij,,i N(0,2),eij N(0,e2)这时 Yij N(0+iXij,i2+e2),Var(Yij)=Var(i)+Var(eij)
3、=i+e2,,3,4,例1:A.B两种治疗药物在同一病人体内实验,采用区组随机化设计方案(即用药先后顺序是随机化的),对每种药物处理后的反应变量进行测定.用6例病人.结果如下表.,构造三种模型:完全随机设计模型:不考虑区组(病人)效应:Yij=+j+eij,j 为药物效应随机化区组设计模型:考虑区组(病人)效应:Yij=+j+i+eij 随机效应模型:病人是从病人总体中随机的,也存在随机误差,统计学中用病人间的方差来衡量这种随机误差.。Yij=+j+(i)+eij=(+j+(j+eij),jN(0,2),eij N(0,e2),Var(Yij)=(2+e2)在此简单情况下,(3)与(2)等价,
4、但解释不同。在有缺失值情况下的结果不同。,5,模型一:完全随机设计模型:J:第J种药物效应,从上表估计模型参数:=20.75,A=22.83-20.75=2.08,B=18.67-20.75=-2.08 差值(difference)=22.83-18.67=4.17(或 A B=2.08-(-2.08),6,完全随机设计模型的PROC ANOVA 计算结果:,Sum ofSource DF Squares Mean Square F Value Pr FModel 1 52.0833333 52.0833333 2.68 0.1325Error 10 194.1666667 19.416666
5、7Corrected Total 11 246.250000,Means with the same letter are not significantly different.SNK Grouping Mean N drug A 22.833 6 A A A 18.667 6 B,PROC ANOVA DATA=example_1;CLASS drug;MODEL y=drug;MEANS drug/SNK ALPHA=0.05;run;,7,7,完全随机设计模型的 PROC GLM 计算结果:,Sum ofSource DF Squares Mean Square F Value Pr
6、FModel 1 52.0833333 52.0833333 2.68 0.1325Error 10 194.1666667 19.4166667 Corrected Total 11 246.2500000,StandardParameter Estimate Error t Value Pr|t|Intercept 18.66666667 B 1.79891943 10.38.0001()drug A 4.16666667 B 2.54405625 1.64 0.1325(A=4.17)drug B 0.00000000 B.(B=0.00),PROC GLM DATA=example _
7、1;/*Model 1:completely randomized design model*/CLASS drug;MODEL y=drug/SOLUTION;RUN;,8,模型二:随机区组设计模型(考虑病人效应i):yij=+j+i+eij eijN(0,2),PROC GLM DATA=example_1;/*model 2:Randomized block design model*/CLASS drug patient;MODEL y=drug patient;RUN;,Sum ofSource DF Squares Mean Square F Value Pr FModel 6 2
8、06.8333333 34.4722222 4.37 0.0634Error 5 39.4166667 7.8833333 Corrected Total 11 246.2500000 Source DF Type III SS Mean Square F Value Pr Fdrug 1 52.0833333 52.0833333 6.61 0.0500patient 5 154.7500000 30.9500000 3.93 0.0798,(与模型一比较,残差均方(Mean Square(Error,2)由19.4166667降到7.88),9,模型三:病人为随机效应的模型:,因此,对同一
9、病人的不同观察之间是相关的,具有协方差 2,包含在总方差Var(yij)=e2+2内,2和e2 都称为方差分量.但特别指2。,10,PROC MIXED DATA=example_1;/*Model 3:Random effects model by using PROC MIXED*/CLASS drug patient;MODEL y=drug;RANDOM patient/S;RUN;,用SAS中的 PROC MIXED 计算结果:,Cov Parm Estimatepatient 11.5333(用PROC GLM的RANDOM语句得不到此方差分量)Residual 7.8833(组内
10、相关系数ICC=11.53/(11.53+7.88)=0.59)Type 3 Tests of Fixed Effects Num DenEffect DF DF F Value Pr Fdrug 1 5 6.61 0.0500,在本例中,对drug 的检验,用PROC MIXED的计算结果与用PROC GLM(2)的计算结果同(F=6.61),即规定病人是固定效应,还是随机效应,对处理效应的检验结果没有影响(这是由于方差的性质决定的,即观察值的方差与中心化值的方差相等).但如果有缺失值时,其结果不同.,在本例的模型三中,假定病人具有随机效应.病人来自一个具有均值为0,方差为2的正态分布总体.
11、因此它们的期望值为0,但每个病人彼此不同。每个病人都具有相同期望值的假定与直观不符.须根据每例病人的观察值,确定其在正态分布中的一个位点.这一预报值的可信区间较固定效应的可信区间要窄,在统计学上称为收缩”shrunken”估计.,11,在本例的模型三中,假定病人具有随机效应.即规定病人来自一个具有均值为0,方差为2的正态分布总体.因此它们的期望值为0。但每个病人彼此不同。每个病人都具有同一期望值的假定与直观不符.须根据每例病人的观察值,确定其在正态分布中的一个位点.这一预报值的可信区间较固定效应的可信区间要窄,在统计学上称为收缩”shrunken”估计.这一收缩的幅度与病人方差分量和残差方差分
12、量有关。当病人方差分量为0时,所有病人的预报值相等。对每个病人的观察值越少时,收缩的幅度相对越大。,随机效应模型的反应变量估计或预报,从上表可见,随机效应模型的预报值更接近观察值。,随机效应:在一项研究中,如果进入研究的因子的水平数只是其总体中的所有水平数的一个随机代表时,该因子的效应为随机效应。对应于该因子的总体中各水平的效应就构成了一个概率分布总体。样本中的各水平是来自总体中更多水平的一个随机样本.如:一个城市有很多学校,为了解学生体质,抽查了部分学校的学生体质,则所抽查的学校就是一个随机效应因子.一个城市有很多医院,为了解医疗质量,抽查了若干医院的出院病人记录进行医疗质量分析。则所抽查的
13、医院就是一个随机效应因子.一条大河有许多支流的入口,为评价河水的亚硝酸盐浓度,只能抽查一小部分支流入口处的水样作检验,所抽查的支流入口处的水样就是一个随机效应因子.一个县市有很多村镇,为了解村民健康状况,随机抽查了若干村镇的村民,记录了他们的健康状况。则所抽查的这些村镇就是一个随机效应因子.研究随机效应的目的:1.估计随机效应的协方差参数。2.对总体参数作假设检验3.构造总体参数的可信区间。,12,二.随机效应的概念与识别,13,固定效应与随机效应的识别方法:当一个因子(预测变量)对反应变量的效应不易区别是固定效应还是随机效应时,可用可互换性或唯一性规则来作判断.可互换性(exchangeab
14、ility)判别。一个随机效应因子的水平是随机地或非系统地选自具有更多水平的总体.观察样本中的水平只是总体中包含的更多水平中的一个随机样本.一个随机效应因子的水平是随机的,在不改变实验的基本性质情况下,当重 复实验时,其水平可能发生改变.固定效应因子:特意选择水平的因子.在不改 变实验基本性质的情况下,当重复实验时,其水平不发生改变.(2)从模型理论上区别:如果一个效应水平能够合理地假定为代表一种概率分布的话,则该效应就是 随机效应;如果不代表一种概率分布的话,则该效应就是固定效应.药物疗效试验中的药物品种是特选的,是不能互换的,故为固定效应。而在 药品价格调查中,每类药品选一种作为代表,这时
15、调查的药品名称是可互换的,故为随机效应。世界上没有固定效应因子和随机效应因子之分,而是研究者在设计一个实验 时强加的一种不同结构的模型.以便更好地解释客观存在。,13,14,三、混合效应模型(Mixed effects Models),混合效应模型是一种线性模型,包含有固定效应和随机效应,用于处理非独立观察资料。又称:重复测量模型(Repeated measures models),多水平模型(Multilevel models),层次结构模型(Hierarchical models)从统计学归类,混合效应模型包含三种类型的模型:1.随机效应模型(Random effects models)。
16、假定除测量误差导致的变异外,还来自具有某种概率分布的随机效应带来的变异,称随机变异。如分析临床多中心试验中的不同中心之间的变异。2.协方差类型模型(Covariance pattern models),直接对重复测量之间的相关结构进行分析,分析效应随时间衰减的特点。3.随机系数模型(Random coefficient models),直接分析反应变量在时间轴上的变化率,但容许协变量的效应具有随机性,协变量对反应变量效应的变化率随观察对象而不同,即具有随机变化的特点。以上三种类型的模型可以联合应用。,15,混合效应模型的方差协方差结构,其中:Y,为反应变量向量,X为固定效应因子的设计矩阵,为固
17、定效应参数向量Z为随机效应因子的设计矩阵,为随机效应参数向量,i N(0,2),e为残差向量.eijN(0,e2),cov(i,e)=0,混合效应模型的参数估计:,16,16,例子:两种药物治疗效果的随机区组设计模型的矩阵表达,其中:Yij,为反应变量,j=1,2代表药物号;,2,。,6代表病例号X为(12行,3列)固定效应因子的设计矩阵,=(,1,2),为(3行1列)固定效应参数向量Z为(12x6)的随机效应因子的设计矩阵,i为(6x1)维随机效应参数向量e为(12x!)维残差向量.,Treatment:为固定效应,离散化为X矩阵Patient:为随机效应,离散化为Z矩阵,/*-Model
18、3_2:PROC MIXED-*/PROC MIXED DATA=intro;CLASS drug patient;MODEL y=drug;RANDOM patient;RUN;,17,=(,j,2),=(1,2,3,4,5,6),i(0,2),Var(yij)=(2+e2),18,例2:一项治疗高血压的多中心临床药物试验:三种药物(A,B,C),共有29所医疗中心参与,观察病人总数n=288人.(filename of dataset=hypertension)研究目的:在控制治疗前舒张压条件下,分析三种药物的降压效果.,四.混合效应模型分析的例子,19,变量名:记录号:patient,n
19、=288,反应变量:dbp:治疗后舒张期血压,处理因素:treat:三种药物:A=Carvedilol,B=Nifedipine,C=Atenolol;控制因素:1.医疗中心:centre,29 所医院.2.治疗前舒张期血压:dbp1,连续变量.,Obs patient centre treat dbp dbp1 1 1 29 C 86 97 2 2 29 C 72 109 3 3 5 B 109 117 4 4 5 A 87 100 5 5 29 A 85 105 6 7 3 A 100 114 7 8 3 B 80 105 8 9 3 B 90 100 9 10 3 A 100 102 1
20、0 11 3 C 94 105,Variable N Mean Minimum Maximum-dbp 288 90.2465278 70.0000000 140.0000000dbp1 288 102.8541667 92.0000000 120.0000000,数据集中的前10例病人的记录,20,模型A:简单药物效应treatk:k=A,B,C.(固定效应),PROC MIXED DATA=hypertension;/*MODEL A*/CLASS centre treat;MODEL dbp=treat/SOLUTION;RUN;,Covariance Parameter Estimat
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 580 _3948826_ 混杂 效应 随机 模型 ppt
链接地址:https://www.31ppt.com/p-2238008.html