《人类疾病网络》PPT课件.ppt
《《人类疾病网络》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《人类疾病网络》PPT课件.ppt(72页珍藏版)》请在三一办公上搜索。
1、人类疾病网络,张媛媛,1,*,背景在刻画人类疾病位点的研究中,很多疾病基因的位置克隆和全基因组的关联研究,产生了疾病与基因的关联对列表。另外,蛋白质相互作用,人类代谢图谱和调控网络等都为不同疾病基因间的相互作用提供了一些细节描述。,2,*,给出一个不同的方法,在细胞和有机体的组织的高水平上,探索人类遗传疾病和对应的疾病基因是否可以彼此相关联。通过提供有多个基因引起的疾病(基因座异质性)的例子来支持这个方法的有效性。比方说,脑肝肾综合症是由至少11个基因的变异引起的,所有的都与过氧化酶体的生物发生有关。还有由一个基因的不同变异(等位基因异质性)的疾病。比方说,TP53的变异被关联到11个临床上不
2、同的癌症相关疾病。通过发展一个全部遗传疾病(疾病表型组)和全部疾病基因(疾病基因组)的关联框架,得到对疾病组学的全局认识。,3,*,结果和讨论,疾病组的构建:构建两个不相交顶点集的二部图。一个集合对应所有的已知遗传疾病,另一个集合对应人类基因组的所有已知的疾病基因。如果一个基因的变异暗示了某种疾病的发生,则疾病和基因相关联。疾病、疾病基因和他们之间的关系的列表都是从OMIM获得。到2005年12月,包含了1284种疾病和1777个疾病基因。我们基于被疾病所影响的生理系统,将疾病分成22类疾病。,4,*,由疾病组的二部图可以产生两个相关的生物网络投影。一个是人类疾病网络(HDN),顶点是疾病,当
3、两个疾病共享至少一个疾病基因时,二者关联。另一个是疾病基因网络(DGN),顶点是疾病基因,当两个基因关联到同一疾病时,二者相连。然后,我们讨论了这些网络对于帮助我们理解和代表所有已知疾病和表型关联的框架的潜力。,5,*,6,*,HDN的性质:如果一个人类疾病有不同并且唯一的遗传原因,那么HDN对应的是不连通的孤立点。但,获得的HDN包含了单个疾病间和疾病类间的很多关联。1284个疾病中,867个至少一个边关联到其他疾病,516个疾病形成一个巨大的类,暗示很多疾病同其他疾病是同享遗传原因。一个疾病关联的基因数目s有很宽的分布,暗示大多数疾病关联到少数基因,很少的疾病关联到很多基因。白血病s=37
4、,结肠癌s=34等。HDN的度分布也是幂律的,结肠癌k=50,7,*,灰色表示linear binning;红色表示以2为底的对数数据,8,*,HDN有明显的聚类现象,但在不同疾病类之间有明显的不同。癌症类因为共享很多癌基因,所以紧密相连,并且还有很多疾病同癌症有强相关;代谢疾病没有明显的形成一个不同的类。如图三为了量化这种差异,我们衡量了每个疾病类的基因座异质性和连通性(HDN中彼此连接的一部分疾病)。如图四,红色代表较高的显著性,蓝色代表较低的显著性。发现癌症有着较高的异质性和连通性,而代谢类有较低的异质性和连通性。基因座异质性:指多于一个基因的变异。用属于这个类的疾病中基因的平均数目(也
5、就是节点的平均大小)来衡量。一个类的连通性:用在HDN中彼此互相关联的一部分疾病来衡量,9,*,10,*,11,*,DGN的性质基因间的关联,代表了相关表型关联,他们代表了表型相关性的衡量,这个可以用在未来的研究中,同蛋白质相互作用、转录因子启动子相互作用、代谢相互作用关联,发现新的遗传相互作用。在DGN中,1377个疾病基因连接到其他基因,903个基因属于一个巨大的类。如图五涉及多种疾病的基因数目急剧减少。如图六,12,*,13,*,14,*,HDN和DGN的功能类在保持疾病和基因的度不变的情况下,在二部图基础上随机化重连边,得到的疾病网络的最大类的平均大小是64316,远大于实际HDN中的
6、516。相似,基因网络的最大类的平均大小为108720,也远大于实际DGN中的903(P10(-4))。这些不同显示了疾病和基因的重要的病理生理学类。在实际的网络中,疾病(基因)更倾向于相同疾病类中疾病(基因)的相连。,15,*,疾病关联基因识别不同功能模块大多数的疾病和疾病类对应细胞内网络中怎样的不同的功能模块仍然不清楚。假设1:如果编码蛋白质的疾病关联基因在功能不同的模块中相互作用,则在这些疾病模块中的蛋白质比其他蛋白质更可能相互作用。为了检验这种假设,建立了蛋白质相互作用网络,发现290个重叠的相互作用,是随机情况下的10倍。,*,16,同一个疾病关联的基因共享一般的细胞和功能特性,在G
7、ene Ontology(GO)中注释。假设2:如果HDN显示模块化组织,则与相同疾病关联的一组基因应该分享相似的细胞和功能特性,正如在GO中注释的一样。为了证实这个假设的有效性,对于GO的每个分支(生物过程、分子功能和细胞组分),我们测量了每个疾病的GO同质性。发现有很高的显著性。GO同质性:,是疾病i关联的有GO术语j的基因数目;是与疾病i关联的有GO注释的所有基因数目。,*,17,*,18,假设3:在一般功能模块中相互作用的编码蛋白质的疾病基因应该趋向于在相同的组织中表达。为了衡量,我们引入疾病的组织同质系数。定义为:其中 表示对于疾病i的关联基因至少在一个组织中表达的基因数目,表示在组
8、织j中 表达的基因的数目。如右图,有68%的疾病有 完全组织同质性,随机情 况下为51%。(P10(-5),*,19,最后,参与一个功能模块的基因应该显示较高的表达谱相关。通过与随机控制的比较,发现关联相同疾病的基因对的Pearson相关系数(PCCs)有较高的值。一个给定疾病的所有基因对的PCC的平均值也存在显著性。大约33种疾病的平均PCC0.6。,*,20,总结:关联同一疾病的基因1)他们对应的产物通过蛋白质相互作用倾向于彼此连接;2)倾向于在特异性组织中共同表达;3)显示较高的共表达水平;4)作为一个组显示同步表达;5)倾向于共享GO术语。这些支持了对于疾病基因和他们产物的全局功能相关
9、性,提供了一个疾病组的基于网络的模型,*,21,中心性和外围性一个细胞网络的结构和它功能特性的关联的最早的解释是在酿酒酵母中高连通蛋白或hubs更倾向于被关键基因编码。这促使研究者对人类疾病基因倾向于编码hubs的假设进行研究,但有研究者发现,二者仅有很弱的相关性。我们最初的研究是支持这一假设的。但是,疾病基因和hubs的关系在不同疾病基因间是不相同的。,*,22,在探索疾病基因是否编码hubs时,忽略了在早期发育中的关键基因,它们的改变导致高比例的自发流产。通过对老鼠基因的人类同源基因分析,发现1276个人类基因的老鼠重要同源基因,其中398个与人类疾病有关,占人类疾病基因的22%。这样就把
10、人类基因分为:1276个关键基因和1379个非关键疾病基因。发现关键蛋白显示了同hubs关联的趋势,而其余非关键疾病蛋白没有这种趋势。,*,23,*,24,期望:关键基因和疾病基因的表达模式同相当数量的其他基因同步。定义关键基因(或非关键疾病基因)i和细胞中所有其他基因之间的平均基因共表达系数,是从人类正常组织中计算得到的。发现:对于关键基因,有高的的基因比小的或负的的基因更关键;而对于非关键疾病基因正好相反。,*,25,最后,我们问:看家基因是否有一个编码疾病基因的趋势?我们发现一个基因在越多的组织中表达,则这个基因是关键基因的可能性越高。而非关键疾病基因有在很少的组织中表达的趋势。发现9.
11、9%的看家基因对应到疾病基因,13.5%的非看家基因;,*,26,大部分疾病基因的次要性可以用进化的观点进行解释。导致严重表型的体细胞突变更可能影响中心功能。我们分别研究了体细胞癌基因的特性,发现它们更可能编码hubs、显示了与其他基因更高的共表达性、更可能代表看家基因。体细胞癌基因的这种功能和拓扑中心性与当前的理解相吻合很多癌基因在细胞的发育和生长中发挥很重要的作用。,*,27,在人类的复杂表型中探索遗传重叠,某些疾病会在病人中高频率(低频)的同时发生。因此研究疾病间的遗传重叠至关重要。我们用对多种疾病的观察的大量的表型数据集和适当的统计模型,推理表型间的遗传重叠。比方说,孤独症、双相型障碍
12、和精神分裂症存在重要的遗传重叠。因此,这种疾病网络假说可以很快被用在遗传图谱的方法设计上,它涉及看似孤立的多种表型间的联合关联,*,28,数据来源:哥伦比亚大学医学中心的临床资料库。包括161种疾病的150万病人记录。这些数据包含了疾病的比较宽的范围,从一般到稀有,影响不同的生理系统。,*,29,方法:考虑一对疾病D1和D2,模拟一个人在特定年龄或之前的表型。一个人天生带有(没有)疾病易感变化集合,用k1、k2和k12的随机变量表示,这些变量确定了某个人在某个时间被诊断为某种病的概率。如果没有时间的调节,早发疾病和晚发疾病可能被错误的判断为负关联。,*,30,*,31,假设1)如果有两种(多种
13、)不同疾病是在相同环境下发生的,那么它们通常是通过分子机制引发的。2)对于每个表型对D1和D2,整个人类基因组被分为四个不相交的核苷酸位点集合。3)涉及连接疾病表型的四个集合中遗传变异的假设机制。在位点的疾病易感集合中,遗传变异的数目越大,疾病表型越可能显现出来。,*,32,这儿考虑两类遗传外显率函数:sharp-threshold和soft-threshold。Sharp-threshold是指当多态性的数目超过阈值 时,表现出表型i的特征来。是指表现疾病表型i所需要的,在疾病特异性核苷酸位点的有害多态性的最少数目。Soft-threshold是指,阈值是一个随机变量,满足均值为,方差为 的
14、二项分布。(),*,33,对每一个疾病对,我们选择三种模型中的一种进行分析:二者不相关(也就是没有遗传重叠);二者负相关(竞争遗传重叠);二者正相关(合作遗传重叠)。合作模型比标准的遗传多效模型更一般。因为合作模型除了分享的多态性,还允许关联影响各自的遗传多态性。独立模型是两个重叠模型的特殊情况,我们通过将两个重叠模型同独立模型比较,用两个对数似然比统计 代表我们分析的结果。进一步,我们的参数模型提供了对假定遗传重叠的大小的评估。,*,34,相关性和重叠对于遗传重叠的分析显示了疾病间的大量的相关性,很多都被很好的确定,但有些相关性先前没有描述过。与孤独症的遗传重叠的疾病分为四类;双相型障碍和精
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人类疾病网络 人类 疾病 网络 PPT 课件
链接地址:https://www.31ppt.com/p-5459647.html