中国基因网您的位置:首页 >国外研究 >

基因组模型的发展是为了更好地理解神经精神疾病

一个由北卡罗来纳大学医学院的科学家组成的研究小组报告了一项研究模型的发展,该模型将DNA和基因活动的变化与大脑疾病的风险联系起来。发表在《科学》(Science)杂志上的一篇论文(《人类大脑的综合功能基因组资源和整合模型》(Comprehensive functional genomic resource and integrative model for The human brain)对该模型进行了描述。

基因组模型的发展是为了更好地理解神经精神疾病

科学家们现在可以把它作为一种工具来探索精神分裂症和自闭症等疾病的生物学机制。研究人员说,这些疾病在很大程度上未能得到深入的理解,也无法治愈。

许多精神疾病都与强烈的基因联系有关。然而,了解潜在的分子机制仍然具有挑战性。

为了应对这一挑战,心理编码协会已经为人类大脑的功能基因组学开发了一个全面的在线资源和整合模型。

锥体资源的基础是由PsychENCODE生成的数据集,包括大容量转录组、染色质、基因型、Hi-C数据集以及大脑主要区域约3.2万个细胞的单细胞转录组数据。我们将这些数据与基因型组织表达(GTEx)、编码、表观基因组学和单细胞分析的数据进行了合并。通过统一的处理,我们创造了一个和谐的资源,使我们能够调查1866个个体的大脑功能基因组数据。

从这个统一处理的数据集中,我们创建了派生的数据产品。这些包括脑表达基因列表、共表达模块和许多脑细胞类型的单细胞表达谱;~ 79000种脑活性增强剂,具有相关的Hi-C循环和拓扑相关域;表达量性状位点(QTLs)约250万个,包括约23.8万个与连接不平衡无关的单核苷酸多态性以及与剪接亚型、细胞组分和染色质活性相关的其他类型QTLs。

“通过这些研究,我们发现脑基因表达中88%的跨群体变异可以用细胞比例的变化来解释。”此外,许多疾病和衰老与细胞类型比例的变化有关。这些数据还可以用来比较大脑和其他组织。特别是通过光谱分析,我们发现大脑具有明显的表达和表观遗传模式,包括比其他组织更大程度的非编码转录。

“最高一级的资源包括用于管理的综合网络和用于疾病预测的机器学习模型。这些网络包括大脑的完整基因调控网络(GRN),将QTLs、广义元素活性相关性和Hi-C数据合并后的转录因子、增强子和目标基因连接起来。通过使用这个网络,我们将疾病基因与精神疾病的全基因组关联研究(GWAS)变体联系起来。对于精神分裂症,我们将321个基因与142个GWAS位点联系起来。然后我们将调控网络嵌入到一个深度学习模型中,从基因型和表达来预测精神病学表型。我们的模型比加性多基因风险评分的预测提高了约6倍。此外,它比加性模型提高了~3倍,即使是在输入基因表达数据时,也突出了只有少量转录组数据用于疾病预测的价值。最后,它强调了与疾病预测相关的关键基因和通路,包括免疫、突触和代谢通路,总结了更有针对性分析的最新结果。

我们的资源和整合分析已经揭示了大脑中的基因组元素和网络,这反过来又提供了精神疾病背后的分子机制的洞察力。我们的深度学习模型改进了传统方法的疾病风险预测,并且可以通过其他数据类型(如microRNA和神经成像)进行扩展。

“这是有史以来最全面的功能基因资源开发对于理解大脑,它建立了一个框架,集成不同的基因组数据得到的深度观察脑部疾病的生物学,”co-first作者Hyejung说赢了,博士,北卡罗来纳大学医学院的遗传学助理教授和北卡罗来纳大学神经科学中心的成员。

在过去几十年里,科学家们进行了数百项研究,收集了大量人群的DNA序列和相关数据,以识别与疾病相关的DNA变异和其他基因组相关因素。这些基因组学研究为许多疾病的生物学原因提供了重要线索。

但是对于精神疾病和许多其他常见的大脑疾病,传统的基因组学研究用处不大。例如,精神分裂症与基因组上100多个位点(称为“风险位点”)的特定变异有关,但这些位点大多不包含基因,因此尚不清楚它们与疾病的关系。

此外,许多与精神分裂症有关的基因变异对精神分裂症风险的影响通常很微弱。这向科学家们表明,精神分裂症,可能还有许多其他大脑疾病,太过复杂,用传统的一维基因组学方法是无法理解的。

为了寻求一种更复杂的方法,一组基因组学研究人员在几年前成立了“心理编码联盟”(PsychENCODE consortium)。他们开始收集基因组学研究和其他公开研究的数据,开发工具来发现不同类型数据之间的关系。

新的资源包括不同种类的基因组数据的个体谁有精神分裂症,双相情感障碍,和自闭症谱系障碍。基因组数据的类型包括DNA序列、来自特定类型脑细胞的基因表达数据、被称为促进基因表达增强剂的DNA区域地图,以及已知影响基因活动的基因组其他特征。

win博士贡献了她自己关于“染色体构象”的研究数据。这指的是细胞核中环状DNA的三维组织,特别是不同环状DNA之间的距离足够近,从而影响彼此的基因表达。她还建立了一个复杂的模型,研究大脑细胞中的基因表达是如何受到染色体构象和其他基因组因素的调控的。

该团队使用基因调控网络模型评估了先前基因组学研究发现的142个精神分裂症风险位点。这些风险位点不包含基因,但被怀疑通过某种方式影响其他基因的表达而导致精神分裂症的风险。该模型确定了321个基因,包括一些已知的精神分裂症风险基因,作为这些风险位点的可能调控目标。

win博士和他的同事们发现,这些基因会影响突触、乙酰胆碱受体、离子通道以及之前精神分裂症研究中涉及的其他通路的功能。科学家们还确定精神分裂症主要是一种神经元的紊乱,而不是其他脑细胞的紊乱。

为这项研究开发的资源包括一个人工智能驱动的深度学习模型,该模型基于基因变异和基因表达数据来估计精神症状的风险。科学家们将这种新模型与一种标准的、简单得多的模型进行了比较,后者基于个体的基因组来预测精神疾病。

“深度学习模式更准确,我们认为这将产生重大影响的风险评估和诊断病人,”博士说赢了,还说她和她PsychENCODE同事现在正在继续发展他们的模型通过整合更多类型的基因组数据和扩展他们的分析超出精神分裂症和其他脑部疾病。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容