中国基因网您的位置:首页 >基因科普 >

NIH将扩展基因组学研究的关键目录

马里兰州贝塞斯达, 2017年2月2日,星期四 - 美国国立卫生研究院(NIH)计划扩大其DNA元素百科全书(ENCODE)项目,该项目正在产生许多科学家用于研究人类健康的基础基因组学资源。和疾病。ENCODE项目由国家人类基因组研究所(NHGRI)资助,是NIH的一部分,旨在对人类和精选模式生物中的所有基因和调控元素 - 控制基因是否活跃的基因组部分 - 进行编目。经过四年的额外支持,NHGRI建立在长期致力于开发免费提供的基因组学资源以供科学界使用的基础上。

NIH将扩展基因组学研究的关键目录

“ENCODE创建了高质量且易于获取的数据,工具和分析,这些数据,工具和分析在研究中被广泛用于解释基因组序列并理解基因组变异的后果,”项目主管Elise Feingold博士说。在NHGRI的基因组科学部。

“这些奖项提供了通过扩大资源的广度和深度来加强这一基础的机会。”

自2003年启动以来,ENCODE资助了一个研究人员网络,开发和应用基因组中候选功能元件的映射方法,并分析生成的基因组信息的庞大数据库。ENCODE生成的数据和工具由两组组成:数据协调中心,其中包含数据并通过开放访问门户提供对资源的访问;数据分析中心,将数据合成为百科全书以供使用由研究界。

在资金到位之前,NHGRI计划在本财政年度(2017财年)为这些奖项承诺高达3150万美元。有了这笔资金,ENCODE将扩大这些工作的范围,包括表征中心,该中心将研究候选功能元件可能发挥的生物学作用,并开发方法来确定它们如何在各种细胞类型和模型系统中对基因调控作出贡献。 。此外,该项目将通过开发一种结合研究界提供的数据的方式来增强ENCODE目录,并将使用明确同意不受限制地共享其基因组数据的研究参与者的生物样本。

ENCODE的核心是让科学界能够发现; 也就是说,使用基本的科学方法来理解最基本的基因组。其基因组信息目录可用于各种研究项目 - 例如,产生关于特定疾病中出现问题的假设,或了解确定如何在身体的不同部位使用相同的基因组序列以制造细胞的过程。专业功能。研究界已有1,600多种科学出版物使用了ENCODE数据或工具。

“我们发现许多使用ENCODE资源的人正在进行疾病研究,这证明了它的转化价值,”NHGRI基因组科学部项目主任Mike Pazin博士说。

识别基因组的特征:绘图中心

ENCODE的测绘中心自成立以来一直是该项目的一部分。这些小组旨在确定基因的基因组位置和控制它们的调控元件。通过这些新的奖项,绘图中心将研究更广泛的生物样本,包括来自各种疾病的个体以及高度专业化的细胞,以扩展人类和小鼠基因组中候选功能元件的目录。

“在过去,ENCODE一直专注于识别健康个体的功能元素;但基因表达可能在不健康的人和健康的人中受到不同的调节,”Pazin博士说。“患病的组织可能有助于检测新的功能元素。”

“ENCODE项目的一个重要方面是识别细胞类型的集合,用于创建令人难以置信的详细基因组图及其特征,”Erez Lieberman Aiden博士说,他是遗传学系助理教授。贝勒医学院和莱斯大学,以及首次参加ENCODE八个测绘中心之一的ENCODE受助者。“如果我们将它们放在一起,整体就比每个部分的总和更有价值。”

艾登博士的研究重点是基因组如何在三维内核折叠。“科学家倾向于将染色体视为一个长而线性的字母串。实际上,这根弦折叠起来,形成环状和其他形状,”他说。

对于大约两米长的DNA适合细胞核,必须将其装入染色质中。然后,核内的这种紧密堆积可以使基因组的两个部分 - 例如基因及其调节元件 - 紧密接触。更好地了解这些循环发生的位置将澄清被认为相距甚远的基因组特征的关系。

更详细地了解基因组功能:表征中心

ENCODE将建立五个表征中心,以研究大量基因组元素在特定生物环境中的功能。ENCODE表征中心将利用新开发的技术同时表征许多元素。

“我们希望尝试为ENCODE创建的目录的功能方面注入活力,”斯坦福大学遗传系助理教授Will Greenleaf博士和一位新的ENCODE调查员说道。表征中心。“了解监管要素如何协同工作以实现基因表达是我们真正感到兴奋的事情。”

Greenleaf博士的研究涉及通过像CRISPR-Cas9这样的方法改变各种候选调控元件,这是一种基因编辑技术,可以精确地截取基因组的部分。他的小组与斯坦福大学的Michael Bassik博士小组合作,将描述这些细胞如何在各种条件下生长,以记录基因组中缺失调控元件时会发生什么。

“我们对人类基因组进行了测序,但它是用我们不理解的语言编写的.ENCODE是一种学习该语言逻辑和语法的方法,因此我们可以释放基因组测序的能力,以便理解它们人类的健康和疾病,“他说。

分析目录:计算分析项目

在ENCODE的第三个方面,研究人员将开发计算和统计方法,使ENCODE目录对研究疾病机制和基础生物学更有用。

“在任何给定的细胞类型中,您可能在基因组中有30,000-50,000个调节基因表达的位点。我们如何考虑这个?或者想象出来?或者确定基因组中的哪些元素调节哪些基因 - 以及何时和如何?你必须进行计算,“斯里兰凯特林研究所计算和系统生物学项目的准成员克里斯蒂娜莱斯利博士说,他获得了六项计算项目之一的资金。

她的研究使用基因调控的预测模型,其中包含基因组中哪些位点可访问的数据,并在这些位点解码DNA信号。她以前的工作研究了这种以线性或一维形式观察基因组的现象。现在,她正在整合来自其他ENCODE项目的数据,例如Aiden博士在三维上绘制染色质环图谱的工作,以进一步了解基因组功能。

将数据引入社区:数据协调和数据分析中心

ENCODE项目汇集了生成大量数据的实验室,这些实验室通过计算研究的力量整合这些数据。数据协调中心和数据分析中心通过将所有参与者连接到数据,并为更大的研究团体创建便于访问的途径,为ENCODE成员提供支持。

“作为社区资源,ENCODE数据必须能够快速,免费地供研究人员使用,以便他们能够立即将其用于自己的工作中。这是数据协调中心和数据分析中心发挥如此关键作用的地方,”Dan Gilchrist说,博士,NHGRI基因组科学部的项目主任。“多亏了这些中心,ENCODE数据是可以找到的,可访问的,可互操作的和可重用的 - 最大化它们对研究界的实用性。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容