中国基因网您的位置:首页 >基因科普 >

ENCODE数据描述了人类基因组的功能

人类基因组计划产生了DNA中30亿对化学字母的几乎完整的序列,体现了人类遗传密码 - 但这个蓝图的工作方式却很少。现在,经过全球32个实验室的440多名研究人员多年的共同努力,更加动态的图片首次全面展示了人类基因组实际上如何发挥作用。

ENCODE数据描述了人类基因组的功能

在这项新研究中,研究人员将超过80%的人类基因组序列与特定的生物学功能联系起来,并绘制了400多个调控区域,其中蛋白质与DNA特异性相互作用。这些发现代表了在理解细胞内遗传信息表达的精确和复杂控制方面的重大进展。研究结果使得持续活跃的基因组变得更加清晰,在这种基因组中,蛋白质通常使用有时距离基因本身很远的位点来打开和关闭基因。他们还确定了DNA的化学修饰影响基因表达的位置,以及各种功能形式的RNA(一种与DNA相关的核酸形式)有助于调节整个系统的位置。

“在关于人类基因组计划的早期辩论中,研究人员预测只有百分之几的人类基因组序列编码蛋白质,细胞的主力,其余的都是垃圾。我们现在知道这个结论是错误的,” Eric D. Green博士,国家人类基因组研究所(NHGRI)主任,国立卫生研究院的一部分主任。“ENCODE揭示了大多数人类基因组参与了将遗传信息转化为活细胞和生物体所需的复杂分子编排。”

NHGRI组织了研究项目,产生了这些结果; 它被称为的Enc yclopedia ø ˚F d NA ëlements或ENCODE。ENCODE于2003年推出,旨在识别所有基因组功能元件的目标与第一个人类基因组的测序一样令人生畏。ENCODE是作为一个试点项目启动的,旨在开发产生结果所需的方法和策略,并通过仅关注人类基因组的1%来实现。到2007年,NHGRI得出的结论是,该技术已经为一个全面的项目进行了充分的发展,该研究所在五年内投入了大约1.23亿美元。此外,自2003年以来,NHGRI为ENCODE试点项目投入了大约4,000万美元,加上大约1.25亿美元用于ENCODE相关技术开发和模式生物研究。

努力的规模非常显着。来自美国,英国,西班牙,新加坡和日本的数百名研究人员在147种组织上进行了1,600多组实验,并在该联盟中实现了标准化技术。这些实验依赖于下一代DNA测序技术的创新用途,这种技术仅在大约五年前推出,这在很大程度上归功于NHGRI DNA测序技术开发计划所带来的进步。总的来说,ENCODE生成了超过15万亿字节的原始数据,耗费了相当于300多年的计算机时间进行分析。

“我们已经走过了漫长的道路,”英国欧洲生物信息学研究所的Ewan Birney博士说,他是ENCODE项目的首席分析协调员。“通过精心拼接各种简单的数据,我们已经证明人类基因组只是通过开关活着,打开和关闭我们的基因并控制蛋白质产生的时间和地点.ENCODE将我们对基因组的了解带到了下一个层次,所有这些知识都是公开分享的。“

ENCODE联盟在发布之前,一旦在互联网上的任何人都可以自由访问的几个数据库中验证了准确性,就会对结果数据集进行放置。

“ENCODE目录就像人类基因组的谷歌地图一样,”NHGRI计划主管Elise Feingold博士说道,他帮助启动了ENCODE项目。“只需在谷歌地图中选择放大倍率,您就可以看到国家,州,城市,街道,甚至是单个交叉路口,通过选择不同的功能,您可以获取路线,查看街道名称和照片,并获取有关交通甚至天气的信息ENCODE图允许研究人员以同样的方式检查人类基因组中的染色体,基因,功能元件和单个核苷酸。“

协调出版物集包括“ 自然 ”杂志中的一篇主要综合论文和五篇相关论文; 基因组研究论文18篇; 和基因组生物学的六篇论文。ENCODE数据非常复杂,三种期刊已经开发出一种开创性的方式,以一种他们称之为线程的集成形式呈现信息。

“由于ENCODE产生了如此多的数据,我们与ENCODE联盟一起,引入了一种新方法,使研究人员能够浏览数据,” 自然生产的高级编辑Magdalena Skipper博士说道。互联网上可用的发布平台。

由于相同的主题在不同的论文中以不同的方式得到解决,将允许任何人通过点击相关的主题,在ENCODE出版物集中的所有论文中关注主题。自然ENCODE资源管理器页面。例如,第一个线程从几篇论文中汇编与遗传变异和疾病相关的数字,表格和文本,并将它们全部显示在一页上。ENCODE科学家认为,这将阐明分析中出现的许多生物学主题。

除了螺纹论文,六篇评论文章被发表在生物化学杂志,并在两个相关的论文科学,一个在细胞。

ENCODE数据正迅速成为研究人员帮助了解人类生物学和疾病的基本资源。已有超过100篇使用ENCODE数据的论文由不属于ENCODE项目的研究人员发表,但他们已将这些数据用于疾病研究。例如,人类基因组中不含蛋白质编码基因的许多区域与疾病有关。相反,与疾病相关的遗传变化似乎发生在ENCODE已经鉴定出许多调节位点的基因之间的大量序列中。需要进一步研究以了解这些基因组区域中的特定变体如何导致疾病。

“我们对与疾病相关的遗传变异不在蛋白质编码区域感到惊讶,”参与ENCODE工作的NHGRI项目负责人Mike Pazin博士说。“我们期望发现引起疾病的许多遗传变化都在调节区域或开关内,影响蛋白质的产生量或产生蛋白质的时间,而不是影响蛋白质本身的结构。医疗条件将会发生,因为该基因异常开启或关闭或蛋白质的异常数量。这种调节DNA远非垃圾DNA,显然对人类健康和疾病做出了重要贡献。“

识别监管区域也将有助于研究人员解释为什么不同类型的细胞具有不同的特性。例如,为什么肌肉细胞产生力量而肝细胞分解食物?科学家们知道,肌肉细胞会打开一些只在肌肉中起作用的基因,但以前无法检查控制这一过程的调控因素。ENCODE通过检查人体中发现的数百种细胞类型中的140种以及鉴定许多细胞类型特异性控制元素,为这些类型的研究奠定了基础。

尽管这一历史性出版物集中描述的数据集非常庞大,但它并未全面描述人体中所有不同类型细胞中的所有功能基因组元素。NHGRI计划至少再投资另外四年与ENCODE相关的研究。在下一阶段,ENCODE将根据所研究的功能元素和细胞类型的类型增加目录的深度。它还将开发用于更复杂的数据分析的新工具。

国家人类基因组研究所是构成国立卫生研究院的27个研究所和中心之一。NHGRI校外研究计划支持开发资源和技术,加速基因组研究及其在人类健康中的应用。

美国国立卫生研究院(NIH)是全国首屈一指的医学研究机构,由27个研究所和中心组成,是美国卫生与公众服务部的一个组成部分。NIH是主要的联邦机构,负责开展和支持基础,临床和转化医学研究,并正在研究常见和罕见疾病的病因,治疗方法和治疗方法。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容