人类基因组计划后17年 X染色体的解码填补了很多空白
人类基因组计划后17年,X染色体的解码填补了很多空白。那么X染色体的解码让我们发现了什么东西呢?你是不是很好奇呢?让我们跟随去看看吧!
2003年,人类基因组计划结束了13年长跑,成功测序人体90%以上的基因,但其余部分仍难以解码。
近年来,DNA读取技术不断改善,这些空缺被逐步填满,研究人员得以进一步绘制完整的人类基因组图谱。但还是有百余个区域未得完成,其中就包括X染色体上的几个部分。
而近期发表于Nature的一项研究显示,科学家首次确定从端粒到端粒的X染色体的完整序列,此成就能帮助科学家进一步了解多种遗传条件。
测序X染色体及其它染色体的区域难倒了科学家,因为这些部位包含大量重复的DNA片段,令测序变得棘手,片段上有着重复了成千上万次的DNA字母(即碱基)。
加利福尼亚大学加州圣克鲁斯分校的DNA生物学家、该论文作者卡伦·米加表示:“直到最近,组装或拼凑这些片段才成为可能。”
研究人员采用高级测序技术,专注于解码X染色体,因为绝大多数人至少有一条X染色体。通常,从生理上的女性有一对X染色体,生理上是男性的人有一条X染色体和一条Y染色体。
米加说:“基因遗传学及基因组学领域研究X染色体,因其与许多遗传特性及疾病相关联。”比如,X染色体与色盲、杜氏肌营养不良及血友病有关。
米加与来自美国国家人类基因组研究所的研究员亚当·菲利皮合作,采用长读长测序,即能一次读取长链DNA碱基的技术进行研究。人类基因密码长到难以想象——约60亿个碱基——且DNA测序仪无法同时读取所有碱基。
因此,研究人员不得不将基因组切割为含有上百个碱基的小片段,这样便可以一次分析一个小片段。任务完成后,研究人员还须重新拼接这些片段。
在人类基因组项目初期,科学家一次仅能读取500个碱基。20世纪中期,测序技术愈加精准,但其速度降至每次读取100至200个碱基。到2010年,新技术问世,可一次读取约10000个碱基。使用旧测序技术时,这些重复DNA片段切割出的短片段十分相似,几乎没有能将它们拼接的线索。
现在,测序技术的改进意味着一些仪器可以同时读取约100000甚至更多的碱基。米加与菲利皮团队采取两种工具分析X染色体,染色体来自内含两个相同X染色体的特殊细胞。之后,菲利皮及其团队使用新创建的电脑程序拼接这些片段。
在X染色体上,他们能够填补染色体中央及许多基因上的空白部分。这样一来,尽管研究人员没发现什么大惊喜——比如没有新的、尚待发现的基因,但他们发现了许多在基因组重复片段中的变化。变化包括DNA碱基替换、缺失或插入,也包括较长DNA片段的复制、易位或倒置,这些问题会导致基因疾病。
米加说:“你可以对人群中一些最丰富的序列多样性视而不见,而你所忽视的或许就与此前无法研究的疾病有关。”
进一步研究这些尚未测序的区域会开辟基因组新疆界,研究人员可以以此寻找基因突变与原因未知的基因疾病之间的联系。接下来,研究人员把目光转向下一个未完整测序的染色体,以期最终能拼接出首个完整的人类基因组序列。
人类基因组计划(英语:Human Genome Project, HGP)是一项规模宏大,跨国跨学科的科学探索工程。其宗旨在于测定组成人类染色体(指单倍体)中所包含的30亿个碱基对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。