中国基因网您的位置:首页 >基因科普 >

多任务DNA人类基因组中的双重密码子

我们知道人类基因组是构建人体的分子教学书,但它究竟是什么功能的复杂性呢?2003年,人类基因组计划(HGP)完成,对构成完整人类基因组的30亿个碱基对进行全面测序。然而,拥有完整的人类基因组序列并不意味着完全理解所有那些As,Cs,Ts和Gs在我们的生物学方面的意义。

多任务DNA人类基因组中的双重密码子

研究人员一直在努力了解我们的基因组如何运作,微小的差异如何解释我们之间的广泛多样性,多少差异解释了为什么我们与最近的灵长类动物亲属如此不同,以及我们的基因组差异如何有助于健康和疾病。12月的基因组月度进展突出了Andrew B. Stergachis博士发表的论文。在华盛顿大学及其同事,2013年12月13日,科学问题。那么大惊小怪的是什么?

HGP的一个令人惊讶的发现是人类基因组中有多少基因。估计值远高于最终答案,即21,000个基因。这21,000个基因在不同时间产生不同的蛋白质以产生构成人类的无数细胞类型(例如,肌肉细胞,皮肤细胞,脑细胞等)。但人类基因组中的21,000个基因仅占整个DNA序列的1%。

那么,其他99%的人做了什么?科学家们也知道,人类基因组30亿个碱基中约有5%是通过进化高度保守(保持不变),因此被认为非常重要。基因只是这5%的一部分; 但其余的呢?

在我们继续之前,有一点背景。在每个基因内编码的是关于制造该基因蛋白质所需的氨基酸序列的信息。每个氨基酸由称为密码子的三个碱基对的序列指定。除了蛋白质编码信息外,基因组还包含许多DNA序列(称为功能元件),可控制何时打开或关闭各个基因。

在大多数情况下,科学家认为密码子只含有蛋白质编码信息和功能元素,只包含调控基因表达的DNA区域,每个区域只做一份工作。虽然科学家观察到一些基因含有完成这两项任务的密码子,但尚不清楚它在基因组中的广泛程度。

Stergachis博士的研究使用了NHGRI的DNA元素百科全书(ENCODE)项目生成的数据,这是一项持续努力,旨在查找和编目我们基因组中的所有不同功能元素。它包括特定种类功能元件基因组的所有位置,称为转录因子(TF)识别位点。转录因子是附着于特定DNA序列的蛋白质,并控制基因(可能在附近或数千碱基对之外)是否产生蛋白质(即表达)。

在Stergachis博士团队发现的大约1100万个转录结合位点中,超过200,000个位于蛋白质编码序列中。换句话说,相同的As,Cs,Ts和Gs段都可以结合调节蛋白质,该蛋白质控制基因是打开还是关闭,并且可以指定所制备的蛋白质的氨基酸。这意味着所有人氨基酸决定碱基的约14%也是调节结合位点。另一方面,这意味着大约87%的基因含有这些双重密码子,称为duons,因此在人类基因组中比以前认为的更频繁。

然后,作者使用这些数据来寻找这些教子中进化选择的证据。只有四种不同的碱基,理论上可能有64种不同的密码子(4 x 4 x 4),但由于我们只有20种不同的氨基酸,因此一些氨基酸具有多个密码子。这使得基因的DNA序列有可能发生突变,而不会导致蛋白质的变化。进化生物学家传统上寻找人与人之间的这些碱基对差异来代表“中性”突变(在自然选择方面既不利于生物也不利于有机体)。然而,如果碱基对序列对于转录因子结合也很重要,那么这些碱基对差异的遗传模式就不会是中性的 - 蛋白质仍然会有相同的氨基酸,

Stergachis博士的研究发现,在他们研究的人体样本中,二重子确实是高度保守的 - 他们在这些位点具有低水平的遗传变异。因此,转录因子蛋白质需要某些DNA序列进行结合的趋势导致高水平的进化保守性。

研究人员观察到不同的转录因子蛋白避免或偏爱基因的某些区域,例如基因的起始和已知产生结构上重要的氨基酸序列的区域。他们还发现转录因子避免了基因序列内外的终止密码子(即,在转录因子识别位点中从未发现信号基因末端的三种碱基组合--TAG,TAA或TGA)。此外,该研究表明,某些转录因子的结合行为可能与高活性基因中与DNA相连的调节化学基团(即表观遗传学)的模式有关。所有这些观察结果表明转录因子结合行为和蛋白质产生在进化时间内相互影响。

另一个有趣的发现是,与人类疾病和性状相关的13%的DNA突变位于duons内,这表明这些疾病或性状可能是相关基因转录因子活性变化的结果,而不是突变该基因蛋白质的版本。

“遗传密码可以同时写出两种信息这一事实意味着许多似乎改变蛋白质序列的DNA变化实际上可能通过破坏基因控制程序甚至两种机制同时引起疾病,”John Stamatoyannopoulos医学博士,副教授华盛顿大学医学院基因组科学与医学,论文的高级作者。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容