中国基因网您的位置:首页 >基因科普 >

发现我们中间的突变体

去年,桑格研究所大胆宣布 “ 我们都是突变体 ”,当时发表的一项研究显示,健康的个体携带了大约60个来自父母的新突变。然而,并非所有这些突变都是有意义的,因为一些突变可能落在基因组区域而没有任何目前已知的功能。本月的下一个基因组进展侧重于一类特定的突变,即“功能丧失(LoF)变异”。

发现我们中间的突变体

LoF被定义为预测会导致蛋白质编码基因功能丧失的遗传变异体; 换句话说,基因组序列的一些变化阻止了正常蛋白质的产生。由于LoF变异可导致衰弱性疾病,如囊性纤维化和Duchenne肌营养不良症,它们通常被认为是罕见的; 然而,许多科学家怀疑LoF变种实际上可能非常普遍,即使在健康人群中也是如此。事实上,在人类基因组计划之后产生的前几个全基因组序列各自在显然正常的个体中包含数百个LoF变体。

使用来自1000 Genomes Project试验阶段的数据,由英国Hinxton的Wellcome Trust Sanger研究所的博士后研究员Daniel MacArthur博士领导的研究小组开始密切关注这一点。一类变体并衡量它们的真实程度。

自人类基因组计划结束以来的十年中,国际HapMap项目等合作试图测量全球人口中基因组的差异。目前的国际合作,称为1000基因组计划,旨在对超过2,500个个体的基因组进行测序,以发现在所研究的群体中发生频率至少为1%的所有变异。该项目的试验阶段基于从三个主要人群中选出的185人:尼日利亚伊巴丹的约鲁巴人; 北欧或西欧血统的Utahans; 来自北京的中国人,以及来自东京的日本人。

麦克阿瑟及其同事在数据集中确定了2,951个候选LoF变体,并使用生物信息学工具去除可能是测序错误或注释工件的变种。然后,他们通过实验验证并手动重新注释剩余的候选者,以获得一组“高可信度LoF等位基因” - 几乎可以肯定的LoF变体。

这个过滤数据集的结果令人惊讶:研究人员估计健康个体的基因组每个都包含大约100个LoF变体,并且这些基因中的大约20个完全失活。一个人如何携带如此多的LoF变种并且仍然健康?

通过检查欧洲血统的一个特定个体的细节,仅鉴定为NA12878,基因组携带97个LoF变体:18个处于纯合状态(意味着没有预期功能蛋白),28.7%的LoF变体仅影响子集来自各自基因的已知转录物。

而在更大的图片中,含有高置信度LoF等位基因的基因似乎比不失去其功能的基因区域的进化保守性更低。有意义的是,基因功能越重要,进化就越不能容忍基因的破坏版本; 个人无法生存繁殖。

含有LoF的基因具有更多的旁系同源物(同一家族中的基因可能是重复事件的结果)和与旁系同源物更高的序列相似性,表明冗余。换句话说,如果基因是无活性的,其功能可以通过旁系同源基因的某种程度补偿。

含有LoF的基因与其他基因的相互作用也较少,而且它们编码的蛋白质与其他蛋白质的相互作用较少,这表明它们是细胞内较少的必需通路的一部分。

LoF变体在编码嗅觉受体(鼻子中产生嗅觉的受体)的基因中更常见,并且在参与蛋白质结合,基因调控和解剖学发育等关键功能的基因中较少见。

在谈到这项研究时,麦克阿瑟博士说:“即使在使用这种严格的过滤器之后,看到如此多的功能丧失变异仍留在”典型“基因组中,这当然令人惊讶。这是一个有用的提醒,人类基因组不是不稳定;有些人中存在许多基因,而其他人则被淘汰,包括一些最终会完全从人群中消失的基因。

在一个方面,这项关于功能丧失变体的研究非常谦卑; 它显示了在理解基因组生物学方面还有多少空白。在dbSNP中不存在1000个基因组项目试点数据中发现的70%的高可信度LoF变种(自20世纪90年代末大规模测序开始以来慢慢积累的基因变异数据库)。它还演示了通过系统地梳理大型数据集可以学到多少东西。随着全基因组测序研究数量的增加,本研究中使用的分析策略可能非常有价值。并且由于低频率的LoF变异存在于低频率(这就是稀有疾病罕见的原因),来自其他研究和更大规模测序工作的数据将有助于更详细地研究这些等位基因及其对人类发育和生物学的影响。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容