科学家揭示了绘制长期非编码RNA的巨大未知领域的方法
北卡罗来纳大学医学院的科学家开发了一种有效的方法来探索称为长非编码RNA(lncRNAs)的神秘分子的特性,其中一些在癌症和其他严重疾病中起着重要作用。到目前为止,科学家还缺乏确定人类细胞中数万种不同lncRNA功能的正确方法。到目前为止,他们只有几百个这样的分子 - 这是他们所代表的巨大的未知领域的一小部分。
UNC科学家在Nature Genetics上发表了一篇隐藏的代码,该代码将lncRNA的分子构成与他们实际做的事情联系起来,研究人员开发了一种算法,通过它们可能的功能快速分类lncRNAs。
“长链非编码RNA是您可能称之为基因组'暗物质'的一部分,我们开发的这种工具应该有助于我们更好地了解它们在健康和疾病中的作用,”研究资深作者Mauro Calabrese说。 ,博士,药理学助理教授,UNC Lineberger综合癌症中心成员。
动物和植物中的遗传信息存储在DNA中,细胞通过将DNA转录成称为RNA的密切相关分子来利用该遗传信息。许多RNA继续被翻译成蛋白质。但近几十年来科学家们不得不考虑这样一个事实,就是不到2%的基因组就是这样使用的。大多数DNA被转录成不编码蛋白质的RNA。这些被称为非编码RNA,长度超过200个核苷酸的RNA被分类为长非编码RNA。
许多这些RNA与蛋白质或其他分子结合以打开或关闭基因,从而调节细胞过程。最着名的lncRNA之一被称为Xist,这对于女性的正常发育很重要。另一种称为MALAT的高水平与更具侵袭性和转移性的癌症有关。总的来说,生物学家确信许多lncRNA具有关键的调节作用,其中断会导致疾病。然而,到目前为止,它们已经表征了数千种被认为存在于哺乳动物细胞中的lncRNA中的一小部分的功能。
生物学家慢慢了解这些分子的作用的一个原因是,当你研究它是如何从核苷酸构建模块的序列组合起来时,lncRNA的功能并不明显。通常两个具有相似功能的lncRNA似乎具有非常不同的序列。
Calabrese和他的团队,包括第一作者Jessime Kirk和UNC艺术与科学学院的数学和应用物理科学教授Peter Mucha,试图破译lncRNA序列和功能之间的其他模糊关系。他们从两个关键线索开始:首先,有证据表明lncRNA主要通过与蛋白质结合起作用。其次,RNA在其整体结构内使用短序列连接蛋白质。
“我们推断,lncRNA中蛋白质结合序列的存在比它们在lncRNA中的相对定位更重要,”Calabrese说。“这一概念最终成为现实,并使我们能够在更传统的方法失败的情况下取得成功。”
该团队开发了一种名为SEEKR的基于计算机的方法,用于查找和比较lncRNA中称为“kmers”的蛋白质结合序列,无论kmers的精确位置如何。该团队发现,基于其kmer含量的相似性,大约一半的人和小鼠lncRNA可以分为五个不同的群落。基于kmer的方法还可以帮助预测通常在细胞内发现lncRNA的位置以及它们结合的蛋白质类型。
“我们现在可以从经过充分研究的lncRNA中获取序列信息,并用它来发现可能通过相关机制起作用的lncRNA。在某种程度上,它就像能够最终理解Rosetta Stone中的不同脚本一样。”卡拉布雷斯说。
令人惊讶的是,该团队发现,物种之间的kmer含量社区通常非常相似。人和小鼠lncRNA群落彼此非常相似,但是一些哺乳动物的lncRNA群落甚至在远缘动物中也有明显的对应物。一个名为HOTTIP的lncRNA代表的哺乳动物lncRNA群落似乎在其他脊椎动物甚至海胆中都有表亲lncRNA群落。
“就kmer含量而言,人类lncRNA的亚群可能更接近于进化上远距离物种的lncRNA,而不是其他人类lncRNA,”Calabrese说。“这支持了lncRNA群体在不同生物体中具有相似功能的想法,尽管缺乏明显的线性序列相似性。”
在他们的概念的最终测试中,科学家合成了完全人工的lncRNAs,设计它们包括在Xist中发现的kmers,同时确保分子的整体序列不同于任何已知的lncRNA。他们将SEEKR算法应用于这些人工lncRNA,并发现与Xist具有最高预测功能相似性的那些在Xist样活性的简单试管测试中具有最高的实际功能相似性。
Calabrese和他的同事现在希望使用他们基于kmer的方法来指导发现和研究癌症等疾病中重要的lncRNA。他们还希望改进他们的方法,以便从序列信息中更好地预测lncRNA的功能。
“我们的基因组产生了如此多的lncRNA,现在我们对如何查看这些分子的序列以预测哪些分子在我们的细胞中做重要事情有了更好的想法,”Calabrese说。
推荐内容
-
科学家修改CRISPR以表观遗传学治疗糖尿病,肾脏疾病,肌肉萎缩症
Salk科学家已经创建了新版本的CRISPR Cas9基因组编辑技术,使其能够在不破坏DNA的情况下激活基因,从而可能避免使用基因编辑技术治疗人
-
现代人类大脑组织最近才出现
来自德国莱比锡马克斯普朗克进化人类学研究所的研究人员揭示了现代人类典型的球状大脑形状是如何以及何时进化的。他们根据智人化石中颅...
-
改进单细胞RNA测序数据可视化的新方法
就像从针孔相机到宝丽来,对流行的生物信息学数据可视化方法的公式的重要数学更新将允许研究人员开发单细胞基因表达的快照,不仅快几倍...
-
研究人员发现了新的分裂或区分植物转换
来自VIB和根特大学的科学家在Jenny Russinova教授的指导下发现了一种新的植物机制,它控制着气孔谱系中不对称或分化的重要决定步骤。这是
-
科学家们确定了高温下植物生长所需的通用基因
由西班牙国家生物技术中心的Carlos Alonso-Blanco博士和澳大利亚莫纳什大学的Sureshkumar Balasubramanian博士共同领导的科学家团队在分
-
生物钟控制细胞周期和植物中的肿瘤生长
生物节律在自然界中无处不在,从心脏的跳动到开花植物的节律。在某些情况下,这种节律性由细胞蛋白质活动的振荡决定,这标志着它们控制...
-
研究揭示了非洲蝙蝠,寄生虫和病毒的相互作用
如果有什么科学家确定蝙蝠及其在引起人类疾病方面的作用,那么他们仍然需要学习很多东西。除了狂犬病病毒,SARS冠状病毒(引起严重急性呼吸
-
全球变暖使共生的肠道细菌崩溃 杀死宿主昆虫
2016年10月4日 - 一项新的研究表明,当昆虫肠道中共生的热敏感细菌暴露于温度升高时,细菌和昆虫都会受到负面影响并死亡。本周在mBio期刊
-
非洲象鼻鱼的电感能力表现出视觉敏锐性
非洲象鼻鱼产生弱电脉冲以导航其环境。正如波恩大学的一项研究所表明的那样,这种本地化感与视觉有着惊人的相似之处。该研究表明,不同...
-
遗传因素是学业成功的关键
根据对双胞胎的一项大型新研究,遗传学解释了学校成就中60%以上的个体差异。多年来,研究将教育成就与生活轨迹联系起来,例如职业地位,健