数学指出基因活动的映射速度快100倍
加州大学旧金山分校的科学家们进行的新研究可以加快10到100倍的速度 - 从基因研究到如何从干细胞构建新组织到通过以下方式检测癌症或自身免疫疾病的临床努力。在一小滴血液中分析单个细胞。该研究于2016年4月27日在线发表在Cell Systems杂志上,严格证明了如何在不使用昂贵且耗时的深度测序技术的情况下,提取有关单个细胞中基因表达模式的高质量信息。该论文的高级作者是加州大学旧金山分校生物化学和生物物理学副教授Hana El-Samad博士,以及加州大学旧金山分校系统与合成生物学中心的教授Matt Thomson博士。“我们相信其影响是巨大的,因为测序深度和吞吐量或成本之间的基本权衡,”El-Samad说。“例如,突然间,人们可以想到在单细胞水平上分析整个肿瘤。”
研究汇集了几个学科
该研究源于共同作者之间的合作,Graham Heimberg是Thomson实验室博士生,拥有生物信息学背景,Rajat Bhatnagar博士是El-Samad实验室的博士后研究员,具有应用数学和电气学背景。工程。他们的综合专业知识使他们能够应用工程见解,了解如何从噪声信号中提取关键信息,以及如何更有效地分析大规模基因活动数据集的紧迫生物学问题。
Heimberg和Bhatnagar有一个基本的见解:因为细胞中的每个基因通常是一个或多个更大的基因程序的一部分 - 数十个或数百个相关基因的组合经常被一起激活 - 基因活动的完整读数可以通过深度实现排序充满了冗余信息。他们推断,对于基因测序的许多现代应用而言,他们更关心基因活动的模式而不是个体基因,可以从分辨率低得多的数据中提取相同的结果。
把它想象成一个城市的模糊照片。您可以选择个别建筑物并决定您是在寻找旧金山,纽约还是巴黎,但如果您想要计算建筑物中的窗户或街道上的汽车数量,那么您将失去运气。
“我们根本不会说高深度测序是无用的,”汤姆森说。“远非如此。深度测序是获取有关个体基因和基因突变的特定分子水平信息的神奇工具。我们只是指出,通过正确的分析,浅层测序可以更快,更便宜地提取细胞 - 水平基因表达信息。“为了证明他们的观点,研究人员分析了数百种来自酵母,小鼠和人类的公开可用的基因表达数据库。他们表明,对于常见的应用,如检测细胞来自何种组织或通过其基因活性的特征模式挑选出不同类型的神经元,正确的数学分析可以从10到10万个测序读数中提取必要的信息,而不是数以百万计的读数构成深度测序。
研究人员进一步推出了一个理论框架,该框架能够准确地证明测序需要多深才能获得特定细胞或组织基因活性的特定细节水平。他们说,基本结论是,数据集中给定基因程序的“优势” - 即基因组解释的数据集传播的数量 - 决定了提取它所需的序列深度。换句话说,大功能很容易挑选,但细节需要更高的分辨率。
低分辨率测序可以加速癌症检测
新论文的结果是,对于基因表达的重要特征可能是最重要的众多基因组应用,可以使测序管道的流速快几十到几百倍。这可能包括在个体细胞成为癌症的过程中筛查血液,确定控制干细胞生长的遗传途径,或构建构建人体的基因表达程序的图谱。
这是至关重要的,Thomson和El-Samad说,因为特别是对于依赖于对来自单个细胞的 DNA测序的越来越重要的技术(例如上面的癌症液体活组织检查实例),测序本身现在是一个主要的瓶颈。
例如,加州大学旧金山分校的高级技术中心(CAT)目前有一台机器可以在一天的工作中准备50,000个细胞进行测序,但即使使用CAT最先进的测序机(一天可以进行5次读取,也可以研究人员需要两周多的时间才能对这些50,000个细胞中DNA活性的完整模式进行深度排序,每个细胞读数为百万次。但是,如果研究人员能够从每个细胞的20,000个读数中提取相关信息,那么他们可以在一天之内对150,000个细胞进行测序。
以这种方式加速管道可能对许多目前被认为过于昂贵或耗时的测序的研究和临床应用具有变革性。
例如,El-Samad说,许多细胞具有非常多余的分子途径,它们似乎都在细胞内做类似的事情,但对不同的药物反应不同。
“如果你想了解不同的药物如何影响这些途径 - 根据定义由许多不同的基因组成 - 在完整测序深度测试每种基因上的每种药物将是一个巨大的浪费时间和金钱,更不用说后勤不可能,“她说。“另一方面,如果你可以通过更低分辨率的测序快速识别哪些途径被激活,这意味着你可以在合理的时间内对你可以测试的药物数量疯狂。”
他说,汤姆森研究干细胞如何分化的工作也是如此。涉及的基因数量很多,但基因通路数量要少得多,因此低分辨率测序使实验室能够快速识别哪种途径以特定方式转化细胞,之后可以进一步实验来阐明哪些基因可以被控制为这些途径的关键驱动因素。
研究人员使用他们论文中推导出的方程来创建一个读取深度计算器,以帮助其他研究人员确定他们特定应用所需的基因活动信息的解决方案,他们在Thomson实验室网站上在线发布。
“我们从所有这些数据集得到的计算结果表明,这种现象对于所有不同类型的遗传数据都是全面的,理论部分解释了为什么会这样,”El-Samad说。“但只要有一个公式就可以了,所以你不必一遍又一遍地处理数据。”
推荐内容
-
将蛋白质放在适当的位置
许多被称为核RNA结合蛋白(RBPs)的特殊分子,当在细胞核外错位时,会形成多种脑部疾病中出现的有害团块,包括额颞叶痴呆(FTD)和肌萎缩侧索硬
-
农业寄生虫控制寄主植物的基因
Dodder是一种寄生植物,每年对美国和世界范围内的作物造成严重破坏,可以使宿主植物中的基因表达沉默,从中获得水分和养分。这种跨物种基因
-
研究揭示了神经母细胞瘤转移中的影响因素
神经母细胞瘤可在体内极具侵略性地生长和扩散,因此很难治疗。新的研究为神经母细胞瘤转移中的影响因素提供了重要线索,这些因素有可能...
-
基因可以在甘蔗蟾蜍上跳跃
詹姆斯库克大学的科学家们一直在利用甘蔗蟾蜍的传播来检查限制其范围的遗传机制。包括JCU教授Lin Schwarzkopf在内的一个团队研究了在新南
-
科学家制造蜜蜂疫苗来对抗昆虫天启
芬兰科学家开发出了他们认为是世界上第一种保护蜜蜂免受疾病侵害的疫苗,为解决可能导致全球粮食危机的昆虫数量大幅下降提供了希望。蜜...
-
研究人员希望消除对水管吸烟安全性的误解
对一系列研究的分析表明,普通公众的误解导致许多阿拉伯世界的吸烟者用水管代替卷烟,误以为它更安全。持续暴露于焦油,尼古丁和烟雾,...
-
蝗虫科遗传关系的研究指向南美洲
蚱蜢是世界上无处不在的昆虫群之一,从草原到热带雨林,到孤立的山脉到沙漠,到处都是蚱蜢。现在,由于对蚱蜢的遗传关系进行了长达十年...
-
DNA研究揭示了犬种的进化
来自161个现代品种的遗传材料帮助了国立卫生研究院国家人类基因组研究所(NHGRI)的一组研究人员组装了最全面的进化树。结果发表在Cell Repo
-
来自妈妈的遗传指示为胚胎发育设定了模式
一项新的研究表明母系遗传基因在胚胎发育中的重要作用。该研究发现,未能从母亲遗传特定遗传指令的斑马鱼在发育早期就会发生致命缺陷,...
-
发现球状蛋白质允许鱿鱼眼睛调整光线失真
宾夕法尼亚大学的一组研究人员发现了鱿鱼眼睛能够适应水下光线失真的方法。在他们发表在科学杂志上的论文中,该小组描述了他们在显微镜...