研究发现对基因表达数据的普遍误解
研究数据的可重复性是实验生物学的主要挑战。随着由基因组规模技术产生的数据的复杂性增加,这种担忧变得越来越令人担忧。
RNA-seq是现代分子生物学中使用最广泛的方法之一,可以在一次测试中同时测量给定样品中所有基因的表达水平。特拉维夫大学小组的一项新研究发现,RNA-seq技术产生的数据经常出现技术偏见,这通常会导致错误的结果。
该研究由TAU萨克勒医学院和乔治·怀斯生命科学学院的Shir Mandelbaum博士,Zohar Manber博士,Orna Elroy-Stein博士和Ran Elkon博士进行,并于11月12日发表在PLOS Biology上。
该研究的主要作者埃尔康博士说:“近几年来,人们对生物学研究中错误结果(有时被称为可再现性危机)的警觉性越来越高。” “这项研究强调了对数据进行适当的统计处理以减少误导性发现的数量的重要性。”
RNA-seq实验的主要目标是表征响应不同条件而被激活或抑制的生物学过程。研究人员分析了数十个公开可用的RNA-seq数据集,以分析细胞对多种压力的反应。
在研究过程中,科学家们注意到,一组特别短或长的基因反复显示出表达水平的变化,该水平由给定基因的RNA转录本的表观数量来衡量。对于这种反复发生的模式感到困惑,研究小组想知道它是否反映了不同触发因素共同的普遍生物反应,还是源于某种实验条件。
为了解决这个问题,他们比较了相同生物学条件下的重复样本。复制品之间基因表达的差异可以反映与实验的生物学目的无关的技术效果。出乎意料的是,在重复之间的这些比较中观察到显示表达水平变化的特别短或长基因的相同模式。研究人员说,这种模式是技术偏见的结果,这种偏见似乎与基因长度有关。
重要的是,TAU研究人员能够证明他们在许多RNA-seq数据集中检测到的长度偏差如何导致错误识别特定的生物学功能,作为对测试条件的细胞反应。
“对数据的这种误解可能导致完全误导性的结论,”埃尔康博士总结说。“实际上,这项研究还显示了如何从数据中消除这种偏见,从而滤除了错误的结果,同时保留了生物学上相关的结果。”
推荐内容
-
Warbler基因组看起来都是百分之99.97
几十年来,保护主义者一直认为蓝翅莺对金翅莺是一种威胁,这种莺是一种被认为可以保护联邦濒危物种的物种。根据北美育种鸟类调查,自1968年
-
细胞内病原体如何与宿主相互作用 还包括它们如何隐藏和存活
来自沙特阿拉伯国王阿卜杜拉科技大学(KAUST)和新加坡国立大学的研究人员开发了一种名为Hi-Jack的新方法,该方法可识别病原体如何劫持宿主的
-
找出最致命的菌株来设计儿童疫苗
研究人员已经确定了与最致命的疟疾寄生虫菌株相关的遗传指纹,使这些独特的DNA区域成为疫苗开发的潜在目标。由墨尔本大学领导的一个国际研
-
重新编程细菌而不是杀死它们可能是抗生素耐药性的答案
改变某人的基因编程比你想象的要容易。虽然在分子水平上改变DNA的技术正在被越来越广泛地使用,但是也可以简单地打开或关闭基因而不永久地
-
尿路感染 细菌如何进入
几乎每一位女性在她生命中的某个阶段都患有膀胱感染。男性也会受到膀胱炎的影响,但不太常见。在百分之八十的病例中,它是由肠道细菌大...
-
DNA复制基因涉及小头畸形侏儒症
沙特阿拉伯和英国研究人员之间的合作揭示了导致小头畸形侏儒症(MPD)的基因,这是一组发育障碍,患者头部比正常人更小,生长更慢。研究小组
-
转基因蚊子不是“毒品”需要美国环保局的监督
美国食品和药物管理局官员说转基因蚊子不是毒品,应该由环保部门监管。根据网上发布的指南,联邦官员已经决定由生物技术公司Oxitec设计的蚊
-
一项跨学科研究了解SMARCD2基因在造血发育中的作用
科学家们利用跨学科的方法共同努力,更加深入地了解影响中性粒细胞(一种白细胞)的罕见疾病的遗传因素。Christoph Klein,Nature Genetics
-
活鸟物种有助于估计人类驱逐的物种灭绝
第一批殖民太平洋偏远岛屿的人类先于大规模灭绝的鸟类。然而,来自这些岛屿的不完整的化石记录使得很难确定在第一波人类定植期间有多少...
-
一种新发现的先天性肺病
排列在呼吸道表面的细胞被称为多运动纤毛(MMC)的运动纤毛覆盖。他们在一个称为粘膜纤毛清除的过程中同步来回打击吸入颗粒和病原体的气道。