中国基因网您的位置:首页 >企业新闻 >

研究人员发现RNA-seq技术产生的数据经常存在技术偏差

研究数据的可重现性是实验生物学面临的一大挑战..随着基因组规模技术产生的数据的复杂性增加,这一关切变得越来越令人担忧。

RNA-seq是现代分子生物学中应用最广泛的方法之一,它允许在一次测试中同时测量给定样品中所有基因的表达水平。特拉维夫大学一个小组的新研究发现,RNA-seq技术产生的数据中经常存在技术偏差,这往往导致错误的结果。

这项研究由Shir Mandelbaum博士、Zohar Manber博士、Orna Erroy-Stein博士和Dr进行。在TAU的Sackler医学院和George S.Wise生命科学学院的Ran Elkon,并于11月12日在PLOS生物学上发表。

近几年来,人们对生物学研究中的错误结果越来越感到震惊,有时被称为重复性危机。这项研究强调对数据进行适当的统计处理的重要性,以减少误导性调查结果的数量。

博士该研究的主要作者Ran Elkon

RNA-seq实验的一个主要目标是描述在不同条件下被激活或抑制的生物过程。研究人员分析了几十个公开的RNA-seq数据集,以分析细胞对许多压力的反应。

在这项研究中,科学家们注意到,一组特别短或长的基因反复显示了由给定基因的RNA转录本的明显数量所测量的表达水平的变化。研究小组对这种反复出现的模式感到困惑,想知道它是否反映了不同触发因素共同的一些普遍的生物反应,或者它是否源于某种实验条件。

为了解决这个问题,他们比较了来自相同生物学条件的复制样本。复制间基因表达的差异可以反映出与实验兴趣的生物因素无关的技术效应。出乎意料的是,在复制之间的这些比较中观察到了显示表达水平变化的特别短或长基因的相同模式。研究人员说,这种模式是一种技术偏见的结果,这种偏见似乎与基因长度有关。

重要的是,TAU研究人员能够展示他们在许多RNA-seq数据集中检测到的长度偏差如何导致对特定生物功能的错误识别,作为对所测试条件的细胞反应..

埃尔肯博士总结说:“这种对数据的误解可能导致完全误导的结论。”实际上,这项研究还显示了如何从数据中消除这种偏见,从而过滤掉错误的结果,同时保留与生物相关的结果。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容