中国基因网您的位置:首页 >国外研究 >

研究人员开发了一种比较单细胞基因表达的更好方法

努力利用下一代测序来比较单个细胞中的基因表达,以获得有关癌症起源,进展或复发的线索。St. Jude儿童研究医院的研究人员开发出一种算法,可以更准确,更灵敏地识别单个细胞中基因表达的差异。

研究人员开发了一种比较单细胞基因表达的更好方法

该算法被称为具有独立分散或NBID的负二项模型。St. Jude正在向全球研究人员免费提供NBID。计算生物学家和相应作者St. Jude的Xiang Chen博士及其同事开发了NBID,以更好地利用单细胞RNA测序来追踪单个细胞中基因表达的差异。他们的工作最近出现在Genome Biology期刊上。

单细胞RNA测序在过去十年中已经出现,并且在癌症研究和免疫系统及其他器官的发育中获得了普及。通过比较不同细胞中的基因表达,研究人员旨在提高我们对癌症遗传学的理解。科学家利用该技术发现了化疗耐药或代表罕见亚型的肿瘤细胞亚群。该信息还可以揭示相应的标记基因,其被定义为群体之间具有不同表达水平的基因。这些信息将有助于开发精准药物和更敏感的诊断测试。

“许多研究现在采用单细胞RNA测序技术,但统计方法来表征数据滞后,”圣犹达计算生物学系助理成员陈说。“我们创建了NBID,这是一个专门用于分析单细胞RNA测序数据的软件包。我们发现,与用于分析单细胞RNA测序数据的其他软件包相比,NBID提供了更准确和灵敏的差异基因表达分析。

“我们相信NBID也可用于鉴定其他深入测序数据评估的生物标记物。”

挑战

人类基因组包括20,000到25,000个基因,这些基因带有制作特定蛋白质的指令,这些蛋白质可以完成细胞中的大部分工作该过程需要通过信使RNA复制DNA,从中将其翻译成特定的蛋白质。

单细胞RNA测序需要研究人员捕获单个细胞内的信使RNA,使用信使RNA组装DNA的互补链,然后复制(扩增)并分析。

基因表达变化很大并且在细胞内波动。捕获单个细胞中具有低至中等表达的基因的信使RNA是特别具有挑战性的。另一个挑战是数据稀疏性或低信号和高噪声,这需要在噪声海中识别感兴趣的数据,在这种情况下是RNA。实例包括“辍学”事件,其中在细胞子集中以相对高水平表达的基因在其他细胞中是不可检测的。

陈和他的同事使用分子“条形码”通过标记然后使用称为独特分子标识符(UMI)计数的过程计算信使RNA来跟踪基因表达。

“UMI优于其他方法的优势,读取计数,RNA的量化已被充分记录。这两种方案之间的统计差异未被充分认识,”Chen说。“通过对单细胞RNA测序数据的广泛评估,我们发现这两种方法应该以不同方式建模,UMI计数可以用负二项模型近似。”

NBID允许基因特异性和组特异性负二项模型,从而获得更好的性能。在比较测试中,NBID被证明在识别不同细胞群之间基因表达的差异时更敏感和更准确。例如,NBID帮助研究人员识别可用于将横纹肌肉瘤细胞亚群与不同基因表达模式分离的标记基因,这表明实体肿瘤进展的潜在新机制。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容