中国基因网您的位置:首页 >基因科普 >

新研究探索DNA的三维结构

在上周发表于Cell Systems的一系列论文中,贝勒医学院分子与人类遗传学助理教授,麦克奈尔学者和基因组架构中心(TC4GA)主任Erez Lieberman Aiden博士及其同事介绍了榨汁机,一种用于三维(3-D)基因组测序(Hi-C)过程的开源工具。Hi-C由Aiden和合作者于2009年发明,探索基因组的三维结构,创建测序数据的terabases,产生高分辨率的接触图,全面绘制基因组折叠在细胞核内形成的环。一个细胞。

新研究探索DNA的三维结构

在之前的Hi-C实验中,Aiden和他的团队认为数据的绝对带宽是一个核心挑战。现有的硬件和软件根本无法处理和分析这些实验中产生的大量数据,单个地图跨越数十亿读数和数万亿个碱基对。为了缓解数据分析中的瓶颈,Aiden和他的团队在由Neva Durand博士,Muhammad Shamim和Ido Machol领导的Baylor设计了Juicer,这是一种全自动化管道,允许用户几乎没有计算背景来转换原始测序数据进入基因组范围的循环映射,只需单击一下。Juicer生成带有循环和接触域的Hi-C文件,自动注释,这有助于地图及其结构特征的可视化和分析。

“在Cell Systems上发表的研究描述了我们团队用于分析三维基因组测序数据的新的端到端系统。它是同类系统中的第一个系统,可以将哺乳动物基因组中的环路映射到完全自动化的时尚,“Durand说,他是TC4GA的资深科学家,也是两项新研究的共同第一作者。

为了证明新工具的强大功能,Aiden和他的同事们创建了迄今为止最深的三维基因组图谱,涵盖了从单一实验条件中提取的超过3TB的数据。

但是软件的改进还不够:充足的硬件也是一个核心挑战。研究人员在四个集群系统上跟踪了Juicer的性能,包括基于Edico Genome的DRAGEN Bio-IT处理平台和IBM Power8架构的系统。

Edico的DRAGEN平台加速了对这项DNA三维结构研究得出的海量数据集的分析近20倍,这是所有其他测试系统的显着加速。

两位研究的共同作者Machol指出,“当我们在混合DRAGEN / Power系统上运行我们的管道时,数据分析比在行业标准集群上运行管道快20倍。这种差异打开了许多分析的大门在此之前是非常不切实际的。“

DRAGEN使用现场可编程门阵列(FPGA)生成基因组流水线算法的加速实现。该平台可通过远程下载进行重新配置和灵活,允许用户创建自定义算法并优化现有管道。

“鉴于我们观察到的急剧加速,我们对3D技术在三维基因组学中的巨大潜力感到兴奋。” 医学博士/博士Shamim说。贝勒的学生和榨汁机研究的共同第一作者。

艾登也是莱斯大学计算机科学系和理论生物物理中心的一名教员,对该实验进行了评论,他说:“TC4GA和Edico Genome之间的伙伴关系是一个改变游戏规则的人。使用DRAGEN可能不仅仅是一次性的练习:它们是三维基因组学领域整体未来的有力指标。我们相信,我们的合作将带来大量的创新。德克萨斯医疗中心社区及其他社区。“

Edico Genome首席执行官Pieter van Rooyen博士补充道,“Aiden博士和他的团队应用DRAGEN加速Juicer是DRAGEN在最短时间内处理大量原始测序数据的有效例证,无需任何额外培训或研究生学位。我们不断努力优化DRAGEN,并期望下一版本比我们已经达到的速度更快。“

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容