中国基因网您的位置:首页 >行业资讯 >

复杂网络识别生物燃料作物的基因

为了改善生物燃料的生产,科学家必须了解导致植物和微生物中关键性状表达的基本相互作用。为了理解这些相互作用,科学家们正在使用不同的信息层(关于基因之间,基因和表型之间的关系)与新的计算方法相结合,以在建模框架中整合大量数据。研究人员现在可以识别控制重要性状的基因,以针对生物燃料和生物产品生产。这项工作中使用的算法已经被用于在世界任何地方首次打破超级计算的亿元级障碍。

复杂网络识别生物燃料作物的基因

这种方法可以让科学家分析海量数据。他们可以使用亿亿次计算来实现,其中计算机每秒执行1018次计算。通过这种方法,科学家们可以了解细胞的工作原理他们可以利用这些见解将生物工程的有益特性转化为植物和微生物。使用百亿亿次计算的能力开辟了在细胞中研究高度复杂和相互关联的分子过程的可能性,其细节水平以前是不可能的。这种计算也预示着系统生物学的新时代。

生物有机体是由相互作用分子和大分子的功能网络组成的复杂系统。生物体内的复杂性状(表型)是表达基因的编排,分层,异构集合的结果。然而,这些基因和基因变异的影响是历史选择压力和当前环境和表观遗传信号的结果,因此,它们的共现可以被视为以不同方式的全基因组相关性。生物质顽固性(即植物对降解或解构的抵抗力,最终能够获取植物的糖用于生物能源目的)是一种复杂的多基因特性,对生物燃料计划具有高度重要性。

为了更好地理解顽抗中涉及的分子相互作用并鉴定涉及木质素生物合成/降解的靶基因,本研究利用来自800多种不同毛果杨基因型的重新测序基因组的数据与代谢组学数据(浓度)相结合。代谢物)和热解 - 分子束质谱数据。此外,科学家还使用了其他形式的基因调控,包括共表达,共甲基化和共同进化网络。

在分析这些数据时,一个团队开发了“证据线”(LOEs)评分系统,以整合不同层次的信息,并量化将基因与目标功能联系起来的LOE数量。他们应用这种新的评分系统来量化连接基因与木质素相关基因和网络层表型的LOE。应用评分系统允许产生涉及毛果蝇木质素生物合成的新候选基因的新假设,包括各种AGAMOUS-LIKE基因(一种控制其他基因表达的转录因子)。由此产生的基因组广泛关联研究网络被证明是一种确定多效性(影响多种表型的基因)和上位性(多种基因)的有效方法。它共同影响单个表型)细胞功能的基础关系,因此,复杂表型的分子基础,如顽抗。

CoMet软件中的算法创建了本研究中使用的协同进化网络,后来被移植到新的Summit超级计算机,这是目前世界上最快,最智能的橡树岭领导计算机超级计算机。研究团队使用CoMet软件打破了百亿亿次级的障碍,在分析Summit超级计算机上的基因组数据的同时,实现了比任何先前报道的科学应用更快的1.88 exaops峰值吞吐量。研究团队通过在新的NVIDIA图形处理单元计算机芯片技术(称为张量核心)上使用数值精度的混合,实现了这一壮举,相当于每秒进行近20亿次计算。在这种情况下,研究人员实施了一种新方法,该方法使用张量核心来显着提高性能。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容