中国基因网您的位置:首页 >企业新闻 >

深度学习模型从氨基酸序列预测蛋白质结构

哈佛医学院的一位科学家利用深度学习来预测任何基于氨基酸序列的蛋白质的三维结构。在今天发表在Cell Systems上的一篇论文中,系统生物学家Mohammed AlQuraishi详细介绍了一种计算确定蛋白质结构的新方法,他说,实现了与当前最先进方法相当的精确度,但速度提高了一百万倍。

深度学习模型从氨基酸序列预测蛋白质结构

“蛋白质折叠一直是生物化学家在过去半个世纪中最重要的问题之一,这种方法代表了应对这一挑战的一种全新方式,”AlQuraishi说。“我们现在有一个全新的远景来探索蛋白质折叠,我想我们刚刚开始划伤表面。”

虽然非常成功,但使用物理工具识别蛋白质结构的过程既昂贵又耗时,即使使用低温电子显微镜等现代技术也是如此。因此,绝大多数蛋白质结构 - 以及致病突变对这些结构的影响 - 仍然很大程度上未知。

对于每种氨基酸,该模型预测将氨基酸与其邻居连接的化学键的最可能角度。它还预测围绕这些键的旋转角度,这会影响蛋白质的任何局部区域与整个结构的几何关系。AlQuraishi的深度学习模型,称为复发几何网络,侧重于蛋白质折叠的关键特征。但在它可以进行新的预测之前,必须使用先前确定的序列和结构进行训练。

这是重复进行的,每次计算都通过每个其他氨基酸的相对位置进行通知和改进。一旦整个结构完成,模型通过将其与蛋白质的“基础事实”结构进行比较来检查其预测的准确性。对于数千种已知蛋白质,重复整个过程,模型学习并在每次迭代时提高其准确性。

为了帮助其他人参与方法开发,AlQuraishi通过GitHub软件共享平台免费提供他的软件和结果。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容