中国基因网您的位置:首页 >国外研究 >

使用diaPASEF监测人类蛋白质组

在这次采访中,Hannes Rost博士描述了他的实验室如何使用diaPASEF来监测人一生中的蛋白质组,以及如何使用机器学习来分析数据。

其主要优点是可再现性。数据独立采集允许您在非常大的群组中重复测量单个分析信号。这与数据相关采集不同,在数据相关采集中,您使用随机方法从分析池中提取肽。这就避免了在每个样品中重复采样相同的肽库。

有了数据无关采集,你就可以在每个样本中得到一个特定分析物的定量答案,你就不会有这种在定量数据矩阵中引入缺失值的随机元素,而在数据无关采集中,你经常会观察到缺失值。

timsTOF Pro是一种基于传统Q-TOF架构的新型仪器,同时在分光计前面还有一个捕获离子迁移率装置。这允许我们做两件事:第一,它允许我们在把离子送到分析之前积累一定的时间,第二,它允许我们通过离子迁移率来分离离子。

这意味着离子被聚焦到一个非常窄的离子带,这提高了灵敏度并提供了额外的细胞活性,因为离子将被它们的碰撞截面所分离。

timsTOF Pro采用并行累积串行碎片(PASEF)获取方法,利用捕获的离子迁移率可使测序速度提高10倍。它的基础是利用四极的位置并随着离子移动。

这种测序速度的提高对复杂的蛋白质组非常重要,因为它使我们能够更深入地研究复杂的蛋白质组,并在短时间内获得非常复杂的样本的定量答案。

我们目前正在研究质谱的两大支柱。第一个支柱是新技术的发展,因为我们意识到目前的质谱技术需要改进,然后我们才能解决大规模的问题和我们想要解决的队列规模的类型。

我们花了相当多的时间开发新的软件和新的实验方法,以增加重复性和可扩展性的质谱方法。同时,我们将这些方法应用于我们研究项目的第二个支柱,即个性化医疗。

在这里,我们试图通过一个非常密集的采样装置,纵向跟踪个别病人,这样我们就可以看到病人的生物体液的分子结构在他们的一生中,以及在健康和疾病期间是如何变化的。有了这一点,我们希望了解是什么驱动着从健康状态到疾病状态的转变。

nobeastsofierce |在上面

diaPASEF是一种将离子迁移率成分引入数据无关采集(dia)的新方法。我们目前正在使用diaPASEF分析大的患者队列或大的扰动,这是任何一种个性化医疗方法的系统生物学所需要的。

如果我们能够分析非常大的实验扰动并量化每一个扰动中的分析物,我们就能理解生物系统是如何工作的,它们如何对扰动做出反应,以及信号是如何处理的。

另一方面,如果我们将其应用于个别患者和患者群体,我们可以追踪单个患者在长时间内的分子分布,我们可以了解他们的分子分布如何随着环境和生活方式的改变而改变。最终,我们将能够观察到从健康状态到疾病状态的转变,并更早地进行诊断。

纵向方面是关键,因为它允许我们将个别病人与他们过去的自我进行比较。我们想要摆脱将个体患者与总体平均值进行比较的模式,因为总体平均值可能不如将你当前患病的自我与过去健康的自我进行比较更有意义。

你体内的分析物含量可能是10年前的两倍,这是一个不好的信号,因为这意味着你可能患上了某种疾病。分析物的这个水平可能仍然在总体方差之内,因此将被您当前的医生错过。

是的。机器学习是几年前进入蛋白质组学的一项技术。人们已经将深度学习应用到蛋白质组学和代谢组学中,目的是为了跳过一些非常繁琐和劳动密集的步骤,而这些步骤是我们目前必须进行的数据独立获取。

其中一个步骤是生成光谱或分析文库。我们现在有了第一个迹象,它可能完全预测这些光谱库,这将使我们能够更有效和更直接地挖掘dia数据,而不依赖于之前的实验证据,在之前的实验测量中,通常必须通过数据相关采集来完成。

这使我们可以断开繁琐的连接,我们总是需要做数据相关的采集,然后我们可以做数据无关的采集,我们可以直接进入数据无关的采集数据。

下一个前沿领域将是直接预测碰撞截面值,因为这是挖掘diaPASEF数据所必需的。从我们与马克斯·普朗克研究所的合作中,我们看到这是可能的,我们将很快开始朝这个方向前进。

Zapp2Photo |在上面

我认为目前计算质谱的主要挑战之一,特别是与数据无关的获取,是数据的绝对数量。这在timsTOF Pro上再次爆发了,我们拥有的数据是传统Q-TOF仪器的1000倍。这是因为每个单独的TOF扫描现在被分割成一千个单独的TOF推送,我们可以单独分析。

这对我们的算法来说是一个巨大的挑战,但同时也需要解释如此庞大的数据量。目前,我们记录的数据比我们能够解释的数据多得多,因此我们希望利用全部数据,而不仅仅是一小部分数据。

我认为数据无关获取的第二个挑战是,因为我们使用的是一种获取大量数据的方法,我们需要有一种方法来反卷积这些数据,并将单个前体跟踪与其片段离子跟踪分配回一起。这在我们把离子迁移率作为分离技术之前是不可能的。

它更大是因为在以前的所有方法中,我们使用单个的TOF推力将它们平均到一个光谱中,而现在每个TOF推力都与离子迁移率有关。我们曾经采取了大约1000个单独的测量,然后平均成一个测量,这使我们能够压缩数据。

现在,每一个单独的TOF推力都与离子迁移有关,这意味着我们需要保留这些信息,我们不能再简单地合并数据了。这意味着我们有更多的信息,但也有大量的数据分析的挑战。

在我们的研究团队中,我们非常重视开发开源软件。其中一个主要原因是透明度。我们希望人们能够准确地理解和再现他们的数据所发生的事情,而这只有在开源软件中才能做到。

只有使用开放源码软件,您才能读取操作数据的代码,以便理解如何从原始数据文件转换到特定的输出定量值。

第二个原因是围绕我们正在生产的软件发展数据独立的获取社区。通过使软件对开发人员开放和可用,它允许我们创建一个开发人员社区,利用我们的算法并在其上构建一些东西。

我们不是在我们个人的竖井里工作,并试图保护我们的研究,而是努力使它尽可能开放,并对社区可用,以便其他人可以使用它并在其基础上进行开发。

目前,我们在计算质谱分析方面还面临着一些挑战。其中一项挑战是解释需要获得由质谱仪记录的全部信息的个别数据集。

我还认为我们需要进入数据采集的第二个维度,即样本的数量。我们需要能够重复地进行这类分析,这样我们在单次运行中为分析物找到的定量值就可以为每个病人找到。这是我们仍然需要全新的算法的东西,为了让它工作,为了克服批量效应。

Hannes Rost是多伦多大学Rost实验室的首席研究员。Rost在苏黎世联邦理工学院Ruedi Aebersold教授的实验室完成了他的博士学位,在那里他开发了新的计算方法来分析基于质谱的蛋白质组学数据。这项工作使研究人员能够将目标蛋白质组学实验的产量提高100倍,并增加可在单个研究中分析的样本数量。

在他目前的工作中,Rost和他的团队开发了新的质谱仪方法来获得高度定量的蛋白质组学和代谢组学数据矩阵,并使用这些定量数据来解决系统生物学和个性化医学中的问题。

赞助内容策略:News-Medical.net发布的文章和相关内容可能来自于我们现有的商业关系,前提是这些内容为News-Medical的核心编辑理念增加了价值。网站旨在教育和告知对医学研究、科学、医疗器械和治疗感兴趣的网站访问者。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容