第一个微生物专家来自数千篇论文

虽然最近的报告显示存在超过114,000,000份已发表的科学文献的文件，但找到一种方法来改善对这种知识的获取并有效地综合它成为一个日益紧迫的问题。

为了解决这个问题，英国科学家Ross Mounce和剑桥大学的Peter Murray-Rust以及巴斯大学的Matthew Wills使用公布的人物图像中的机器专门提取的数据进行了世界上第一次自动化超级建筑的尝试。他们的研究结果发表在开放科学期刊Research Ideas and Outcomes(RIO)上。

在他们的研究中，研究人员选择了国际系统学和进化微生物学杂志(IJSEM) - 唯一一个托管所有新的有效描述的原核分类群的存储库，因此，它是测试自动和半自动合成系统的最佳选择。已发表的系统发育。据作者称，IJSEM每年发布的系统发育树图像数量超过任何其他期刊。

系统地下载了可追溯到2003年1月的11年篇文章，以便提取系统发育树形图的所有图像文件进行分析。然后，计算机视觉技术允许将图像自动转换回可重复使用的，可计算的系统发育数据，并用于所有证据的正式超树合成。

在他们的研究过程中，科学家们必须克服版权所带来的各种挑战，正式涵盖他们为工作目的所需的几乎所有文件。在这一点上，他们面临着一个相当矛盾的问题 - 虽然科学文献中出版的数据的易于访问和重复使用得到普遍支持和强烈推动，但是通用版权实践使得科学家在将先前编译的数据合并到自己的数据时很难有信心。工作。作者讨论了英国版权法的最新变化，这些变化使他们的工作能够看到光明的一天。因此，他们将其输出作为事实提供，并使用Creative Commons的CC0豁免将其分配到公共领域，以使任何人无忧无虑地重复使用。

“我们现在处于这样一个阶段：没有人有时间阅读所有已发表论文的标题，更不用说摘要了，”作者评论道。

“我们相信机器现在必不可少，使我们能够理解已发表科学的流程，本文还讨论了实现这一目标所固有的几个关键问题。”

“我们故意选择文献的一个小节(限于一个期刊)来减少体积，速度和变化，主要集中在有效性上。我们要问，从半结构化科学文献中提取数据的高通量机器是否可行和有价值。 “

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如有侵权行为，请第一时间联系我们修改或删除，多谢。