中国基因网您的位置:首页 >遗传基因 >

基因匹配可以帮助科学但会引发隐私问题

一个人能从13个小小的DNA片段中真正弄清楚多少人?乍一看,并不多 - 在遗传学领域,13是微不足道的。但是一项新的研究表明,可能足以推断出数十万种标记物,这可能揭示了丰富的遗传信息,斯坦福生物学家在5月15日的“美国国家科学院院刊”上报道。

基因匹配可以帮助科学但会引发隐私问题

这些结果可能有助于促进科学合作,并帮助研究退化或不完整DNA样本的研究人员,例如从野生动物或考古遗址收集的样本,生物学教授诺亚罗森伯格和新论文的高级作者说。

但罗森伯格表示,基于如此少的信息推断这么多的能力也引发了隐私问题。它还表明,遗传学的假设是最近一些法律论据的基础,包括最高法院决定维护有关收集法医DNA的有争议的法律,可能不太正确。

我们基因的模式

新发现基于来自872个人类基因组的两组遗传数据。第一个仅包含13个标记,直到今年才成为FBI法医遗传标记集,联合DNA指数系统或CODIS的基础。(该系统最近升级为包括七个额外的标记,使总数达到20个。)

第二个更广泛的数据集包括642,563个与第一组不重叠的遗传标记。问题是,罗森伯格和他的团队在一个数据集中将一个人的记录与他们在另一个数据集中的记录相匹配的程度如何?换句话说,他们如何才能完全基于第一套法医集来预测第二组遗传标记?

很好,实际上。Rosenberg和团队发现我们的DNA中有足够强大的模式 - 或者至少在他们研究的不同人群的DNA中 - 他们可以匹配90%的记录。如果他们增加了17个法医标记,使总数增加到30个,它们可以匹配两个数据集中99%以上的记录 - 这意味着通过正确的数据库组合,可以推断出丰富的遗传信息基于一小组标记。

预测是隐私的敌人吗?

该团队的结论表明,执法基因测试的执法官员,法院和企业对遗传隐私的思考方式可能存在缺陷。以前,人们一直认为法医DNA收集仅用于将DNA样本与已存在于数据库中的名称相匹配 - 即将犯罪嫌疑人置于犯罪现场 - 并且从根本上无法揭示身份匹配之外的任何信息。

这一假设是最高法院2013年马里兰诉诉King案的决定中的一个关键因素,后者支持该州保留任何在那里被捕的人的DNA做法。大多数人认为,由于CODIS标记不能用于推断私人健康数据或其他特征,因此即使是涉嫌犯罪的人记录这些标记的好处也超过了这些嫌疑人的隐私问题。

同样,基因检测公司23andMe去年在一篇博客文章中指出,他们的数据不太可能对警方有用。他们的数据依赖于一组不同于那些用于法医分析的标记,因此,他们认为,很难将警察记录与他们联系起来。

罗森伯格说,这些论点可能需要重新考虑,因为当同一个人被包含在一个以上的遗传数据库中时,有可能从CODIS数据推断出遗传特征或找到不同DNA标记集的匹配。

好处

除了隐私和法律问题,“还有其他几个地方这个结果是有用的,”罗森伯格说。

“我们使用的方法可以追溯到20世纪60年代,当时计算机科学家和统计学家首先试图找出如何将不同政府,医疗或公司数据库中同一人的记录联系起来,”最近获得博士学位的迈克尔·埃奇说。论文的第一作者。“有趣的是,在遗传学的许多背景下出现了同样类型的问题。”

一个问题是取证标记系统的向后兼容性,这是首先吸引团队解决问题的原因。法医遗传学家所面临的问题通常比简单地匹配概况更难 - 例如,确定一个人的DNA是否存在于犯罪现场的门把手留下的几个人DNA的混合物中。

罗森伯格说,只有13或20个遗传标记,存在大量假阳性标记的风险。使用更大和更现代的标记集会降低误报率,但这会引入另一个问题:可能无法检查与使用迄今为止使用的13种标记收集的数十年配置文件的匹配。

罗森伯格说,新的结果证明了有可能开发出具有新标记集的法医遗传系统,并且仍然能够测试与早期CODIS标记组装的数据库的匹配。

这些发现还可以帮助科学家在不知道他们是否对同一个体进行抽样时填写DNA样本中缺失的细节。例如,当野生动物生物学家想要从难以捉摸的动物中研究DNA时,他们不能总是采集血样。相反,它们通常依赖于头发或散布样本,并且很难判断同一动物是否已被多次采样。从考古遗址收集的古骨中取样DNA时也是如此。罗森伯格说,在这两种情况下,新结果表明可以填补一些缺失的遗传细节。

然后就是“至少两次发生在我身上的情景”,罗森伯格说:数据共享。来自两个实验室的合作者想要在同一个人上共享不同类型的数据并不罕见 - 除了当两个数据集可能具有共同共享但标记的样本时仅仅发送数据并不是那么简单不同。罗森伯格说,原则上,新研究的结果可用于匹配数据集中的条目,使研究协作变得更加容易。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容