首页 » 健康城市 >

犯罪现场的DNA分析助推了隐私问题

2020-02-11 13:04:48来源:

今天发表了两篇论文1,2,提出了遗传侦查技术,该技术导致今年臭名昭著的金州杀手案的一名嫌疑人被捕。

研究得出的结论是,很快就能在犯罪现场的DNA中搜索与几乎所有欧洲裔美国人的链接,同时大大扩展现有法医遗传数据库的潜在覆盖范围。研究人员说,结果还引发了紧急的隐私问题。

领导这项研究之一的以色列耶鲁达市消费者遗传学公司MyHeritage首席科学官,纽约哥伦比亚大学的计算遗传学家Yaniv Erlich说,“尽早进行讨论很重要”。科学1。

收集信息

从1970年代中期到1980年代后期,在加利福尼亚发生的一系列入室盗窃,性侵犯和谋杀案是由于一个名不见经传的人被称为“金州杀手”或“东部地区强奸犯”。案件变得寒冷,但在2018年4月,警察逮捕了名叫Joseph Joseph DeAngelo的犯罪嫌疑人。他被确定为犯罪嫌疑人,部分原因是将犯罪现场的DNA与他的远亲在遗传学网站GEDmatch上发布的遗传图谱相匹配,该网站允许人们上传从消费者遗传公司获得的遗传图谱以寻找亲戚。

“金州杀手”案不是警察通过亲属DNA逮捕嫌犯的第一例。但是它的高知名度,再加上消费者遗传学测试的迅猛增长,导致了大量类似的研究。在2018年4月至2018年8月之间,使用这种技术解决了十几起案件,这被称为远程家族搜索。

Erlich小组(先前已显示3可以在公共数据库中识别匿名DNA样本)开始测量远程家族搜索的范围。结合了此类基因搜索的许多刑事案件都使用GEDmatch,其中包含大约100万人的DNA档案。

为了研究这些搜索的潜力,Erlich团队分析了来自128万个MyHeritage客户的匿名匿名DNA档案。像其他消费者遗传学公司一样,该公司允许客户搜索共享从共同祖先(例如曾曾祖父母)继承的DNA片段的亲戚。

Erlich团队发现MyHeritage客户中有60%在其数据库中有一个堂兄或近亲。搜索30个随机选择的GEDmatch配置文件,发现该数据库中的相对匹配率相似。

但是这种基因数据库有潜力识别出更多不在其中的人。例如,DeAngelo不在GEDmatch上;侦探利用他的第三位表亲的档案找到了他。Erlich小组估计,一个包含300万欧洲裔美国人遗传图谱的数据库,可以使用公共家谱记录对90%的这一人口统计特征进行识别。

(消费者遗传学客户绝大多数是欧洲血统,与法医数据库形成鲜明对比,法医数据库中的少数族裔人数往往过多,几乎所有使用GEDmatch解决的案例都涉及欧洲血统。)

GEDmatch共同管理人Curtis Rogers说,GEDmatch数据库目前正以每天1000-2000个配置文件的速度增长,并将在未来几年内达到该阈值。

此类搜索涉及大量侦探工作。金州杀手调查的全部细节尚未透露,但在关注DeAngelo之前,调查人员筛选了数十人(甚至数百人),包括他的一些近亲。

为了了解他们是否可以在数据库中查找不到的人,Erlich和他的团队着手确定一名来自犹他州的匿名妇女,该妇女将自己的DNA公开作为名为1000个基因组的基因组计划的一部分。在2013年的论文3中,研究小组使用将Y染色体序列与姓氏联系起来的数据库,确定了女性丈夫的身份(该丈夫也将其DNA捐赠给了该项目)。

为了找到男方妻子,研究小组将她的1000个基因组概况上传到GEDmatch,并在数据库中搜索了远亲。在拥有与犹他州妇女相同的DNA来暗示他们在过去的几代人中共有祖先的人们中,两个人(来自北达科他州和怀俄明州)也具有足够的公共家谱信息以缩小搜索范围。经过一天的研究,其中包括排除数百名后裔,最终确定了这位犹他州妇女。

Erlich小组联系了与1000个基因组计划数据库有关的美国国立卫生研究院,以告知该小组已确定了参与者。该论文未提及该名女子,研究人员也未试图与其联系。

点检信息

识别和逮捕DeAngelo的原因仅在于保留了犯罪现场的DNA。这使法医科学家可以使用现代技术将其与遗传材料进行比较,该技术可以确定整个基因组中数十万个DNA变体或单核苷酸多态性(SNP)的序列。这与消费者遗传学测试和许多生物医学研究中使用的基因分型方法相同。

但是,在过去的几十年中,大多数犯罪现场的DNA样本已使用一种技术来进行分析,该技术可确定十几个“荣荣串联重复序列”的序列。其长度因人而异。FBI联合DNA索引系统(CODIS)在其计算机数据库中拥有超过1300万个此类配置文件。

这些使法医科学家能够确定个体的遗传特征,并且相对容易从高度降解的样本(例如血斑)中生成。加利福尼亚州斯坦福大学的人口遗传学家诺亚·罗森伯格说,但是这种情况不太适合亲戚。他们没有像基于100万个变体的SNP分析一样确定祖先和相关性的分辨率,而且在家族搜索中假阳性很常见。

为了避免这个问题,Rosenberg小组开发了一种计算方法,以使CODIS简图与近乎相对的SNP简图交叉匹配(大多数消费者遗传公司使用此测试,可用于搜索GEDmatch)。该方法利用了DNA大块继承的事实,并且有可能识别出倾向于在特定短串联重复序列的同一DNA块上向下传递的SNP序列。

迄今为止,该方法只能匹配一级亲属或兄弟姐妹或父母及其子女。模拟表明,使用短串联重复序列进行基因分型的人中约有三分之一可以正确匹配使用SNP进行的一级相对基因分型(反之亦然)。Rosenberg说,这可能使无法从犯罪现场资料中生成SNP配置文件的调查人员在数据库(例如GEDmatch)中寻找与CODIS配置文件匹配的内容,反之亦然。他的团队研究出现在Cell2中。

增长趋势

与金州杀手案相似的法医家谱研究势必会增长。位于弗吉尼亚州雷斯顿的法医DNA公司Parabon NanoLabs参与了许多此类调查,现在向研究人员推销该服务,并且正在处理数十个案件。

加利福尼亚旧金山州立大学的统计遗传学家罗里·罗尔夫斯(Rori Rohlfs)说,围绕此类搜索缺乏监管的情况令人震惊,他撰写了有关家庭搜索的伦理学的文章。她可以想象决策者会限制执法机构何时以及如何使用GEDmatch之类的公共数据库。

一些这样的限制已经存在。例如,在加利福尼亚州,执法取证数据库只能用于存在严重危害公共安全风险的严重犯罪中寻找家庭成员,家谱调查小组必须与从事案件工作的当地侦探区分开来。

Erlich辩称,技术可以保护人们免受不必要的搜索。消费者遗传学公司通常允许客户下载数据并将其发布在第三方数据库(例如GEDmatch)上。Erlich说,消费者遗传公司可以在这些文件中包含数字签名,从而使GEDmatch能够将其与调查员上传的犯罪现场个人资料区分开来,从而保护了消费者免于搜索。

但是,Rohlfs指出,GEDmatch迄今未做出任何努力阻止调查,并已更新其服务条款以指示执法机构可以使用该数据库。她说:“对我来说,GEDmatch想要防止这种使用并不明显。”

罗杰斯说,GEDmatch没有计划限制执法人员访问该网站-“在发生金州杀手案之后,该网站更新了其服务条款以明确警告用户调查人员可以使用该网站”,他担心监管使用会干扰网站存在的理由:帮助人们找到亲戚。他说:“不要以为任何人的隐私都受到侵犯。”“人们应该能够控制自己的DNA,而不是政府。” / p>

位于加利福尼亚塞巴斯托波尔的DNA Doe项目联合执行主任Colleen Fitzpatrick曾使用家族搜索来帮助解决许多失踪人员案件,他说调查人员从这些搜索中收集到的信息与其他线索有很大不同“因此,不应有任何区别”。

她说:“对我们生活中所做的任何事情的透露都会揭示有关他人的信息。”“在邻居酒吧打架的当晚报告我哥哥黑眼睛回家,就像在Facebook上贴上一张贴有我祖母名字的照片一样,向右派人士透露。” / p>

自然562,315-316(2018)