上周,金州杀手嫌疑犯的被捕让很多人措手不及。在侦探能够通过 DNA 追踪到这名连环强奸犯和杀人犯之前,许多人并没有认真考虑过将自己的基因材料交给私人公司的后果。现在,这位(再次被怀疑,但未被定罪)金州杀手表亲的数据据称能够帮助破解这起长期悬案,人们不得不开始问自己,他们和其他人到底愿意以 DNA 样本的形式向公司提供多少信息(更不用说 Facebook 了)。他们应该给多少? 历史上 DNA 追踪失败的例子比比皆是。以一名幽灵女连环杀手为例,她的基因物质出现在欧洲数十个犯罪现场。基因匹配非常一致,警方确信她一定是个杀人无数的女凶手。事实上,DNA 之所以如此完美匹配,是因为它属于一名在棉签工厂工作的女性,警方从这家工厂获得棉签(棉签未经认证,无法用于 DNA 采集——哎呀!)。 休斯顿一名男子因 DNA 证据似乎将他与强奸案联系起来而被判入狱四年。直到他的母亲看到一份关于犯罪实验室分析错误的报告后,一名律师才重新评估了数据,并意识到技术人员在分析样本时犯了根本性错误。 这并不是说涉嫌谋杀的凶手是无辜的;他将接受审判,由陪审团评估手头的证据。网上基因组共享很可能帮助将一名凶残的强奸犯和杀人犯绳之以法。但这则新闻提醒我们,DNA 分析是一种笨重的工具,而且越来越受欢迎、便宜且方便使用。 但对许多人来说,这则消息最令人惊讶,因为它表明消费者 DNA 测试能够揭示你的血统真相。不同的 DNA 测试套件可能会(甚至很有可能)在种族和血统方面得到不同的结果。那么这有什么不同呢? 首先,介绍一下 DNA 检测的工作原理造成这种困惑的部分原因在于,人们不了解遗传学家在分析你的 DNA 时真正关注的是什么。大多数方法都依赖于一种叫做 SNP 的东西(稍后会详细介绍),但寻找祖先和确定直系亲属之间的区别在于你如何处理这些 SNP。并非每家公司都会同时追踪直系亲属和远亲族谱,但 Ancestry 等公司会这样做——他们会追踪你的潜在远亲,并提供你的远古祖先可能来自哪里的摘要。 “当您将样本寄给我们时,第一步是从脸颊细胞中提取 DNA,以便我们对其进行基因分型。DNA 包含大约 30 亿个字母,但我们要查看 70 万个特定位置,我们知道这些位置在人与人之间是不同的,”Ancestry 的人口遗传学家 Julie Granka 说道。 这些特定位置被称为 SNP,即单核苷酸多态性。当你的身体在制造新细胞时复制 DNA 时,机器经常会犯一些错误。大多数重大错误都会被捕获。如果关键蛋白质的密码被搞乱,该细胞通常就无法存活,而且你有一些拼写检查蛋白质可以修复错误。但很容易在单个位置上出现错误。 您的 DNA 由核苷酸组成,科学家将其称为 A、T、C 和 G(腺苷、酪氨酸、胞嘧啶和鸟嘌呤),它们相互配对。只要一条 DNA 链上有 A,那么与之匹配的那条链上就应该有 T,C 和 G 也是如此。偶尔,复制链的蛋白质会意外地将错误的核苷酸插入 DNA 中并不重要的区域。也许它根本不编码任何东西(您的大多数 DNA 都没有!),或者它可能是一个足够小的错误,不会改变细胞的功能。这就是 SNP:单个位置的单个变化。 一些 SNP 会导致疾病,但出于基因检测的目的,我们只关注良性位点。 由于这些 SNP 对细胞功能没有影响,因此它们不会被固定下来。它们会代代相传。因此,如果一千年前英国的一个人在 3455 位置上获得了一个由 A 变为 C 的 SNP,那么这个人的许多后代都会拥有完全相同的 SNP。更重要的是,由于可能出现 SNP 的位置有数十亿个,因此 SNP 是独一无二的。如果您在 3455 位置上有一个 A 到 C 的 SNP,那么您的祖先很有可能来自英国。如果不是,这并不意味着您不是来自英国——这只意味着您没有那个特定的标记。 由于您可能与近亲共享大量 SNP,因此 Ancestry 等公司可以使用相同的 SNP 数据来查明谁可能是您的表亲(只要该人在他们的数据库中)。因此,在某种程度上,大部分基因检测只是基于您与其他人共享的 DNA 百分比(由 SNP 估计)。但情况比这要复杂一些。 血统测试和家族测试有着根本的不同,但也存在着奇怪的相似之处23andMe 和 Ancestry 等公司拥有大量 SNP 数据库,这些 SNP 可追溯到世界某些地区。当他们分析您的样本时,他们会将您的 SNP 组与他们的数据库进行比较,然后使用匹配结果确定您的祖先可能来自哪些地区。 但这个过程并不完美。Granka 解释说,你的家谱信息基于统计模型。它可以告诉你你可能来自哪里,但仅此而已。Ancestry 和该领域的其他公司一样,建立了一个参考人群数据库。不过,你的结果直接反映了该公司使用的参考人群,这就是你会得到不同答案的原因。 这意味着您的所有祖先数据大多是估算值。这就是为什么公司会为您的结果附加一个置信区间。他们可能会说您有 48% 的东欧血统,但他们对这个结果的把握在 30% 到 80% 之间。大多数人只关注 48%,而忘记了结果并非确定的。但这一点再怎么强调也不为过:所有祖先结果都基于一个模型,而该模型可能是错误的。公司正在使用尖端科学方法来确定哪些参考人群来自世界哪些地区,但这始终是基于假设和估计。 另一方面,家谱测试则更为直接。“我们正在寻找与数据库中其他人相匹配的你的基因链,”格兰卡说。“相同的基因链来自共同的祖先。”因此,如果 A 和 B 的 DNA 有大约 12.5% 是相同的——即完全相同——我们可以说 A 和 B 有共同的祖父母。如果 C 和 D 的 DNA 有 50% 是相同的,那么这些人要么是父母和孩子,要么是两个亲兄弟姐妹。 发现区别了吗?血统测试基于一个可能存在缺陷的模型,而家谱则是纯数学。 问题不在于你向公司提供了多少信息我们都提供了多少信息?这就是我们所有人提供的信息量。据称,金州杀手之所以没有被抓获,是因为他交出了自己的 DNA。他的一个表亲将自己的DNA 上传到一个免费的业余网站上,该网站允许用户使用完整的基因组序列来寻找亲属——他可能是从某种付费服务中获得的。一些公司,如 23andMe 和 Ancestry,允许客户下载他们的原始数据,然后他们可以将其上传到其他网站。 部分原因是,正是由于 GEDmatch(这位表亲使用的网站)等公司的存在,我们才如此迅速地遇到了与 DNA 相关的隐私问题。Ancestry 和 23andMe 等公司历来拒绝执法部门的请求,也许是因为他们知道消费者不会愿意将自己的 DNA 交给一家可能会将这些数据交给警方的公司。但这并不是说他们能够抵抗法院命令。 更重要的是,这甚至与你个人交出什么无关。如果有足够多的人提供他们的 DNA,理论上,公司或执法部门可以开始为其他人建立档案,就像 Facebook 可以拥有不在 Facebook 上的人的档案一样。当你交出你的基因数据时,你就永远交出了它。没有人能告诉你这对你个人来说是否是个好主意,但你应该仔细考虑潜在的后果——尤其是如果这一切都是为了估算的话。 如果侦探、律师,当然还有犯罪实验室技术人员已经利用我们掌握的少量 DNA 证据犯错,想想他们利用整个数据库还会犯多少错误。甚至连金州杀手都差点被误认——俄勒冈州一家法院强迫一名 73 岁的男子提供 DNA 样本,当时侦探声称他们有证据表明他是 2017 年的连环杀手。错误总是会发生。DNA 并非万无一失,我们最好记住这一点。是的,将您的全基因组提供给免费网站可以帮助您找到失散多年的亲人。它甚至可以帮助逮捕危险的罪犯。但它也可能让您的一个表亲因他们没有犯下的罪行而被传唤。 注意:本文的早期版本错误地将 DNA 碱基对称为“氨基酸”。当然,它们不是氨基酸,作者要感谢 Twitter 让她保持诚实和准确。 |
机械人:柯罗诺斯的大复仇 (音乐片段:战场的回忆) 1987年3月30日,东芝EMI发售的OVA《机...
《天空大魔境》:超越异世界与现实界限的宏大故事《天国的大魔境》是一部改编自石黑正和原作漫画的电视动画...
还有什么比深海“暴风雪”中翻腾的巨大幻影水母更梦幻的吗?这取决于个人喜好。也许你会更喜欢像红外传感器...
如果让老鼠在独自吃巧克力和拯救同伴之间做出选择,它们显然会选择拯救同伴,然后与同伴分享巧克力。将老鼠...
当您从计算机中删除文件时,它不会立即消失 - 至少不会立即消失。即使您立即清空回收站或垃圾文件夹,删...
Degoo Premium:终身 10TB 备份计划可帮助确保各种设备上的照片、视频和文件安全加密,...
《没关系》——《大家的歌》中的感人故事《没关系》是一部短篇动画电影,于 2019 年 6 月作为 N...
宇宙騎士 宇宙假面骑士 剑 - 宇宙騎士 宇宙假面骑士 剑1992年至1993年播出的电视动画《宇宙...
对于许多汽车爱好者来说,电动汽车有一个不幸的污名,即没有灵魂。它们的环保品牌和安静的运行音量,甚至会...
Kero Zero 出发啦!大家集合!! ■ 公共媒体剧院■ 原创媒体漫画■ 发布日期2009 年...
切尔诺贝利 4 号反应堆发生灾难性故障并向欧洲各地喷出放射性尘埃,距今已有 35 年。尽管当局已尽最...
电影《面包超人:我们是英雄》的魅力与评价1997年7月26日上映的《面包超人:我们是英雄》是面包超人...
“我被带到富家女学校当‘平民样本’”——一部关于平民和富家女的独特喜剧《我转生到了富家女学校当平民样...
告别青春大家的歌-Saraba Seishun-的详细评论和推荐概述《再见青春大家的歌》是一部时长只...
《神秘法则》:灵魂与情感的深刻旅程2012年10月6日上映的动画电影《魔法法则》以其独特的题材、史诗...