政府的这些努力能够破解 DNA 存储的密码吗?

政府的这些努力能够破解 DNA 存储的密码吗?

在《实力悬殊》中,我们仔细研究了国防工业的核心科学和技术——士兵和间谍的世界。

犹他州布拉夫代尔的城镇口号是“生命相连”。这既平淡无奇又十分普遍——这两个词是如此平淡无奇和普遍,以至于这两个词也是科罗拉多州一位治疗师的口号和 BBC 科技专栏的标题。然而,在瓦萨奇山脉阴影下的布拉夫代尔,这两个词的含义略有不同。因为这个地方是代号为“Bumblehive”的设施所在地。

一个设施有别名这一事实无疑透露了一些关于其性质的信息。Bumblehive 的正式名称是犹他州数据中心。它隶属于国家情报总监办公室(美国官方间谍机构的中央组织),并为臭名昭著的国家安全局存储数据。“如果你没有什么可隐瞒的,”Bumblehive 前面的一块标语不祥地写道,“你就没有什么可怕的。”

围栏外的人并不知道 数据存储在这座占地 100 万平方英尺的设施内,但据估计其规模已达到 EB 级。1EB 相当于约 3300 亿首泰勒·斯威夫特的歌曲。

显然,也存在争议的是,间谍组织并不是唯一对保存大量信息有重大兴趣的群体。想想看,谷歌、微软、亚马逊和 Facebook(以及他们的伙伴)为了运行互联网以及为了知道向你推销哪些奇怪的 T 恤而必须存储的所有信息。例如,Facebook 正在扩建位于德克萨斯州的一座工厂,该工厂今年完工后将占地 260 万平方英尺,占地面积 150 英亩,耗资约 15 亿美元。

没人希望把所有空间浪费在嗡嗡作响的服务器、冷却系统和耗费大量电力和金钱的无聊建筑上。尤其如此,因为这些存储方法最终可能会过时。

如果不用构建任何类型的蜂巢,而是将所有信息放在你的手中,并且以一种不会降解、不会过时、也不会让你破产的形式,那会怎样?

情报界希望弄清楚如何将这个几乎可笑的愿景变成现实。他们希望与私营部门的数据大亨分享他们的解决方案。为了实现这一目标,对于间谍和企业来说,情报高级研究计划署 (IARPA [IC 的 DARPA,如果你想要更多缩写]) 目前正在开展一项为期四年的项目,名为分子信息存储 (MIST)。2019 年授予两个团队的合同总额约为 4800 万美元。

MIST 的目标是利用一种生物存储形式:DNA。基因序列可以在一个肉眼无法看见的封装中对整个人类进行编码,这比芯片或 CD 的效果好得多。就像计算机使用 0 和 1 来表示图片、图像和文档一样,构成 DNA 的核苷酸碱基——腺嘌呤 (A)、胞嘧啶 (C)、鸟嘌呤 (G) 和胸腺嘧啶 (T)——也可以代表相同的信息。每个 A、C、G 或 T 都具有新的编码含义。

DNA 存储也非常高效:人类的所有知识(比如它本身,以及是否可以测量的知识)都可以存储在 DNA 的小房间里,而将这些信息存储在磁带上则需要数百万英亩的土地。此外,正如侏罗纪公园所证明的那样:DNA 的保存时间比磁带、CD(RIP)或闪存驱动器长得多。而所有这些都是 IARPA 感兴趣的。

像 IARPA 这样的研发机构承担着高风险高回报的挑战,而这些挑战的结果对其他组织来说可能太不确定了。他们恰当而自鸣得意地称,将整个犹他州数据中心安装在桌面上这样的问题为“IARPA 难题”。

尽管如此,你不会轻易浏览包含整个维基百科的双螺旋桌面(是吗?)。这是因为它仍然不够实用,也不够便宜——这是 MIST 想要改变的两个方面。

如果 MIST 成功,那么如今的一些大数据仓库有朝一日可能就只是一堆双螺旋结构。该项目理想情况下将生产出一个原型系统,该系统可以将 1TB 的数据编码到 DNA 中,并在 24 小时内从 DNA 中提取 10TB 的数据,成本不到 1,000 美元,耗电量不到 1 千瓦。

IARPA 的计划旨在为学术研究和商业行业注入一剂强心针——推动他们朝着符合情报界利益的目标前进,同时满足他们的求知欲和未来的收入。如果 MIST 取得成功,它既可以向私营部门展示潜在的大客户(间谍)的兴趣,也可以展示其他公司可以借鉴的成功经验。

两个团队(一个由布罗德研究所领导,另一个由佐治亚理工学院研究所领导)赢得了合同,试图让这种 DNA 数据存储不只是一个巧妙的技巧,而是让每个人都能过上互联的生活。

数据的增长速度超过了人们创建经济高效存储的能力,这意味着一些信息最终会被扔进垃圾桶。“任何拥有大量数据存储负担的人都会遇到这个问题,”MIST 项目经理 David Markowitz 表示。虽然没有人确切知道,但他估计全球每年产生约 30 ZB 的数据。“1 ZB 有 1,000 EB,”他说,“这意味着我们生产的新磁带只能存档每年产生的数据的 0.3%,即使我们想保留,超过 99% 的新数据也无法保留。”

佐治亚理工学院研究所开发了一种用于培养 DNA 链的微芯片,可以以极低的成本提供高密度 3D 档案数据存储。DNA 生长的微孔深度只有几百纳米,可以反射照片中特定颜色的光。GTRI 的 Sean McNeil

情报机构自然对捕获和保存这些信息有着极大的兴趣。“你并不总是能提前知道哪些数据对解决谜团最有用,”马科维茨说。“谁应该为未来发生的一些事件负责?”解开这种时间扭曲需要大海捞针,而且马科维茨说,通常需要“挖掘大量历史数据”。

利用 DNA 来保存DNA的想法可以追溯到几十年前,当时只是一个假设。1988 年,一位名叫乔·戴维斯 (Joe Davis) 的艺术家(在哈佛大学的助手的帮助下)创作了一件名为“微静脉”的作品。他在大肠杆菌的核苷酸中嵌入了一个 35 位图像,显示了一个古老的日耳曼字符,意思是“女性地球”。

戴维斯现在是哈佛大学科学家乔治·丘奇实验室的一名研究员(乔治·丘奇是基因编辑领域的先驱,目前正在尝试复活猛犸象)。2011 年,丘奇将一本书(谦虚地说,是他合著的一本书)的 700 千字节内容嵌入 DNA 中,第二年,他又开展了一个类似的项目,添加了图像和 JavaScript 代码。2013 年,欧洲生物信息学研究所的研究人员证明,他们可以将超过 625 千字节的内容编码到 DNA 中,而且几乎没有错误。

作为 MIST 的一部分,致力于解决该问题的两个团队之一由佐治亚理工学院领导,其他团队还包括 Twist Bioscience、Roswell Biotechnologies 和与微软合作的华盛顿大学。该团队将其解决方案称为 SMASH:可扩展分子档案软件和硬件。

一旦 SMASH 被召唤出来,它将像这样工作:软件将信息翻译成基因序列,输出代表数据的 A、G、C 和 T 字符串。然后,计算机将这些字母串发送到半导体芯片——本质上是指示 DNA 碱基以何种顺序构建的指令。

该芯片上布满了微型孔,每个孔只有几百纳米深。每个孔都是一个小型 DNA 合成器,能够根据指令逐个碱基地生成基因序列。每个孔都并行构建序列,就像母鸡挨着母鸡下蛋一样。一旦一组 DNA 链完成,它就会被冲洗成液滴——就像一个信息密集的 Hershey's kiss。它可以湿着放着,也可以干着放着长期保存。

为了从 DNA提取信息,测序芯片会测量单个 GATTACA 分子的电子指纹。然后科学家只需对 DNA 进行逆向解码,将字符串按正确顺序排列,并纠正错误。

瞧!将来,农民年鉴档案可能会这样被搁置,然后再次被拿走。

另一个 MIST 团队由布罗德研究所牵头,与哈佛大学和 DNA Script 公司合作。项目负责人罗伯特·尼科尔说:“我们希望拥有足够高吞吐量的系统,这样你就可以开始部署它们并存档数据,这些数据可能不是你需要每天访问但你肯定想保留的数据。”他举了一个无关紧要的例子,那就是体育。“每场棒球比赛的吞吐量都非常高,”他说。“整个体育场都有非常高清的摄像机。”捕捉每一个球员、每一个观众。也许,20 年后,人们会想要观看观众对退役巨星的超级热门歌曲的反应的视频。

当然,IARPA 不太可能获得大满贯。

这两个项目都还未完全投入运行,但官员们希望在 MIST 项目结束前(即几年后)它们能够完全投入运行。为了弄清其运行情况,IARPA 聘请了测试和评估合作伙伴:拥有相关专业知识的外部组织,他们制定了一套评判新技术的标准。

对于 MIST 来说,合作伙伴之一是洛斯阿拉莫斯国家实验室。在那里,由 Tracy Erkkila 领导的团队为参赛团队编写测试,然后创建答案。在实验室里,他们自己将文件编码成电子 DNA 档案。然后,参赛团队必须将该档案重新写入 DNA。“他们基本上会为我们提供一堆液态 DNA,”Erkkila 说。评估人员随后将通过测序读取他们的液态 DNA 堆。然后他们对结果进行评分,寻找翻译错误。实验室还尝试将该 DNA 解码回原始编码信息。

尽管埃尔基拉不能透露太多有关该测试的细节(这就像是一名高年级学生将一份十年级的旧测验发给一名刚入学的二年级学生),但他表示,该测试包括视频、音频、哈勃太空望远镜拍摄的图片(因为他表示,“我们非常喜欢其中的一些图像”),以及一个名为“斯坦福兔子”的兔子雕像的 3D 模型。

事实上,动物正是埃尔基拉寻求 DNA 数据存储可能性的原因之一。他说,想象一下你是一名野生动物研究员,你想在偏远的阿拉斯加安装一台摄像机。“我想连续两年记录,”他说。“你要如何存储这些信息?”至于间谍为何想要拥有掌握海量数据的能力,他没有透露。

不过,将 DNA 合成器放在冰川上将是一个很好的妙语。

DNA 数据存储不再是玩笑,即使它曾经是。当 Markowitz 在 2016 年首次开始探索 DNA 是否适合情报界的数据时,这个想法并不受欢迎。“在 DNA 领域工作的少数人会在会议上站起来谈论它,他们会被嘲笑,”他说。“真的。来自传统存储行业的人。”

相比之下,如今 DNA 数据存储联盟(一个行业和学术合作组织)拥有数十家成员,包括 IBM、戴尔和微软。马科维茨说:“现在没人再笑了。”

如果真是这样,那么马尔科蒂兹也许会在 50 年后回顾这一切,因为他保留了那次会议以及其他每一次会议的记录,成绩都是 A、G、C 和 T,然后自己也会得意洋洋地笑。

我们希望您喜欢“Overmatched”,这是一篇探讨政府资助的研究如何改变日常生活的新专栏。请继续关注 PopSci+ 以了解后续文章。

<<:  在爱达荷州的这个湖泊深处,美国海军正在测试其潜艇技术

>>:  苹果将​​俄罗斯最大社交网络 VKontakte 从 App Store 下架

推荐阅读

为家庭影院添加环绕声的三种选择

大多数节目和电影都采用 360 度音频播放,而你那弱小的电视扬声器无法处理。为了充分体验每一次轮胎的...

双胞胎研究对科学和 NASA 如此重要的原因

今天晚些时候,斯科特·凯利返回地球,此前他已在太空中连续待了 340 天(这是美国人中待的时间最长的...

阿拉斯加偏远空军基地将拥有自己的核反应堆

8 月 31 日,美国空军宣布,一家名为 Oklo 的加州公司将在阿拉斯加州的艾尔森空军基地设计、建...

手纸蜂学园的魅力与评价:动漫迷必看的校园故事

手纸学园 - 一部具有独特世界观和幽默感的短篇动画《手纸蜂学园》是改编自浅田宏之的人气漫画《手纸蜂》...

2010 年度 100 项最佳创新一网打尽

又到了年终总结的时候了。在 PopSci,我们扩大了 2010 年榜单的范围,将各种类别的标志性创新...

《Miru Tights》评论:引人入胜的故事和深刻的人物

“Miru Tights” - 用紧身衣点缀的青春岁月《Miru Tights》是2019年5月11...

匿名怪谈 2023 #2:带你进入恐惧深渊的鬼故事动漫的评论和印象

Nanashi Kaidan - Nanashi Kaidan 综合评价和推荐概述《无话怪谈》于 2...

詹姆斯·韦伯太空望远镜改变了发现的速度,无论好坏

詹姆斯·韦伯太空望远镜是美国宇航局最新、最大的外星天文台,自 6 月以来一直在收集令人惊叹的宇宙图像...

19 位狗狗摄影大赛获奖者

你知道狗可能能闻到你的压力吗?或者我们的狗朋友可能会做梦吗?科学家们继续研究并发现有关我们毛茸茸的好...

这具远古骷髅可能是人类第一位被谋杀的受害者

考古人员花了数年时间从西班牙北部的 Sima de los Huesos 坑(意为“骨头坑”)中发掘...

向摄像机捕捉到的最深栖息的鱼问好

一支来自澳大利亚和日本的科学家团队不需要超长的鱼竿就能捕获有史以来最深的鱼。只需要一台相机、一些鱼饵...

利用三星黑色星期五特惠购买新家电

吃了一整天的火鸡、馅饼和馅料后,是时候为整个周末的黑色星期五购物做好准备了。但你不必等到食物昏迷消退...

为了防止灭绝,科学家将人类基因组存储在可持续数十亿年的“记忆晶体”中

研究人员将整个人类基因组编码到“5D 记忆晶体”中,以防万一人类需要从灭绝的边缘走回来。但即使该计划...

人类为何会说话?树栖猩猩或许能解答这一问题。

全球大约有 7,000 种语言 人类会说。但是,人类如何成为如此健谈的人却有点神秘。周二发表在《认知...

中国为何无法放弃煤炭

中国目前是世界上最大的二氧化碳排放国,其排放量是美国的两倍多,超过发达国家排放量的总和。为解决这一问...