政府的这些努力能够破解 DNA 存储的密码吗?

政府的这些努力能够破解 DNA 存储的密码吗?

在《实力悬殊》中,我们仔细研究了国防工业的核心科学和技术——士兵和间谍的世界。

犹他州布拉夫代尔的城镇口号是“生命相连”。这既平淡无奇又十分普遍——这两个词是如此平淡无奇和普遍,以至于这两个词也是科罗拉多州一位治疗师的口号和 BBC 科技专栏的标题。然而,在瓦萨奇山脉阴影下的布拉夫代尔,这两个词的含义略有不同。因为这个地方是代号为“Bumblehive”的设施所在地。

一个设施有别名这一事实无疑透露了一些关于其性质的信息。Bumblehive 的正式名称是犹他州数据中心。它隶属于国家情报总监办公室(美国官方间谍机构的中央组织),并为臭名昭著的国家安全局存储数据。“如果你没有什么可隐瞒的,”Bumblehive 前面的一块标语不祥地写道,“你就没有什么可怕的。”

围栏外的人并不知道 数据存储在这座占地 100 万平方英尺的设施内,但据估计其规模已达到 EB 级。1EB 相当于约 3300 亿首泰勒·斯威夫特的歌曲。

显然,也存在争议的是,间谍组织并不是唯一对保存大量信息有重大兴趣的群体。想想看,谷歌、微软、亚马逊和 Facebook(以及他们的伙伴)为了运行互联网以及为了知道向你推销哪些奇怪的 T 恤而必须存储的所有信息。例如,Facebook 正在扩建位于德克萨斯州的一座工厂,该工厂今年完工后将占地 260 万平方英尺,占地面积 150 英亩,耗资约 15 亿美元。

没人希望把所有空间浪费在嗡嗡作响的服务器、冷却系统和耗费大量电力和金钱的无聊建筑上。尤其如此,因为这些存储方法最终可能会过时。

如果不用构建任何类型的蜂巢,而是将所有信息放在你的手中,并且以一种不会降解、不会过时、也不会让你破产的形式,那会怎样?

情报界希望弄清楚如何将这个几乎可笑的愿景变成现实。他们希望与私营部门的数据大亨分享他们的解决方案。为了实现这一目标,对于间谍和企业来说,情报高级研究计划署 (IARPA [IC 的 DARPA,如果你想要更多缩写]) 目前正在开展一项为期四年的项目,名为分子信息存储 (MIST)。2019 年授予两个团队的合同总额约为 4800 万美元。

MIST 的目标是利用一种生物存储形式:DNA。基因序列可以在一个肉眼无法看见的封装中对整个人类进行编码,这比芯片或 CD 的效果好得多。就像计算机使用 0 和 1 来表示图片、图像和文档一样,构成 DNA 的核苷酸碱基——腺嘌呤 (A)、胞嘧啶 (C)、鸟嘌呤 (G) 和胸腺嘧啶 (T)——也可以代表相同的信息。每个 A、C、G 或 T 都具有新的编码含义。

DNA 存储也非常高效:人类的所有知识(比如它本身,以及是否可以测量的知识)都可以存储在 DNA 的小房间里,而将这些信息存储在磁带上则需要数百万英亩的土地。此外,正如侏罗纪公园所证明的那样:DNA 的保存时间比磁带、CD(RIP)或闪存驱动器长得多。而所有这些都是 IARPA 感兴趣的。

像 IARPA 这样的研发机构承担着高风险高回报的挑战,而这些挑战的结果对其他组织来说可能太不确定了。他们恰当而自鸣得意地称,将整个犹他州数据中心安装在桌面上这样的问题为“IARPA 难题”。

尽管如此,你不会轻易浏览包含整个维基百科的双螺旋桌面(是吗?)。这是因为它仍然不够实用,也不够便宜——这是 MIST 想要改变的两个方面。

如果 MIST 成功,那么如今的一些大数据仓库有朝一日可能就只是一堆双螺旋结构。该项目理想情况下将生产出一个原型系统,该系统可以将 1TB 的数据编码到 DNA 中,并在 24 小时内从 DNA 中提取 10TB 的数据,成本不到 1,000 美元,耗电量不到 1 千瓦。

IARPA 的计划旨在为学术研究和商业行业注入一剂强心针——推动他们朝着符合情报界利益的目标前进,同时满足他们的求知欲和未来的收入。如果 MIST 取得成功,它既可以向私营部门展示潜在的大客户(间谍)的兴趣,也可以展示其他公司可以借鉴的成功经验。

两个团队(一个由布罗德研究所领导,另一个由佐治亚理工学院研究所领导)赢得了合同,试图让这种 DNA 数据存储不只是一个巧妙的技巧,而是让每个人都能过上互联的生活。

数据的增长速度超过了人们创建经济高效存储的能力,这意味着一些信息最终会被扔进垃圾桶。“任何拥有大量数据存储负担的人都会遇到这个问题,”MIST 项目经理 David Markowitz 表示。虽然没有人确切知道,但他估计全球每年产生约 30 ZB 的数据。“1 ZB 有 1,000 EB,”他说,“这意味着我们生产的新磁带只能存档每年产生的数据的 0.3%,即使我们想保留,超过 99% 的新数据也无法保留。”

佐治亚理工学院研究所开发了一种用于培养 DNA 链的微芯片,可以以极低的成本提供高密度 3D 档案数据存储。DNA 生长的微孔深度只有几百纳米,可以反射照片中特定颜色的光。GTRI 的 Sean McNeil

情报机构自然对捕获和保存这些信息有着极大的兴趣。“你并不总是能提前知道哪些数据对解决谜团最有用,”马科维茨说。“谁应该为未来发生的一些事件负责?”解开这种时间扭曲需要大海捞针,而且马科维茨说,通常需要“挖掘大量历史数据”。

利用 DNA 来保存DNA的想法可以追溯到几十年前,当时只是一个假设。1988 年,一位名叫乔·戴维斯 (Joe Davis) 的艺术家(在哈佛大学的助手的帮助下)创作了一件名为“微静脉”的作品。他在大肠杆菌的核苷酸中嵌入了一个 35 位图像,显示了一个古老的日耳曼字符,意思是“女性地球”。

戴维斯现在是哈佛大学科学家乔治·丘奇实验室的一名研究员(乔治·丘奇是基因编辑领域的先驱,目前正在尝试复活猛犸象)。2011 年,丘奇将一本书(谦虚地说,是他合著的一本书)的 700 千字节内容嵌入 DNA 中,第二年,他又开展了一个类似的项目,添加了图像和 JavaScript 代码。2013 年,欧洲生物信息学研究所的研究人员证明,他们可以将超过 625 千字节的内容编码到 DNA 中,而且几乎没有错误。

作为 MIST 的一部分,致力于解决该问题的两个团队之一由佐治亚理工学院领导,其他团队还包括 Twist Bioscience、Roswell Biotechnologies 和与微软合作的华盛顿大学。该团队将其解决方案称为 SMASH:可扩展分子档案软件和硬件。

一旦 SMASH 被召唤出来,它将像这样工作:软件将信息翻译成基因序列,输出代表数据的 A、G、C 和 T 字符串。然后,计算机将这些字母串发送到半导体芯片——本质上是指示 DNA 碱基以何种顺序构建的指令。

该芯片上布满了微型孔,每个孔只有几百纳米深。每个孔都是一个小型 DNA 合成器,能够根据指令逐个碱基地生成基因序列。每个孔都并行构建序列,就像母鸡挨着母鸡下蛋一样。一旦一组 DNA 链完成,它就会被冲洗成液滴——就像一个信息密集的 Hershey's kiss。它可以湿着放着,也可以干着放着长期保存。

为了从 DNA提取信息,测序芯片会测量单个 GATTACA 分子的电子指纹。然后科学家只需对 DNA 进行逆向解码,将字符串按正确顺序排列,并纠正错误。

瞧!将来,农民年鉴档案可能会这样被搁置,然后再次被拿走。

另一个 MIST 团队由布罗德研究所牵头,与哈佛大学和 DNA Script 公司合作。项目负责人罗伯特·尼科尔说:“我们希望拥有足够高吞吐量的系统,这样你就可以开始部署它们并存档数据,这些数据可能不是你需要每天访问但你肯定想保留的数据。”他举了一个无关紧要的例子,那就是体育。“每场棒球比赛的吞吐量都非常高,”他说。“整个体育场都有非常高清的摄像机。”捕捉每一个球员、每一个观众。也许,20 年后,人们会想要观看观众对退役巨星的超级热门歌曲的反应的视频。

当然,IARPA 不太可能获得大满贯。

这两个项目都还未完全投入运行,但官员们希望在 MIST 项目结束前(即几年后)它们能够完全投入运行。为了弄清其运行情况,IARPA 聘请了测试和评估合作伙伴:拥有相关专业知识的外部组织,他们制定了一套评判新技术的标准。

对于 MIST 来说,合作伙伴之一是洛斯阿拉莫斯国家实验室。在那里,由 Tracy Erkkila 领导的团队为参赛团队编写测试,然后创建答案。在实验室里,他们自己将文件编码成电子 DNA 档案。然后,参赛团队必须将该档案重新写入 DNA。“他们基本上会为我们提供一堆液态 DNA,”Erkkila 说。评估人员随后将通过测序读取他们的液态 DNA 堆。然后他们对结果进行评分,寻找翻译错误。实验室还尝试将该 DNA 解码回原始编码信息。

尽管埃尔基拉不能透露太多有关该测试的细节(这就像是一名高年级学生将一份十年级的旧测验发给一名刚入学的二年级学生),但他表示,该测试包括视频、音频、哈勃太空望远镜拍摄的图片(因为他表示,“我们非常喜欢其中的一些图像”),以及一个名为“斯坦福兔子”的兔子雕像的 3D 模型。

事实上,动物正是埃尔基拉寻求 DNA 数据存储可能性的原因之一。他说,想象一下你是一名野生动物研究员,你想在偏远的阿拉斯加安装一台摄像机。“我想连续两年记录,”他说。“你要如何存储这些信息?”至于间谍为何想要拥有掌握海量数据的能力,他没有透露。

不过,将 DNA 合成器放在冰川上将是一个很好的妙语。

DNA 数据存储不再是玩笑,即使它曾经是。当 Markowitz 在 2016 年首次开始探索 DNA 是否适合情报界的数据时,这个想法并不受欢迎。“在 DNA 领域工作的少数人会在会议上站起来谈论它,他们会被嘲笑,”他说。“真的。来自传统存储行业的人。”

相比之下,如今 DNA 数据存储联盟(一个行业和学术合作组织)拥有数十家成员,包括 IBM、戴尔和微软。马科维茨说:“现在没人再笑了。”

如果真是这样,那么马尔科蒂兹也许会在 50 年后回顾这一切,因为他保留了那次会议以及其他每一次会议的记录,成绩都是 A、G、C 和 T,然后自己也会得意洋洋地笑。

我们希望您喜欢“Overmatched”,这是一篇探讨政府资助的研究如何改变日常生活的新专栏。请继续关注 PopSci+ 以了解后续文章。

<<:  在爱达荷州的这个湖泊深处,美国海军正在测试其潜艇技术

>>:  苹果将​​俄罗斯最大社交网络 VKontakte 从 App Store 下架

推荐阅读

透彻回顾《复活之翼》的情感与现实主义

《救援之翼》:空中救援队的精彩故事2006年播出的《复活的天空-救援之翼》是一部以日本航空自卫队救援...

《晚安世界》的魅力与评价:深入探究VRMMORPG的世界

晚安世界 - 家庭关系和虚拟现实世界动画《晚安世界》于2023年10月12日开始在Netflix上播...

黑色星期五购买合适电视的秘诀

电视促销广告可能很复杂,但您可以使用这份简便指南来理解这些术语。PopSci 员工挑选电视很难,尤其...

档案:鲁布·戈德堡机械是一件严肃的事情

为了纪念 150 周年,我们重新回顾了科普故事(成功和失败),这些故事有助于定义科学进步、理解和创新...

惠比寿天:惠比寿川公立高中天文部魅力与评价:详尽讲解推荐点

《惠比寿川公立高中天文部》:充满古怪笑声和深厚友谊的故事《戎川公立高中天文部》是 2012 年播出的...

接触 X 射线的医生可能在细胞层面上适应辐射

一项新研究表明,经常接受 X 射线照射的医生可能在细胞层面上进行适应,以保护自己免受辐射。该研究暗示...

《传说英雄传说》评论:超出预期的冒险和角色深度

传说英雄的传说 - 传说英雄的传说 - ■ 公共媒体电视动画系列■ 原创媒体轻小说■ 播出时间201...

《声音!》的号召与评价上低音号:上低音号系列电视#1

響鳴!低音号:青春旋律与成长的故事“声音!” 《吹响吧!低音号》是根据竹田绫乃的轻小说改编的电视动画...

美国最大供水公司宣布 2023 年将进入“干旱紧急状态”

南加州都会水务局 (MWD) 周三宣布整个地区进入干旱紧急状态。该声明为 2023 年初可能实施的强...

小田贯蓬蓬的魅力与评价:大家歌曲的新杰作

《小浣熊波姆》:NHK 的经典动画及其魅力《小浣熊波波》是一部时长两分钟的短篇动画作品,于 1983...

科学家可能真的发现了一块失落的大陆

我们只能猜测毛里求斯可能是什么样子,因为它可能位于海底三到六英里处。Pixabay毛里求斯这块失落的...

企业可以让太阳能电池板和电动汽车像家用电脑一样普及

世界最大经济体的能源官员齐聚旧金山,旨在加速向零碳能源的转变。今天,他们宣布了一项新活动,旨在为企业...

凭借 Costco 金星会员资格以 60 美元的价格节省购物开支

跑腿买菜、加油和其他繁琐的任务可能会花费不菲。如果您加入 Costco 这样的仓储会员俱乐部,您可以...

《心理测量者》第一季:一部赛博朋克杰作,对社会系统的深刻探索

PSYCHO-PASS 第 1 季 - 心理测量者 - 评论和推荐《心灵测量者》是一部电视动画系列,...

哈勃太空望远镜的“星系重叠”图像确实令人惊叹

有什么能比一个闪闪发光的螺旋星系更好呢?两个。NASA/ESA 哈勃太空望远镜和星系动物园公民科学项...