世界上最快的科学机器

世界上最快的科学机器

距离世界最快超级计算机 TOP500 排名发布仅剩几周时间,本周,美国橡树岭国家实验室 (ORNL) 正式部署了 Titan,这是一台 20 千万亿次浮点运算的机器。Titan 有望击败劳伦斯利弗莫尔国家实验室的另一台能源部机器 Sequoia,让美国重回超级计算机金字塔的顶峰(Sequoia 有望位居第二),而美国过去几年一直在追赶中国和日本。

但除了吹嘘之外,Titan 的意义还不止于此。它将成为世界上速度最快的开放科学机器,为全国各地工业界、学术界和政府实验室的科学家提供时间,他们需要巨大的计算能力来理解六个核心领域的复杂数据集:气候变化、天体物理学、材料科学、生物燃料、燃烧和核能系统。至关重要的是,它结合了图形处理单元 (GPU) 和通常部署在这种超级计算机中的传统中央处理单元 (CPU) 内核。随着科学家们努力开发下一代百亿亿次级科学机器,这种 CPU 和 GPU 的成功结合可能会对超级计算的未来产生深远的影响。

“我们把全部赌注押在了这个混合计算环境上,而且我们成功了。”“Titan 将成为当今最大、速度最快的开放科学计算机,”负责为 Titan 提供 GPU 的 NVIDIA 业务部门 Tesla 的首席技术官史蒂夫·斯科特 (Steve Scott) 表示。“它可能会也可能不会超过 Sequoia。获得这些头衔固然很好,但这并不像在这台机器上进行的科学研究那么重要。”

对于开发 Titan 的合作者来说,其计算机运行速度是否比劳伦斯利弗莫尔的卫冕冠军更快只是次要考虑。Sequoia 是一款 IBM BlueGene/Q 系统,旨在为美国能源部开展机密研究,因此很快就会消失,重新回到国家机密的幕后,普通研究人员将很难接触到它。另一方面,Titan 的设计考虑到了开放研究。它已经准备好以研究科学界从未见过的水平进行计算。

Titan 每秒能够进行 20,000 万亿次计算。为了让您了解这种计算能力的发展范围和速度,请想想 2009 年 ORNL 还拥有世界上速度最快的超级计算机 Jaguar(Titan 实际上是 Jaguar 的升级版,而不是从头开始的系统,尽管 Titan 的架构非常不同)。Jaguar 是世界上速度最快的计算机之一,其系统速度为 2.3 petaflops(“flops” 代表每秒浮点运算次数,是超级计算性能的衡量标准)。短短三年内,Titan 就超越了 Jaguar 十倍。

这一飞跃很大程度上得益于对 ORNL 构建超级计算机方式的重新思考。通过构建一台十倍大、十倍多 CPU 的计算机,可以切实地将计算能力提高十倍,但这样做在很多层面上都不切实际。除了如此大型机器固有的硬件挑战之外,2.3 千万亿次浮点运算的 Jaguar 所需的能源相当于 7,000 个美国家庭的能源需求。20 千万亿次浮点运算的 Jaguar 需要大约 60 兆瓦或 60,000 个家庭的能源才能运行。要让 Titan 达到现在的水平,而又不产生巨大的能源消耗,需要大量的合作、更多地依赖一种新的硬件机制,以及相当大的勇气。

Jeffrey Nichols 表示:“2009 年,我们发明了混合多核,当时我们还没有这个词。从那时起,我们进行了三年的信念飞跃,并获得了巨大的回报,性能提高了 10 倍,效率提高了 5 倍。”

Nichols 指的是将图形芯片 GPU 集成到传统 CPU 架构中。GPU 特别适合某些任务,它们特别擅长每秒处理多个(数十甚至数百个)计算。CPU 并不特别擅长这种计算,但它们仍然非常适合传统的计算任务,例如基本代码行的运行。为了打造 Titan,ORNL 召集了超级计算机制造商 Cray 和 GPU 制造商 NVIDIA,创建了一个混合系统,其中包含 18,688 个 AMD 16 核 CPU 和 18,688 个 NVIDIA Tesla GPU,它们将协同工作,以更快、更高效的完成任务。核心研究已经完成,但挑战在于将所有部件(全部 40,000 个)排列起来并使其发挥作用。

尼科尔斯解释说,参与 Titan 开发的每个人都怀着某种程度的信心,每个人都面临着失败的可能。Cray 必须接触一种新的硬件和接口,这种硬件和接口能够在 CPU 和 GPU 之间进行通信,这是它以前从未做过的事情。NVIDIA 一直声称其 GPU 拥有重要的功能,远远超出了游戏机或 PC 的范围,现在是时候证明这种混合计算真的可以在超级计算规模上进行。而 ORNL 可能处于最危险的位置,其在全球超级计算领域的领导地位岌岌可危。如果 Titan 未能按时上线(或根本无法上线),这将是一个重大挫折,也许是多年的挫折——在快速发展的超级计算领域,这些年将很难弥补。“对于一个必须完成使命、不能承受失败的组织来说,我们把所有的钱都押在了这个混合计算环境中,我们成功了,”斯科特说。

这次冒险现在获得了丰厚的回报。Titan 无需制造一台比 Jaguar 大十倍的计算机,升级到 16 核 CPU 和性能加速 GPU 后,就可以像 Jaguar 一样装入 200 个服务器机柜中。虽然 Titan 确实比其前代产品消耗更多的电量,但只需要大约 9 兆瓦——这只是以相同速度运行的全 CPU 架构所需电量的一小部分。

这仍然是每年 1000 万美元的能源费用,但当你将它与全球当前的机器领域以及我们必须跟上竞争(特别是太平洋彼岸的某个竞争对手)的步伐进行比较时,Titan 是美国超级计算向前迈出的重要一步。美国能源部正试图创造百亿亿次超级计算能力(希望在 2020 年实现),而中国、日本、印度和欧洲及世界各地的其他国家正试图在这一领域击败美国(百亿亿次浮点性能是性能的下一个重要里程碑,相当于 1,000 千万亿次浮点)。与其中一些竞争对手不同,美国能源部正试图在紧张的财务预算和能源预算下实现这一目标。

“我们在美国和其他地方看到的不同之处在于,我们试图在 20 兆瓦的功率内实现百亿亿次级计算,”尼科尔斯说。按今天的价格计算,这大约相当于每年价值 2000 万美元的电力。中国目前没有这种财政或能源限制,因此从研发和国家安全的角度来看,泰坦在性能和效率方面的飞跃意义重大。不过,要在上述预算下达到百亿亿次级性能,需要在相同能量下将性能提高 50 倍左右。这当然令人望而生畏,但尼科尔斯和他在 ORNL、Cray、nVidia 等公司的同事已经在努力寻找解决方案。

“我们在 2009 年拥有最大的机器,并且已经在考虑 2012 年的机器,”尼科尔斯说。“而且我们已经在考虑 2016 年的机器。”

<<:  这个大型室内飓风模拟器可以拯救你的生命

>>:  见见维基百科上为飓风桑迪代言的气候变化否认者

推荐阅读

这家通信公司是偏远地区运营商的生命线

在《实力悬殊》中,我们仔细研究了国防工业的核心科学和技术——士兵和间谍的世界。你站在山顶,为登顶而欣...

当以光速旅行时会发生什么?

为了从我们的太阳系前往其他恒星(并在旅途中幸存下来),人类必须以接近光速的速度旅行。但是当你以这种宇...

名侦探柯南:第 15 部电影评论和印象

名侦探柯南:第 15 部剧场版 - 其魅力与评价名侦探柯南系列第15部剧场版《名侦探柯南:十五分钟的...

全面回顾职业高尔夫球手Saru挑战超级高尔夫世界的过程!

职业高尔夫球手猴子:挑战超级高尔夫世界!! - 电影评论和详情概述“职业高尔夫球手Saru:向超级高...

燃气灶可能导致美国数千名儿童患病

自 19 世纪以来,美国家庭就开始使用燃气灶烹饪食物,因此这并不是什么新鲜事物。据估计,自燃气灶问世...

评价《怪斗乱马》:新颖的故事和视觉吸引力

《怪斗乱马动画》:根据游戏改编的原版 OVA 中展现了激烈的动作和深刻的人性戏剧1999年11月26...

诺贝尔化学奖刚刚表彰了你真正关心的东西——手机电池

您的数字生活大部分(如果不是全部的话)都归功于锂离子电池。它们为您的智能手机、笔记本电脑供电——除了...

iOS 13 最酷的功能将于今年秋季登陆你的手机

每年夏天,苹果都会在全球开发者大会上展示即将推出的操作系统更新。今年,iTunes 的退役(尽管它并...

经过《老友记》训练的神经网络可以识别讽刺

2019 年,当 AI 还只是科幻小说中的产物,而 GPT-2 距离发布还有几个月的时间时,一组研究...

刚刚加入 Bluesky?如何开始以及您应该探索的功能。

您可能已经注意到,最近几周,许多人涌向 Bluesky:有些日子里,24 小时内就有 100 万新注...

果蝇的生活是什么样的?人工智能让我们一窥究竟。

果蝇经常爬在变黄的香蕉或过熟的西葫芦上,它们显然与人类有很大不同。但在内部,它们实际上与人类共享 7...

这款一体式扫描仪采用 AR 技术,让 DIY 项目变得简单

如今,我们比以往任何时候都更加依赖智能手机,无论是工作、娱乐还是经营业务。如果你是那种什么都用手机的...

细菌可能是造成世界最大灭绝事件的罪魁祸首

除此之外,还有致命微生物的精彩片段——一种细菌菌株就可能加剧 2.5 亿年前的大灭绝事件,产生大量甲...

Anker 和 Crayola 今日推出返校优惠和其他超值优惠

如需了解更多交易和产品信息,请查看我们的专属 Facebook 群组。...

2018年,阿拉斯加白令海陷入混乱。

从各方面来看,2018 年对于阿拉斯加白令海来说都是一个极端的年份。自 1850 年以来,北太平洋水...