世界上最快的科学机器

世界上最快的科学机器

距离世界最快超级计算机 TOP500 排名发布仅剩几周时间,本周,美国橡树岭国家实验室 (ORNL) 正式部署了 Titan,这是一台 20 千万亿次浮点运算的机器。Titan 有望击败劳伦斯利弗莫尔国家实验室的另一台能源部机器 Sequoia,让美国重回超级计算机金字塔的顶峰(Sequoia 有望位居第二),而美国过去几年一直在追赶中国和日本。

但除了吹嘘之外,Titan 的意义还不止于此。它将成为世界上速度最快的开放科学机器,为全国各地工业界、学术界和政府实验室的科学家提供时间,他们需要巨大的计算能力来理解六个核心领域的复杂数据集:气候变化、天体物理学、材料科学、生物燃料、燃烧和核能系统。至关重要的是,它结合了图形处理单元 (GPU) 和通常部署在这种超级计算机中的传统中央处理单元 (CPU) 内核。随着科学家们努力开发下一代百亿亿次级科学机器,这种 CPU 和 GPU 的成功结合可能会对超级计算的未来产生深远的影响。

“我们把全部赌注押在了这个混合计算环境上,而且我们成功了。”“Titan 将成为当今最大、速度最快的开放科学计算机,”负责为 Titan 提供 GPU 的 NVIDIA 业务部门 Tesla 的首席技术官史蒂夫·斯科特 (Steve Scott) 表示。“它可能会也可能不会超过 Sequoia。获得这些头衔固然很好,但这并不像在这台机器上进行的科学研究那么重要。”

对于开发 Titan 的合作者来说,其计算机运行速度是否比劳伦斯利弗莫尔的卫冕冠军更快只是次要考虑。Sequoia 是一款 IBM BlueGene/Q 系统,旨在为美国能源部开展机密研究,因此很快就会消失,重新回到国家机密的幕后,普通研究人员将很难接触到它。另一方面,Titan 的设计考虑到了开放研究。它已经准备好以研究科学界从未见过的水平进行计算。

Titan 每秒能够进行 20,000 万亿次计算。为了让您了解这种计算能力的发展范围和速度,请想想 2009 年 ORNL 还拥有世界上速度最快的超级计算机 Jaguar(Titan 实际上是 Jaguar 的升级版,而不是从头开始的系统,尽管 Titan 的架构非常不同)。Jaguar 是世界上速度最快的计算机之一,其系统速度为 2.3 petaflops(“flops” 代表每秒浮点运算次数,是超级计算性能的衡量标准)。短短三年内,Titan 就超越了 Jaguar 十倍。

这一飞跃很大程度上得益于对 ORNL 构建超级计算机方式的重新思考。通过构建一台十倍大、十倍多 CPU 的计算机,可以切实地将计算能力提高十倍,但这样做在很多层面上都不切实际。除了如此大型机器固有的硬件挑战之外,2.3 千万亿次浮点运算的 Jaguar 所需的能源相当于 7,000 个美国家庭的能源需求。20 千万亿次浮点运算的 Jaguar 需要大约 60 兆瓦或 60,000 个家庭的能源才能运行。要让 Titan 达到现在的水平,而又不产生巨大的能源消耗,需要大量的合作、更多地依赖一种新的硬件机制,以及相当大的勇气。

Jeffrey Nichols 表示:“2009 年,我们发明了混合多核,当时我们还没有这个词。从那时起,我们进行了三年的信念飞跃,并获得了巨大的回报,性能提高了 10 倍,效率提高了 5 倍。”

Nichols 指的是将图形芯片 GPU 集成到传统 CPU 架构中。GPU 特别适合某些任务,它们特别擅长每秒处理多个(数十甚至数百个)计算。CPU 并不特别擅长这种计算,但它们仍然非常适合传统的计算任务,例如基本代码行的运行。为了打造 Titan,ORNL 召集了超级计算机制造商 Cray 和 GPU 制造商 NVIDIA,创建了一个混合系统,其中包含 18,688 个 AMD 16 核 CPU 和 18,688 个 NVIDIA Tesla GPU,它们将协同工作,以更快、更高效的完成任务。核心研究已经完成,但挑战在于将所有部件(全部 40,000 个)排列起来并使其发挥作用。

尼科尔斯解释说,参与 Titan 开发的每个人都怀着某种程度的信心,每个人都面临着失败的可能。Cray 必须接触一种新的硬件和接口,这种硬件和接口能够在 CPU 和 GPU 之间进行通信,这是它以前从未做过的事情。NVIDIA 一直声称其 GPU 拥有重要的功能,远远超出了游戏机或 PC 的范围,现在是时候证明这种混合计算真的可以在超级计算规模上进行。而 ORNL 可能处于最危险的位置,其在全球超级计算领域的领导地位岌岌可危。如果 Titan 未能按时上线(或根本无法上线),这将是一个重大挫折,也许是多年的挫折——在快速发展的超级计算领域,这些年将很难弥补。“对于一个必须完成使命、不能承受失败的组织来说,我们把所有的钱都押在了这个混合计算环境中,我们成功了,”斯科特说。

这次冒险现在获得了丰厚的回报。Titan 无需制造一台比 Jaguar 大十倍的计算机,升级到 16 核 CPU 和性能加速 GPU 后,就可以像 Jaguar 一样装入 200 个服务器机柜中。虽然 Titan 确实比其前代产品消耗更多的电量,但只需要大约 9 兆瓦——这只是以相同速度运行的全 CPU 架构所需电量的一小部分。

这仍然是每年 1000 万美元的能源费用,但当你将它与全球当前的机器领域以及我们必须跟上竞争(特别是太平洋彼岸的某个竞争对手)的步伐进行比较时,Titan 是美国超级计算向前迈出的重要一步。美国能源部正试图创造百亿亿次超级计算能力(希望在 2020 年实现),而中国、日本、印度和欧洲及世界各地的其他国家正试图在这一领域击败美国(百亿亿次浮点性能是性能的下一个重要里程碑,相当于 1,000 千万亿次浮点)。与其中一些竞争对手不同,美国能源部正试图在紧张的财务预算和能源预算下实现这一目标。

“我们在美国和其他地方看到的不同之处在于,我们试图在 20 兆瓦的功率内实现百亿亿次级计算,”尼科尔斯说。按今天的价格计算,这大约相当于每年价值 2000 万美元的电力。中国目前没有这种财政或能源限制,因此从研发和国家安全的角度来看,泰坦在性能和效率方面的飞跃意义重大。不过,要在上述预算下达到百亿亿次级性能,需要在相同能量下将性能提高 50 倍左右。这当然令人望而生畏,但尼科尔斯和他在 ORNL、Cray、nVidia 等公司的同事已经在努力寻找解决方案。

“我们在 2009 年拥有最大的机器,并且已经在考虑 2012 年的机器,”尼科尔斯说。“而且我们已经在考虑 2016 年的机器。”

<<:  这个大型室内飓风模拟器可以拯救你的生命

>>:  见见维基百科上为飓风桑迪代言的气候变化否认者

推荐阅读

齿鲸利用它们的叫声成为超级狩猎能力

您一听到就绝对能听出嗓音低沉。从布兰妮·斯皮尔斯 (Britney Spears) 90 年代的热门...

19 种日常物品的精美内部结构

抱歉,您的浏览器不支持 HTML5 视频。您可以尝试直接查看 gif:https://zippy.g...

马达加斯加曾经有巨兽出没。它们后来怎么样了?

马达加斯加岛不仅是多部动画电影的灵感来源,也是世界上一些最有趣生物的家园。该岛大约 1.6 亿年前从...

科学奇迹如何为生与死带来安慰

我们是由星尘构成的。这是一句老生常谈,也是一个奇迹。你体内的元素是在远古恒星的熔炉中形成的,你死后,...

数码照片可信吗?

下士泰德·“乔伊”·布德罗二世感到很无聊。那是 2003 年夏天的伊拉克,正值美国入侵伊拉克的重担和...

Roomba 优惠 150 美元,今日还有其它超值优惠

如需了解更多交易和产品信息,请查看我们的专属 Facebook 群组。...

斯坦利·库布里克的 8 项最伟大的技术创新

当你漫步于洛杉矶郡艺术博物馆关于斯坦利·库布里克的大型新展览时,很难不惊叹这位美国传奇电影导演的每个...

如何在任何浏览器中清除网络历史记录

如果你想立即改善你的数字生活,那就拿一张便签,在上面写上“删除浏览历史记录”,然后把它贴在你的电脑旁...

《Triage X》的魅力与评价:探索动作与故事的深度

Triage X - 埋藏在黑暗中的正义故事2015 年播出的电视动画《Triage X》改编自佐藤...

从基韦斯特到纽约再到中国,北极光在照片中熠熠生辉

从 10 月 10 日星期四到 10 月 11 日星期五的夜间,远至佛罗里达州南部,甚至纽约市等光污...

欣赏直觉与算法的融合! “直觉×算法♪”的魅力究竟是什么呢?

《直觉×算法♪》全方位点评与推荐 - Chokkan Algorithm概述《直觉×算法♪》是20...

《Step Together》:彻底解析NHK经典歌曲,让每个人都能享受其中!

大家一起迈出步伐吧-Minnade Step概述《Minna de Step》是 1988 年 10...

提高在线安全性的指南

我们中的许多人已经花了近两年的时间来适应更加虚拟的世界,但仍然很难保持对网络隐私和安全的警惕。即使你...

电影《光之美少女 All Stars DX3》的感想与评论:向未来传达的信息和彩虹色的羁绊

电影《光之美少女All Stars DX3:送往未来!连接世界的彩虹花》的魅力与感想《光之美少女 A...

去!真嗣君:重新评价大家动人的歌曲

去!真嗣君——加油!真嗣君概述“加油!真嗣!”是一部于 1979 年 6 月在 NHK 教育电视台(...