世界上最快的科学机器

世界上最快的科学机器

距离世界最快超级计算机 TOP500 排名发布仅剩几周时间,本周,美国橡树岭国家实验室 (ORNL) 正式部署了 Titan,这是一台 20 千万亿次浮点运算的机器。Titan 有望击败劳伦斯利弗莫尔国家实验室的另一台能源部机器 Sequoia,让美国重回超级计算机金字塔的顶峰(Sequoia 有望位居第二),而美国过去几年一直在追赶中国和日本。

但除了吹嘘之外,Titan 的意义还不止于此。它将成为世界上速度最快的开放科学机器,为全国各地工业界、学术界和政府实验室的科学家提供时间,他们需要巨大的计算能力来理解六个核心领域的复杂数据集:气候变化、天体物理学、材料科学、生物燃料、燃烧和核能系统。至关重要的是,它结合了图形处理单元 (GPU) 和通常部署在这种超级计算机中的传统中央处理单元 (CPU) 内核。随着科学家们努力开发下一代百亿亿次级科学机器,这种 CPU 和 GPU 的成功结合可能会对超级计算的未来产生深远的影响。

“我们把全部赌注押在了这个混合计算环境上,而且我们成功了。”“Titan 将成为当今最大、速度最快的开放科学计算机,”负责为 Titan 提供 GPU 的 NVIDIA 业务部门 Tesla 的首席技术官史蒂夫·斯科特 (Steve Scott) 表示。“它可能会也可能不会超过 Sequoia。获得这些头衔固然很好,但这并不像在这台机器上进行的科学研究那么重要。”

对于开发 Titan 的合作者来说,其计算机运行速度是否比劳伦斯利弗莫尔的卫冕冠军更快只是次要考虑。Sequoia 是一款 IBM BlueGene/Q 系统,旨在为美国能源部开展机密研究,因此很快就会消失,重新回到国家机密的幕后,普通研究人员将很难接触到它。另一方面,Titan 的设计考虑到了开放研究。它已经准备好以研究科学界从未见过的水平进行计算。

Titan 每秒能够进行 20,000 万亿次计算。为了让您了解这种计算能力的发展范围和速度,请想想 2009 年 ORNL 还拥有世界上速度最快的超级计算机 Jaguar(Titan 实际上是 Jaguar 的升级版,而不是从头开始的系统,尽管 Titan 的架构非常不同)。Jaguar 是世界上速度最快的计算机之一,其系统速度为 2.3 petaflops(“flops” 代表每秒浮点运算次数,是超级计算性能的衡量标准)。短短三年内,Titan 就超越了 Jaguar 十倍。

这一飞跃很大程度上得益于对 ORNL 构建超级计算机方式的重新思考。通过构建一台十倍大、十倍多 CPU 的计算机,可以切实地将计算能力提高十倍,但这样做在很多层面上都不切实际。除了如此大型机器固有的硬件挑战之外,2.3 千万亿次浮点运算的 Jaguar 所需的能源相当于 7,000 个美国家庭的能源需求。20 千万亿次浮点运算的 Jaguar 需要大约 60 兆瓦或 60,000 个家庭的能源才能运行。要让 Titan 达到现在的水平,而又不产生巨大的能源消耗,需要大量的合作、更多地依赖一种新的硬件机制,以及相当大的勇气。

Jeffrey Nichols 表示:“2009 年,我们发明了混合多核,当时我们还没有这个词。从那时起,我们进行了三年的信念飞跃,并获得了巨大的回报,性能提高了 10 倍,效率提高了 5 倍。”

Nichols 指的是将图形芯片 GPU 集成到传统 CPU 架构中。GPU 特别适合某些任务,它们特别擅长每秒处理多个(数十甚至数百个)计算。CPU 并不特别擅长这种计算,但它们仍然非常适合传统的计算任务,例如基本代码行的运行。为了打造 Titan,ORNL 召集了超级计算机制造商 Cray 和 GPU 制造商 NVIDIA,创建了一个混合系统,其中包含 18,688 个 AMD 16 核 CPU 和 18,688 个 NVIDIA Tesla GPU,它们将协同工作,以更快、更高效的完成任务。核心研究已经完成,但挑战在于将所有部件(全部 40,000 个)排列起来并使其发挥作用。

尼科尔斯解释说,参与 Titan 开发的每个人都怀着某种程度的信心,每个人都面临着失败的可能。Cray 必须接触一种新的硬件和接口,这种硬件和接口能够在 CPU 和 GPU 之间进行通信,这是它以前从未做过的事情。NVIDIA 一直声称其 GPU 拥有重要的功能,远远超出了游戏机或 PC 的范围,现在是时候证明这种混合计算真的可以在超级计算规模上进行。而 ORNL 可能处于最危险的位置,其在全球超级计算领域的领导地位岌岌可危。如果 Titan 未能按时上线(或根本无法上线),这将是一个重大挫折,也许是多年的挫折——在快速发展的超级计算领域,这些年将很难弥补。“对于一个必须完成使命、不能承受失败的组织来说,我们把所有的钱都押在了这个混合计算环境中,我们成功了,”斯科特说。

这次冒险现在获得了丰厚的回报。Titan 无需制造一台比 Jaguar 大十倍的计算机,升级到 16 核 CPU 和性能加速 GPU 后,就可以像 Jaguar 一样装入 200 个服务器机柜中。虽然 Titan 确实比其前代产品消耗更多的电量,但只需要大约 9 兆瓦——这只是以相同速度运行的全 CPU 架构所需电量的一小部分。

这仍然是每年 1000 万美元的能源费用,但当你将它与全球当前的机器领域以及我们必须跟上竞争(特别是太平洋彼岸的某个竞争对手)的步伐进行比较时,Titan 是美国超级计算向前迈出的重要一步。美国能源部正试图创造百亿亿次超级计算能力(希望在 2020 年实现),而中国、日本、印度和欧洲及世界各地的其他国家正试图在这一领域击败美国(百亿亿次浮点性能是性能的下一个重要里程碑,相当于 1,000 千万亿次浮点)。与其中一些竞争对手不同,美国能源部正试图在紧张的财务预算和能源预算下实现这一目标。

“我们在美国和其他地方看到的不同之处在于,我们试图在 20 兆瓦的功率内实现百亿亿次级计算,”尼科尔斯说。按今天的价格计算,这大约相当于每年价值 2000 万美元的电力。中国目前没有这种财政或能源限制,因此从研发和国家安全的角度来看,泰坦在性能和效率方面的飞跃意义重大。不过,要在上述预算下达到百亿亿次级性能,需要在相同能量下将性能提高 50 倍左右。这当然令人望而生畏,但尼科尔斯和他在 ORNL、Cray、nVidia 等公司的同事已经在努力寻找解决方案。

“我们在 2009 年拥有最大的机器,并且已经在考虑 2012 年的机器,”尼科尔斯说。“而且我们已经在考虑 2016 年的机器。”

<<:  这个大型室内飓风模拟器可以拯救你的生命

>>:  见见维基百科上为飓风桑迪代言的气候变化否认者

推荐阅读

地球上人类的原始起源

我们究竟是怎么走到这一步的?不,不是你脑海中突然冒出的政治、环境或生存危机。我们这个物种是怎么走到今...

受啄木鸟启发而设计的头盔可防止足球运动员发生脑震荡

贝托·加西亚 (Berto Garcia),德克萨斯理工大学供图高中橄榄球运动员的处境并不轻松。20...

《命运石之门》评论:深入挖掘智能认知计算

命运石之门:智能智慧的认知计算 - 命运石之门:智能智慧的认知计算《命运石之门:拥有辉煌智慧的认知计...

美国宇航局的“好奇号”探测器首次捕捉到忧郁的火星日落

美国宇航局的“好奇号”火星车拍下了一张让任何有影响力的人都羡慕不已的日落照片。这辆汽车大小的火星探测...

贩毒集团为骡子追踪者增加了攻击难度

特工克里斯·特洛伊 (Chris Trojan) 将车停在皇后区欧松公园一家便利店的停车场,发现有六...

沃尔玛提前开启了“黑色星期五”活动。以下是工具、电子产品等商品的超值优惠。

到目前为止,黑色星期五已经远远超出了一天的范畴。今天是 11 月 8 日,沃尔玛刚刚取消了大部分黑色...

OpenAI 推出 ChatGPT 语音,完全不是“模仿斯嘉丽·约翰逊”

更新:2024 年 5 月 20 日,美国东部时间晚上 8:28 :斯嘉丽约翰逊的公关人员向多家新闻...

首次非洲象群普查显示象群数量下降

一个多国团队首次对非洲象进行了全大陆调查,调查结果令人深感担忧。迄今为止,这项大型大象普查已覆盖 1...

年轻的黑杰克:讲述一位年轻天才外科医生面临的挑战和成长的感人故事

年轻的黑杰克:一位年轻的天才外科医生的故事《少年黑杰克》是手冢治虫名作《黑杰克》的前传,讲述的是天才...

Garmin 最新款跑步手表将生动的视觉效果与你的生命体征相结合

Garmin 的 Forerunner 系列已经拥有大量先进的跑步手表,但这一产品线现在变得更大了。...

那是什么?Microsoft Office 在接下来的 48 小时内价格将低于 40 美元

当您想到生产力应用程序时,您可能会想到 Microsoft Office。学术界、学校或企业界的几乎...

奥特曼:从新角度看待这位经典英雄的魅力

《奥特曼》——动画奥特曼的全新挑战■ 公共媒体电视动画系列■ 原创媒体特殊效果■ 播出时间1979 ...

古代玛雅石匠有一种聪明的方法,可以让石膏更坚固

古玛雅城市似乎不太可能成为人们试验专利化学品的地方。但科学家认为,这恰恰发生在科潘古城。科潘古城是一...

古老的下颌骨揭示了北极熊进化的哪些秘密

越是深入研究北极熊,你就会越觉得它们很奇怪。它们是最大的熊类,也是最大的陆地捕食者。它们适应了穿越开...

现代汽车在新加坡的机器人重型电动汽车工厂已全面投入运营

经过三年的建设和有限的运营,位于新加坡的下一代现代汽车集团创新中心生产设施正式上线并全面投入使用。据...