StorageReview实验室团队展示了令人惊叹的计算能力,将圆周率计算到令人难以置信的 202,112,290,000,000 位,创造了连续的世界纪录。这一非凡成就打破了该团队之前保持的 105 万亿位纪录。它展示了现代高性能计算和精心设计的商用硬件平台无与伦比的能力。
StorageReview 实验室团队采用了极为先进的设备来完成这一壮举。利用 Intel Xeon 8592+ CPU 和Solidigm P5336 61.44TB NVMe SSD,该团队进行了近乎连续的计算 85 天,在 28 个 Solidigm SSD 上消耗了近 1.5 PB 的空间。这个开创性的项目展示了计算能力和效率的重大进步。
StorageReview 实验室团队的系统架构师 Jordan Ranous 表示:“这项新纪录凸显了当今高性能计算基础设施的非凡潜力。通过实现这一里程碑,我们不仅在计算数学方面树立了新的标杆,还为各个科学和工程学科的未来创新铺平了道路。”
2024 年 3 月,StorageReview 实验室团队将圆周率计算到105 万亿位,创造了一项世界纪录。该团队利用具有 256 个核心的双处理器 AMD EPYC 系统和近 1PB 的 Solidigm QLC SSD,克服了内存和存储限制等重大技术挑战。这一里程碑展示了现代硬件的功能,并为优化高性能计算系统提供了宝贵的见解。
StorageReview 实验室主任 Kevin O'Brien 表示:“Solidigm 硬盘和 Dell PowerEdge R760 不仅完美地协同工作,而且在经历了上一次创纪录的危险之后,这项新纪录几乎无需干预,这是一个令人欣喜的变化。”他继续说道:“在经历了上一次 105 万亿位的测试运行之后,我很高兴我们选择了这个平台来打破这项大纪录。”有关上一次 105 万亿位的尝试和挑战的更多详细信息,您可以在此处阅读完整文章。
当我们第一次开始寻找测试大容量 SSD 的有趣方法时,显而易见的答案就在我们的 CPU 和系统评测中:y-cruncher。当利用交换空间进行大量计算时,空间要求在数字上大约为 4.7:1,因此 100 万亿位数字需要大约 470TiB 的空间。无需深入研究数学和计算机科学,y-cruncher(Chudnovsky 算法)基于从模函数和椭圆曲线理论中得出的快速收敛级数。该算法的核心依赖于以下无限级数:
关于 100T 和 105T 计算,我们收到的第一个问题是:“好吧,没什么大不了的。为什么这需要这么长时间并且需要这么多内存?”这个问题是有关开源和 Alex Yee 编程能力的其他恼人问题之一。让我们退一步从系统层面来看这个问题。
计算 Pi 的大量位数(例如 100 万亿)需要大量空间,因为涉及大量算术运算。挑战主要在于乘以大数字,这本身就需要大量内存。例如,用于乘以 N 位数字的最佳算法需要大约 4N 字节的内存,其中大部分用作暂存空间。在计算过程中必须多次访问此内存,从而将该过程变成磁盘 I/O 密集型任务,而不是 CPU 密集型任务。
广泛用于计算 Pi 的多个数字的 Chudnovsky 公式需要进行大量的算术运算。这些乘法、除法和平方运算通常简化为大量乘法。从历史上看,超级计算机使用 AGM 算法,尽管速度较慢,但更容易实现,并且受益于众多机器的强大计算能力。然而,现代技术进步已将瓶颈从计算能力转移到内存访问速度。
处理器算术逻辑单元 (ALU) 和浮点单元 (FPU) 处理这些大乘法数字的方式与在纸上手动乘法类似,将它们分解为更小、更易于管理的运算。以前,圆周率计算受计算限制,但如今的计算能力超越了内存访问速度,使得存储和可靠性成为创下圆周率记录的关键因素。例如,我们的 128 核 Intel 机器和 256 核 AMD Bergamo 之间的性能差异很小;重点是磁盘 I/O 效率。
Solidigm SSD 在这些计算中发挥着至关重要的作用,这并不是因为它们的固有速度,而是因为其出色的存储密度。消费级 NVMe 驱动器可以在小体积内存储高达 4TB 的数据,而企业级 SSD 将这些堆叠起来以获得更大的容量。尽管 QLC NAND 可能比其他类型的闪存慢,但这些密集 SSD 中的并行性可提供更高的聚合带宽,使其成为大规模 Pi 计算的理想选择。
标签: