ISCアルゴンヌ国立研究所の Aurora スーパーコンピュータは正式にエクサフロップスの壁を突破したが、今年春の Top500 でオークリッジの Frontier システムを抜いて首位の座を奪うには、またしても及ばなかった。
ローレンス・リバモア(LLNL)の El Capitan スーパーコンピューターは早ければ今秋にも Top500 ランキングに初登場すると予想されており、大いに宣伝され、さらに長く遅れている Aurora システムがタイトルを獲得することは決してないかもしれないようだ。
インテルの高帯域幅メモリ(HBM)を搭載したXeon Maxプロセッサ21,248個とGPU Maxアクセラレータ63,744個を搭載したAuroraは、昨年米国エネルギー省(DoE)のアルゴンヌ国立研究所に納入されたとき、米国史上最強のスーパーコンピュータになると広く予想されていた。
残念ながら、昨年11月のTop500ランキングの時点では、アルゴンヌ国立研究所はLinpackをシステムの約半分でしか動作させることができませんでした。しかし、まだ半分しか動作させていないにもかかわらず、マシンは585ペタフロップスの倍精度演算性能という驚異的な性能を発揮しました。今春のランキングでは、Linpackの真の実力が見えてきたと言えるでしょう。
完全なシステムと思われるこのシステムで、アルゴンヌは今回、ちょうど 1 エクサフロップスを超えるパフォーマンスを実現し、公に知られているスーパーコンピューターのトップ 500 ランキングにランクインした 2 番目のエクサスケール マシンとなりました。
もちろん、エクサスケールコンピューティングに関しては、中国がエクサフロップス以上の性能を持つスーパーコンピュータを数台、水面下で稼働させていることは周知の事実です。米中貿易関係は、特にHPC、AI、半導体製造の分野で悪化の一途を辿っており、中国が近いうちにエクサスケールシステムの詳細を漏らす可能性は低いでしょう。
IntelのAuroraシステムが明確に劣っている点の一つは消費電力です。はるかに現代的なアーキテクチャを採用しているにもかかわらず、このマシンは最高効率とは程遠いものです。エクサFLOPSの壁を突破するには、なんと38.6MWもの電力が必要でした。ちなみに、Frontierはわずか22.7MWで1.2エクサFLOPSを達成しました。
Green500は、NVIDIAのGrace-Hopperスーパーチップが電力効率のモンスターであることを示しています
見逃さないでください
フロンティアには及ばないものの、アルゴンヌにはまだまだ改善の余地があるようだ。現状では、同研究所はマシンの理論上のピーク性能である1.98エクサフロップスの半分強しか活用できていない。
発表後、Aurora の 1.01 exaFLOPS スコアは、アクティブなマシンの 87 パーセントを使用して達成されたことがわかりました。
たとえAuroraが最終的にFrontierを上回る性能を発揮できたとしても、はるかに大規模で高性能なシステムが間もなく登場する。LLNLのEl Capitanスーパーコンピューターは、AMDのMI300A APUを搭載した最初のシステムの1つとなるだろう。
これらのチップについては、12月のAMDの発表イベントで詳細に紹介しましたが、簡単に言うと、3つのZen 4コンピューティングダイ(合計24コア)と6つのCDNA 3 GPUダイを1つのソケットに統合したチップです。GPUとCPUは、最大128GBの高速HBM3メモリを共有する単一のユニットとして機能します。
El Capitan はピーク性能 2.3 エクサフロップスになると予想されており、これは Aurora より 400 ペタフロップス近く高い (これは理論上の性能であり、実際の性能ではないことに注意)。つまり、理論上は富岳より約 1 台高速ということになる。
もちろん、AuroraのLinpackベンチマークで明らかになったように、大規模な環境では、そのコンピューティング能力を実際にすべて活用するのは非常に困難です。そのため、Auroraは土壇場で勝利を収める可能性もあるかもしれません。
アルプス山脈が到来、一方シエラはトップ10から脱落
リスト上の最も強力な 10 のシステムは 11 月からほとんど変わっていませんが、Eagle、Fugaku、Lumi がそれぞれ 3、4、5 位を維持しています。一方、スイスの Alps スーパーコンピューターが Leonardo を抜いて 6 位になりました。
270ペタフロップスのLinpackスコアを誇るAlpsは、Top500の中でNVIDIAのGrace-Hopperスーパーチップを搭載した最もパワフルなシステムです。2022年のGTCで発表されたNVIDIAのGH200は、今年初めに顧客への供給が開始され、72コアのArmプロセッサ、480GBのLPDDR5xメモリ、H100 GPU、そして96GB~144GBのHBM3またはHBM3eメモリを搭載しています。
Alpsの後ろでは、Leonardoシステムが依然として健闘しています。しかし、8位にはスペインのMareNostrum 5 ACCスーパーコンピュータがいます。このマシンは、昨年秋から38ペタフロップスを積み上げ、Linpackベンチで合計175ペタフロップスを達成し、勇敢なSummitスーパーコンピュータを抜き去りました。このマシンは特に興味深い点です。スコアは高いものの、コア数は昨年よりわずかに小さくなっているようで、今回は17,920コアも減少しています。
9 位と 10 位は、オークリッジ国立研究所の由緒ある Summit と Nvidia の Eos スーパーコンピューターです。ただし、10K GPU バージョンではなく、別のマシンです。
Alps システムが追加されたことで、LLNL の Sierra Super は正式にトップ 10 から押し出されたことになります。IBM の Power 9 プロセッサと、今では時代遅れとなった Nvidia の V100 GPU を搭載したこのシステムは、6 年間トップ 10 の地位を保っていました。
- イタリアの気象スーパーコンピュータ「カサンドラ」はHPCとAIを統合する
- SpiNNcloud SystemsがArmベースの「ニューロモルフィック・スーパーコンピュータ」を発表
- MITREは、残りのアメリカ政府機関向けに、17PFLOPSのAIスーパーを約束している。
- シャイアンのスーパーコンピュータがオークションでわずか48万ドルで落札
これからは波乱に満ちた一年になる
El Capitan が 2024 年に最も売れるマシンになる可能性はありますが、今年後半には注目度の高いシステムがいくつか登場する予定で、Top500 は再び大変動を迎えるかもしれません。
最大級のシステムの一つは、欧州初のエクサスケール・スーパーコンピュータであるJupiterシステムです。11月のスーパーコンピューティングに間に合うかどうかは不明ですが、SiPearlのArmベースRheaプロセッサを搭載した24,000個のGH200スーパーチップを搭載したJupiterは、実世界のHPCワークロードにおいてエクサFLOPSを超える性能を発揮すると報じられています。
英国のDawnシステムとIsambard-AIシステムがあります。Auroraと同様の設計をベースとするDawnは完成すると、1万基以上のGPUを搭載し、理論上のピーク性能は532ペタフロップスに達すると報じられています。一方、ブリストル大学のIsambard-AIは、FP64のピーク性能が200ペタフロップスを超えると予想されています。
MicrosoftのEagleのようなクラウドベースのシステムが、今後さらにTop500ランキングにランクインする可能性も十分にあります。GPUビットバーン、クラウドプロバイダー、ハイパースケーラーがAI向けに数万台のGPUを導入しており(Metaは今年35万台のH100を導入予定)、誰かが少なくとも一度はLinpackをこれらのGPUで実行してみる時間を見つけるのは間違いないでしょう。®