Green500におけるNVIDIAの優位性はAMDとNVIDIA自身からの挑戦に直面している

Table of Contents

Green500におけるNVIDIAの優位性はAMDとNVIDIA自身からの挑戦に直面している

SC24 Nvidia のアクセラレータは、同クラスで最も電力を消費するマシンの 1 つですが、そのチップは、世界で最も持続可能なスーパーコンピュータの Green500 ランキングで引き続き上位を占めています。

2年ごとに発表されるこのリストで最も電力効率の高い10システムのうち8つはNvidiaの部品を採用しており、そのうち5つはGPU大手の1,000ワットのGrace Hopper Superchip (GH200)を搭載していた。

ArmのNeoverse V2設計に基づく72コアのGrace CPUと480 GBのLPDDR5xメモリを、96~144 GBのHBM3またはHBM3eメモリを搭載したH100 GPUと融合したこのパーツは、HPCコミュニティで非常に人気となっています。

最新の Green 500 リストでは、このチップは、最も効率的なシステムの 1 位と 2 位にランクされた EuroHPC の JEDI と Romeo HPC Center の Romeo-2025 マシンの両方に搭載されており、高性能 Linpack ベンチマークでワットあたり 72.7 ギガ FLOPS と 70.9 ギガ FLOPS を達成しました (もちろん、これは FP64 です)。

2つのシステムはほぼ同一で、EvidenのBullSequana XH3000プラットフォームと、同じGH200アクセラレータを採用して構築されています。NvidiaのGH200は、Isambard-AI Phase 1(68.8ギガFLOPS/ワット)、Jupiter Exascale Transition Instrument(67.9ギガFLOPS/ワット)、Helios GPU(66.9ギガFLOPS/ワット)とともに、リストの4位、6位、7位にランクインしています。

JUPITERエクサスケール開発装置

Jupiter Exascale 開発機器 ... Forschungszentrum Jülich / Ralf-Uwe Limbach による画像

一方、Nvidia の由緒ある H100 は、Capella、Henri、HoreKa-Teal システムなど、5 番目、8 番目、9 番目に効率的なマシンに搭載されています。

Nvidia が Green 500 で高い順位を維持できるかどうかは疑わしい。同社の Grace-Blackwell スーパーチップは、2.7 キロワットの GB200 と 5.4 キロワットの GB200 NVL4 の形ですでに登場している。

新しい製品は必ずしもワット当たりの計算能力が向上するわけではありません。

2020年のA100から2022年のH100にかけて、FP64のパフォーマンスは約3.5倍に向上しました。しかし、1,200ワットのBlackwellと比較すると、700ワットのH100はFP64行列演算において実際に高速です。実際、FP64における唯一の改善点はベクトル演算であり、このチップは32%のパフォーマンス向上を誇ります。

Nvidiaは現在Green500で上位にランクインしていますが、AMDはまだその座を降りたわけではありません。実際、House of ZenのMI300Aアクセラレーション・プロセッシング・ユニットは、Adastra 2システムを搭載し、最新のリストで3位を獲得しました。

ご存知ない方のために説明すると、AMDのMI300Aは1年弱前に発表されたもので、24個のCPUコアと6個のCDNA-3 GPUダイを1つのAPUに統合し、最大128GBのHBM3メモリを搭載し、TDPは550~760ワットで構成可能です。少なくとも理論上は、このデバイスは既にH100の1.8倍のHPC性能を誇ります。

HPE Cray社がEX255aブレード(世界最高性能とされるスーパーコンピュータにも搭載されている)を使用して構築したAdastra 2は、69ギガFLOPS/ワットの性能を達成しました。これはAdastra 2だけの性能ではありません。10番目に効率の良いマシンは、ローレンス・リバモア国立研究所にあるMI300AベースのマシンRZAdamsで、62.8ギガFLOPS/ワットを達成しました。

  • マイクロソフト、Azure 上で HPC ワークロードを処理する強力なカスタム AMD チップを発表
  • NvidiaはHPCを含むあらゆるものにAIを組み込むための探求を続けている
  • LLNLのEl Capitanが1.74エクサフロップスの性能でFrontierを上回る
  • Nvidiaの最新Blackwellボードは4つのGPUと2つのGrace CPUを搭載し、消費電力は5.4kWです。

スケールアップ

Green500のトップ10にランクインしたこれらのシステムはすべて、20メガワットのエンベロープでエクサフロップスの演算処理能力を達成するために必要な50ギガフロップス/ワットの目標をはるかに上回っています。しかし、大規模なシステムでこのレベルの効率を維持するのは、実に困難です。

Green500で最も効率の高い3台のマシンを見てみると、どれも小型であることが分かります。JEDIの消費電力はわずか67キロワットです。比較対象として、スイス国立スーパーコンピューティングセンターのAlpsマシン(Top500で最も強力なGH200システム)は、HPLベンチマークで434ペタFLOPSを達成しながら7.1メガワットの消費電力で、ワットあたり61ギガFLOPSで14番目に効率の高いマシンとなっています。

JEDIよりもさらに小型で37キロワットのAdastra 2でも同様です。もし大規模環境で1ワットあたり69ギガFLOPSを維持できれば、El Capitanの実世界性能1.742エクサFLOPSに匹敵するのに必要な電力は約25.2メガワットです。実際には、El Capitanは記録破りの稼働を達成するために約29.6メガワットの電力を必要としました。®

Discover More