NvidiaのVera Rubin CPU、GPUロードマップは、600kWラックの超ホットホットの道筋を示している

Table of Contents

NvidiaのVera Rubin CPU、GPUロードマップは、600kWラックの超ホットホットの道筋を示している

GTC Nvidia のラックスケール コンピューティング アーキテクチャが、非常に注目を集めるようになります。

火曜日のGTCのステージ上で、CEOのジェンスン・フアン氏は、同社の次世代ハイエンドデータセンターGPUとCPU(コード名:Vera、Rubin、Rubin Ultra)を初公開した。

少し複雑になりますが、覚えておいてください。Vera は CPU アーキテクチャ、Rubin は GPU アーキテクチャ、そして Rubin Ultra は Rubin の更新バージョンになります。

Huang氏は、Rubin Ultraは576個のGPUダイを1つのラックに詰め込み、600kWの電力を消費するように設計されていると自慢した。しかし、2027年後半にこれらのシステムが発売される前に、まずVera CPUコアとRubin GPUが搭載される予定だ。

暗黒物質の研究で知られるアメリカの天文学者ヴェラ・ルービンにちなんで名付けられた Vera は、2021 年に Grace が発表されて以来、Nvidia 初の Arm 互換 CPU アーキテクチャです。

Nvidiaの次期CPUとGPUアーキテクチャはVeraとRubinと呼ばれる

Nvidiaの次期CPUとGPUアーキテクチャはVeraとRubinと呼ばれ、カリフォルニア州サンノゼのGTCのステージでJensen Huangによって発表された。

このCPUは、カスタム設計された88個のArmコア(Neoverseはもう終わり)を搭載し、SMTによってソケットあたりのスレッド数は176にまで増加するとのことです。来年末の発売予定です。Graceと同様に、このチップにはNVLinkチップ間接続が統合されており、Nvの次期Rubin GPUとのインターフェースとして機能します。

Huang 氏によると、Rubin は Blackwell の設計アーキテクチャを大いに借用しており、FP4 精度で最大 50 petaFLOPS が可能な 2 つのレチクル制限ダイと、13 TB/s の帯域幅を実現する 288 GB の HBM4 メモリを備えています。

BlackwellやBlackwell Ultraと同様に、これらのパーツはスーパーチップとしてパッケージ化され、NVIDIAのラックスケールNVL144シャーシに搭載されます。しかし、期待しすぎないように言っておきますが、NVIDIAは今回、ラックに従来の2倍のGPUを詰め込むわけではありません。Huang氏は単にGPUの定義を変えただけです。Blackwellのツインダイは1つの論理チップでしたが、Rubinのものは1つのパッケージに2つのGPUとしてカウントされます。

同じ数の GPU ダイを持つ GB300 NVL72 と比較して、Huang 氏は、Vera-Rubin NVL144 は推論用の高密度 FP4 で 3.6 エクサフロップス、トレーニング用の FP8 コンピューティングで 1.2 エクサフロップスを超える、3.3 倍の浮動小数点パフォーマンスを実現すると自慢しました。

このシステムには、合計 260 TB/秒 (ダイあたり 1.8 TB/秒) の相互接続帯域幅を提供する Nvidia の第 6 世代 NVLink スイッチ ファブリックも搭載され、今後登場する 1.6 Tbps の ConnectX-9 NIC も活用されます。

今週のGTCでは次のものも登場します:

  • NVIDIAは、エージェント型AIシステムへの統合を目的としたLlama Nemotronファミリー推論モデルを発表しました。最初の2つであるNanoとSuperは、MetaのLlama 3.1 8Bと3.3 70Bをベースに、オンデマンド推論機能を実現するために最適化されています。両モデルとも、NVIDIA Inference Microservices(NIM)またはHugging Face経由で利用可能です。
  • AI-Q ブループリントは、複数のソースまたはデータベースから情報を取り込んで処理できる複雑なエージェント AI サービスを構築するためのオープン ソース フレームワークです。

事態が本当にヒートアップし始めるのは、2027 年後半に Rubin Ultra が発売されたときです。このチップにより、GPU ダイと HBM モジュールの数がそれぞれ 4 個と 16 個に倍増します。

NVIDIA CEOのジェンスン・フアン氏は、2027年までにRubin Ultra NVL576の発売によりラックが600kWに急増すると予想している。

NVIDIA CEOのジェンスン・フアンは、2027年までにRubin Ultra NVL576の発売によりラックが600kWに急増すると予想している。

Nvidia は、各 Rubin Ultra パッケージが FP4 パフォーマンスで 100 ペタフロップスを超え、さらに高速な HBM4e メモリを 1 テラバイト詰め込むことを期待しています。

これらのパッケージ144個と、未公開の台数のVera CPUが、消費電力と発熱量が600kWのラックに詰め込まれる。チップ大手の同社は、このラックスケールシステムでFP4推論性能が15エクサフロップス、FP8学習性能が5エクサフロップスになると予想している。

これらすべてのテンソル コアに電力を供給するために、Nvidia はチップ間通信用としてより高速な NVLink7 相互接続に移行する予定ですが、スケールアウト通信用には 1.6 Tbps の ConnectX-9 NIC を使い続ける予定です。

しかし、既存のデータセンター施設のうち、どれだけがこのような高密度構成に対応できるのかという疑問が残ります。GTCでのHuang氏の基調講演でスクリーンに表示された図は、システムがキャビネットに垂直に挿入され、高さのあるラックに高密度に詰め込まれた様子を示しています。これは、LenovoやHPE Crayの一部HPCクラスターに似ています。

  • NvidiaはDGX Station、Spark PCでGB300スーパーチップをデスクに搭載したいと考えている
  • NvidiaはGPUにデータを供給するためシリコンフォトニックスイッチを廃止
  • HBMがお気に召しました – NvidiaのBlackwell Ultra GPUには288GBのHBMが搭載されています
  • 32BパッケージでDeepSeek-R1を上回るパフォーマンス?El RegがAlibabaのQwQに爪を立てる

HPCベンダーといえば、超高密度コンピューティングプラットフォームはそれほど珍しくありません。昨年、最大300kWをサポートできるCray EX4000シリーズのキャビネットについて取り上げました。しかし、これらは典型的な19インチラックとは異なり、通常、このレベルのコンピューティング向けに特別に設計されたデータセンターシェルをベースに設計されています。

そのため、19 インチまたは 21 インチの OCP オープン ラック フォーム ファクターで 600 kW のコンピューティング能力を冷却しようとすると、ほぼ確実にカスタム ビルドが必要になります。

Rubin の後の Nvidia の次期 GPU アーキテクチャは、アメリカの物理学者リチャード・ファインマンにちなんで命名される予定です。

ルービン後のNVIDIAのGPUアーキテクチャは物理学者リチャード・ファインマンにちなんで命名される

最後に、Nvidia はデータセンター ロードマップを少しだけ公開しました。Rubin と Rubin Ultra に続く次の GPU アーキテクチャは、アメリカの理論物理学者リチャード ファインマンにちなんで名付けられ、2028 年にリリース予定です。まさか、冗談ですよね。®

Discover More