Armは、NvidiaのGraceプロセッサが、同社の次期Neoverse V2 CPUコアを採用する最初のチップの1つになると発表しました。
CPU コアを使用したシリコンが実際に登場して 1 年以上も前に発表された Neoverse V1 とは異なり、最初の V2 搭載システムが市場に登場するまで長く待つ必要はない、と水曜日の記者会見で伝えられた。
ArmのデータセンタークラスのV2コアを搭載したチップは、既に開発の後期段階に入っており、NvidiaのGraceの場合は製造段階に入っているようです。Nvidiaは、自社のプロセッサにV2を使用するために、Armからライセンスを取得しています。
2022年春のGTCで発表されたNVIDIAのGraceは、72個のArmv9プロセッサコアとDDR5メモリを搭載しています。2個のGraceダイが、NVIDIAの900GB/s NVLink-C2Cインターコネクトを介して1個のGrace CPUスーパーチップに統合され、合計144個のコアと1TBのオンボードメモリを搭載しています。これらのコアはArm Neoverse V2であることが分かっています。
かつてArmの買収を試みて失敗したNvidiaも、同じNVLinkインターコネクトを使用してGrace CPUダイとGH100 GPUダイを融合したCPU-GPUスーパーチップの出荷を準備している。
「V2 SPECfpとSPECintのパフォーマンスには非常に感銘を受けました」と、Nvidiaのアクセラレーテッドコンピューティング担当バイスプレジデント、イアン・バック氏は記者会見で述べた。「電力性能も優れています。コア単体のワット当たりパフォーマンスは、GraceのLPDDRメモリと組み合わせることで、他の競合製品と比較して2倍以上の性能を示しています。」
アームのネオバースVシリーズが進化
Arm は、Nvidia がターゲットとする HPC および AI 中心のアプリケーション以外にも、ハイパースケール、クラウド、ワイヤレス業界で Neoverse コアの幅広い応用を模索しており、Ampere、Marvell、Amazon などのパートナーがすでに大きな進出を果たしています。
2018 年に、Intel の Xeon および AMD の Epyc プロセッサ ファミリに対する Arm の回答として導入された Neoverse ファミリの CPU コアは、過去 4 年間にわたって進化し、E シリーズ コアはデータ処理、N はスケールアウト、V はパフォーマンスに重点を置いた 3 つの異なるユース ケースに合わせて拡張されました。
- Nvidia、Grace-Hopper スーパーチップ向けサーバー設計を公開
- Nvidia、144コアのArmベースGrace「CPUスーパーチップ」を発表
- Arm、カスタムNuvia CPUコアをめぐりQualcommを提訴、設計の破棄を要求
- 公式: Microsoft Azure で Arm ベースの VM が利用可能に
ArmのNeoverse V2は、ソフトバンク傘下の同社が昨年春に発表した初のパフォーマンス最適化コアアーキテクチャの後継となる。Armは、同世代のx86プロセッサと比べて消費電力を半分に抑えながら、スレッドあたりのパフォーマンスを向上させるとしている。
「私たちが恩恵を受けている点の一つは、従来の市場向けに標準的な製品を開発していないことです」と、Armの製品ソリューション担当バイスプレジデントであるダーモット・オドリスコル氏は述べています。「私たちは主要なクラウド、HPC、そして無線インフラ企業と緊密に連携しており、彼らのワークロードと課題を深く理解しています。」
アーキテクチャの改善は曖昧なパフォーマンス主張を強める
O'Driscoll 氏によると、V2 の背後にある基本方針は、電力消費のバランスを取りながらクラウドとシングルスレッドのワークロードのパフォーマンスを向上させ、できるだけ早く出荷することだったという。
「Neoverse V2は市場をリードする整数パフォーマンスを実現します」とオドリスコル氏は付け加えた。
確かなパフォーマンスデータを求められたArmは、NvidiaのV2搭載チップが、今秋リリース予定のx86の主要メーカーの次世代部品を上回るパフォーマンスを発揮すると予測する漠然とした散布図以外の詳細を明らかにすることを拒否した。
ArmのNeoverse V2の性能予測…出典:Arm
グラフはまた、V2 Grace が、ライセンスを受けた改造 Neoverse V1 コアを使用していると思われる AWS Graviton3 Arm 互換チップや、128 個の Armv9 コアを持つ Alibaba Yitian 710 よりもパフォーマンスが優れていることも示しています。
3月のGTCで、Nvidiaは、CPUパフォーマンスの測定に使用されるSPECrate 2017_int_baseベンチマークで、単一のGrace CPUダイが推定スコア740を達成したと主張した。
これにより、このチップは、Nvidia の DGX A100 システムで使用されている Zen 2 ベースの AMD Epyc 7742 よりも約 50 パーセント高速になります。
ワットあたりのパフォーマンスに関する主張は漠然としているものの、Arm は V2 コアに施されたアーキテクチャ上の改善をいくつか公開しており、これがこれらの予測に貢献した可能性があります。
これらには、L2プライベートキャッシュの2MBへの倍増、Armの第2世代スケーラブル・ベクター・エクステンション(SVE2)への移行、そして128ビットの4レーンを備えたベクターエンジンが含まれます。V2では、ダイあたり最大512MBという大幅に大容量のキャッシュもサポートされます。
リフレッシュされた Neoverse N、E コアが登場
Armは、パフォーマンス重視のV2コアに加え、次世代のNシリーズおよびEシリーズチップも開発中です。詳細は不明ですが(The Next Platformで分析記事をご覧いただけます)、ArmによるとNシリーズコア設計の第3世代が開発中で、来年後半にパートナー企業に提供される予定です。
Arm の 2022 年に向けた Neoverse ロードマップ ... 出典: Arm
ArmのVシリーズコアはパフォーマンスの限界を押し上げるように設計されているのに対し、Nシリーズはスレッド数がシングルスレッドパフォーマンスを上回るアプリケーション向けに設計されています。Armの次期Nコア(おそらくN3と呼ばれる)がどれほど効率性が向上するかはまだ分かりません。ArmはN2からの「全体的な向上」という漠然とした表現のみで表明しています。
ArmのEシリーズコアも近い将来に刷新される予定です。これらのEコアは、5G RAN、エッジネットワーキング、その他のアクセラレーションといったデータプレーン処理アプリケーション向けに設計されています。
上の図から、実際の E2 コアは存在しないことがわかります。これは、実際には Arm の Cortex-A510 CPU コアと CMN-700 相互接続メッシュの組み合わせです。
E2 の後継機はすでに開発中であるようですが、Arm はまだ発売に関する詳細を明らかにしていません。®