AMDは、NVIDIAのGrace CPUスーパーチップやArmは同社のEpyc Zen 4コアには敵わないと主張している。

Table of Contents

AMDは、NVIDIAのGrace CPUスーパーチップやArmは同社のEpyc Zen 4コアには敵わないと主張している。

コメントAMD は、同社の現在のデータセンター シリコンは、Nvidia の Grace CPU スーパーチップに比べてすでに 2 倍以上高速で、最大 2.75 倍の効率性があると主張しています。

このチップ設計会社の主張は、先週公開された同社独自のテスト結果を受けて出されたもので、そのテストではNvidiaの2022 Grace CPUスーパーチップが検討された。

この製品は、72個のArm Neoverse V2コアを搭載したCPUダイを2つ組み合わせ、900GB/秒のNVLinkチップ間インターコネクトで接続し、最大960GBの高速LPDDR5xメモリを搭載しています。ただし、AMDがテストしていたのは480GB版のようです。

明確に言うと、これは単一の Grace CPU と最大 480GB の LPDDR5x、および 144GB H100 GPU ダイを組み合わせた Nvidia の Grace-Hopper Superchip (GH200) ではありません。

AMD は、Nvidia の Grace CPU に対して、それぞれ 768GB の DDR5 4800MT/秒メモリを搭載した Epyc 4 Genoa (9654) と Bergamo (9754) を実行するシングル ソケット システムとデュアル ソケット システムの両方を対戦させました。

AMD は、汎用コンピューティング、サーバー側 Java、電力効率、トランザクション データベース、意思決定支援システム、Web サーバー、インメモリ データベース、ビデオ エンコーディング、高性能コンピューティング (HPC) など 10 種類のワークロードにわたって、自社のキットが Nvidia のチップの 1.5 倍から 4 倍のパフォーマンスを実現したと自慢しました。

走行距離は異なる場合があります

ベンダーが提供するベンチマークはどれも、鵜呑みにしないようにしましょう。AMDのパフォーマンスに関する詳細な内訳はこちらをご覧くださいが、ここでは全体的な見解を述べます。

以下は、AMD が Nvidia の Grace-Grace CPU スーパーチップに対してリードしていると主張する統合ビューです。

AMDがNVIDIAのGrace-Grace CPUスーパーチップに対して優位に立っていると主張する統合ビューを以下に示します。クリックして拡大します。

一方、SPECpower-ssj2008ベンチマークでは、AMDは、128コアのEpyc 9754単体ではNvidiaのArm Neoverse V2ベースのチップに比べてワット当たり約2.5倍の性能を発揮し、Bergamo Epycのペアではその優位性が2.75倍にまで押し上げられたと主張した。

AMDはまた、Armシステムは本質的により効率的であるという一般的な考えを払拭しようとし、いくつかのテストでワットあたりのパフォーマンスが最大2.75倍優れていることを示しました。

AMDはまた、Armシステムは本質的にエネルギー効率が高いという一般的な考えを払拭しようとし、いくつかのテストではワットあたりのパフォーマンスが最大2.75倍優れていることを示しました。(クリックして拡大)

Grace の開発を追ってきた人にとっては、これは何ら驚くべきことではないが、状況は AMD が信じさせようとしているほど単純ではない。

姉妹サイトであるThe Next Platformが 2 月に報告したように、ストーニーブルック大学とバッファロー大学の研究者は、Nvidia の Grace CPU スーパーチップと、複数の科学研究機関および 1 つのクラウド ビルダーから収集されたいくつかの x86 プロセッサのパフォーマンス データを比較しました。

当然のことながら、これらのテストのほとんどは、Linpack、高性能共役勾配法(HPCG)、OpenFOAM、Gromacsなど、HPC中心のものでした。Graceシステムのパフォーマンスはテストごとに大きく異なりましたが、最悪の場合でもIntelのSkylakeアーキテクチャ(2015年頃)とIce Lake(2019年)テクノロジーの中間に位置し、AMDのMilan(2021年以降)を上回り、2023年初頭に発売されたXeon Maxに僅差で迫りました。

調査結果によると、適切なベンチマークでは、AMD の最も強力な Genoa および Bergamo Epyc プロセッサが Nvidia の最初のデータセンター CPU に勝つ可能性があることが示唆されています。

しかし、先ほども触れたように、これらはすべてワークロードに依存します。NVIDIAはGrace CPUスーパーチップのデータシートで、このチップがデュアル96コアEpyc 9654s(AMDのテストで使用されたのと同じGenoa Epyc)と比較して90%から2.4倍のパフォーマンスを達成し、様々なクラウドサービスやHPCサービスにおいて最大3倍のスループットを実現することを示しています。

見てください。Nvidia も好意的なベンチマークを作成できるのです。

ご覧のとおり、NVIDIA は魅力的なベンチマークも作成できます – クリックして拡大

これは一体何なんでしょうか?

古き良きCPU対決は理にかなっているかもしれない(GraceとEpycはどちらも結局のところデータセンター向けCPUプラットフォームである)。しかし、NVIDIAのGrace CPUスーパーチップがHPCアプリケーション以外で広く導入されているのを目にすることはほとんどなく、通常は次世代GH200シリコンの大規模導入に向けた準備段階にある。英国のIsambard-3とIsambard-AIスーパーコンピューターは、この戦略が実際に機能している好例だ。

Nvidia 自身は、CPU スーパーチップを「大量のデータを処理して最大限のエネルギー効率でインテリジェンスを生み出す」ように設計されたものと宣伝しており、具体的には AI、データ分析、ハイパースケール クラウド アプリケーション、HPC アプリケーションを挙げています。

さらに、GH200構成では、計算の大部分はGPUによって行われ、Graceは主にアクセラレータにデータを供給します。NVIDIAはGraceとNVLink-C2Cインターコネクトがこの課題に十分対応できると考えているのは明らかで、NVIDIAのGTC開発者会議で紹介された次期GB200スーパーチップでもCPUを再利用することを選択しました。

NVIDIAがGraceの成功に必要なのは、おそらくこれだけだろう。そして、加速王者が既に後継機の開発に着手している理由も、ここにある。

HPC分野以外では、Grace-Graceと第4世代Epycを比較検討している人は、おそらくかなり少ないでしょう。正直なところ、GH200とAMDのMI300A APUの直接対決を見た方がずっと興味深かったでしょう。

  • Nvidiaは中国市場向けにBlackwell GPUを準備中と報道
  • Nvidiaの次期Linuxドライバーは…オープンになる
  • ゲーム開発者がインテルを「欠陥のある」Raptor Lake CPU を販売したと非難
  • AMDがZen 5のIPCが16%向上したことを明かす

AMD は、Arm の互換性に関する議論でその主張を締めくくっています。これは、さらに多くのベンチマークに値するトピックです。

AMD のテストは、x86 が勢いを失い、Arm が優位に立つのではないかという懸念を払拭するための単なる演習なのではないかという印象を受ける。

ArmはHPCコミュニティやクラウドにとって全く新しい存在ではありません。これらの市場はArmのアーキテクチャを拒絶するどころではありません。実際、米国の主要クラウドプロバイダーはすべて、自社製品と呼べるArm CPUを採用しています。

しかし、これが本当に AMD の Zen 4 コアと Zen 4c コアが Arm の Neoverse V2 アーキテクチャとどのように比較されるかに関するものであるならば、Amazon Web Service の Graviton4 との比較の方が有益だったでしょう。

Graviton4プロセッサのAWS配布画像

Graviton4プロセッサのAWS配布資料画像 – クリックして拡大

2023 年後半に発表された Graviton4 は、Grace と同じ Neoverse V2 コアをベースにしていますが、Grace のはんだ付けされた LPDDR5x モジュールとは対照的に、96 個のコアを誇り、標準のデュアル ソケット構成と 12 チャネルの DDR4 をサポートしています。

Graviton4 を実行するインスタンスは、数か月前からプレビュー版として提供されており、先週一般公開されました。おそらくさらに重要なのは、AWS が Epyc 4 ベースと Graviton 4 ベースの両方のインスタンスを提供しているため、両者を比較する可能性がはるかに高くなることです。®

Discover More