AMDの最新Epycはコアがぎっしり詰まっていて、キャッシュがぎっしり詰まっている。

AMD は、サンフランシスコで開催したデータセンターおよび AI イベントで、クラウドおよび技術アプリケーション向けの Epyc プロセッサ 2 台と、Instinct MI300 アクセラレータファミリの詳細な計画を発表しました。

まず最初に、クラウドプロバイダーとハイパースケーラーを念頭に設計された新しいEpycプロセッサを紹介します。コードネーム「Bergamo」と呼ばれるこのチップは、ソケットあたり最大128コアを搭載し、コンテナ化された様々なワークロード向けに最適化されているとAMDは述べています。

AMDはコア数の多いチップの開発には慣れ親しんでいます。2017年に初代Epycを発売して以来、同社は長年のライバルであるIntelに対してコア数で着実にリードを保ってきました。しかし、AMDの128コアEpycは、少なくとも今のところは、Intelをターゲットにしたものではないようです。

代わりに、AMDはBergamoを、2020年に市場に登場して以来、クラウドおよびハイパースケーラーの間で広く採用されているAmpere ComputingのArm互換データセンターチップに対する一種の防壁として位置付けています。今日では、もちろんAWSを除くすべての主要クラウドプロバイダーがAmpereのチップを導入しています。

AMDはBergamoによって、この失われた地位の一部を取り戻そうとしています。同社は、少なくともSPECrate2017 Integerベンチマークにおいては、シングルソケット構成でもデュアルソケット構成でもBergamoは比類のない性能を発揮すると自負しています。

巨大なヒートスプレッダーの下を覗くと、一見すると以前のEpycと酷似したチップが現れます。実際、中央のI/Oダイとそれを取り囲む8つのコアコンプレックスダイ（CCD）に至るまで、RomeやMilanと全く同じだと考えるのも無理はありません。

AMDのBergamo Epycプロセッサは、8つのコアコンプレックスダイにまたがる128コアと256スレッドを搭載している。

類似点があるにもかかわらず、Bergamo は CCD あたりのコア数が Genoa の 2 倍の 16 個で、Zen 4c と呼ばれるまったく新しいコア設計 (「c」はおそらくクラウドを表す) を備えたまったく異なる製品です。

「Zen 4cは、パフォーマンスと消費電力のスイートスポットに最適化されており、それが密度とエネルギー効率の大幅な向上につながっています」と、AMDのCEO、リサ・スー氏は基調講演で述べた。「その結果、実装面積は35%縮小され、ワットあたりのパフォーマンスが大幅に向上した設計が実現しました。」

これらのコアは同時マルチスレッド (SMT) もサポートしていますが、Ampere はパフォーマンスの予測不可能性やセキュリティへの影響を理由に、SMT の採用を避けてきました。

しかし、コンテナ化されたスケールアウトワークロードでは、SMTが大きな効果を発揮する可能性があります。理論的には、スレッド数の増加によりAMDはより高い密度を実現できるはずです。AMDの社内ベンチマークによると、コンテナ化されたワークロードでは密度が3倍向上します。

残念ながら、AMDは基調講演前に私たちに提供した資料の中で、チップのクロック速度やキャッシュ構成を明らかにしていませんでした。そのため、追加コアを搭載するために同社がどのような譲歩を強いられたのかは分かりません。

Bergamo の新しいコアとチップレットアーキテクチャ以外にも、このプラットフォームは Genoa と多くの共通点を持っています。12 レーンの DDR5 メモリと最新の PCIe 5.0 をサポートし、シングルソケット構成とデュアルソケット構成のどちらでも構成可能です。

AMDがAmpereに対して、少なくとも現時点ではx86命令セットを幅広くサポートしていることは、大きな利点です。IntelやAMDのシステムでワークロードを実行することに慣れている顧客は、より高いコア密度を活用するためにアプリケーションをリファクタリングする必要はありません。これはArmへの移行においては必ずしも当てはまりません。

ベルガモがこの点で唯一無二の存在であるのは、そう遠くない未来のことだろう。インテルは、コア最適化されたXeonを2024年初頭にリリースすることを約束しており、さらに多くのコアを搭載する。コードネーム「Sierra Forest」と呼ばれるこのチップは、同社の高性能コアを最大144個搭載する。

AMDが新たなXチップで技術的に前進

AMD はイベント中に、コード名 Genoa-X の最新のキャッシュスタック X チップも公開しました。

このチップは、計算流体力学、電子設計自動化、有限要素解析、地震トモグラフィー、および大量の共有キャッシュの恩恵を受ける帯域幅に敏感なその他のワークロードを含む、AMD がテクニカルワークロードと呼ぶ高性能コンピューティングアプリケーションを対象としています。

AMDのGenoa-X CPUは、各チップの計算ダイの上に64MBのSRAMタイルを積み重ね、合計1.1GBのL3キャッシュを実現している。

名前が示すように、このチップは同社の標準 Genoa プラットフォームをベースにしていますが、各 CCD 上に SRAM モジュールを垂直に積み重ねることで利用可能な L3 キャッシュを増強する AMD の 3D V-Cache テクノロジを採用しています。

AMDによると、Genoa-Xは最大96コア、合計「1.1GB」のL3キャッシュを搭載可能とのことです。これは、このチップが昨年のMilan-Xと同様の構成、つまり各CCDの上に64MBのSRAMモジュールを積み重ねたものであることを示唆しています。

AMD のサーバー事業担当 SVP である Dan McNamara 氏によると、キャッシュの強化により、さまざまな数値流体力学や有限要素解析のワークロード負荷において、Intel の最上位スペックの 60 コア Sapphire Rapids Xeon と比較して 2.2 倍から 2.9 倍のパフォーマンス向上が実現します。

興味深いことに、AMDはIntelのHPC向けMax SKUとの比較を避けています。おそらく、そちらの方がより適切な比較だったでしょう。IntelのXeon Max製品には、最大64GBのオンチップHBM（メモリベースメモリ）を搭載できます。

本稿執筆時点ではAMDはこれらのパーツの価格を明らかにしていませんでしたが、標準的なEpycよりも高額になると予想されており、最終的には魅力を損なう可能性があります。The Next Platformとの過去の会話では、複数のHPCベンダーがMilan-Xの高価格が顧客にとっての悩みの種になっていると指摘しています。

インテル、CPU、GPU、メモリを1つのパッケージに詰め込むXPU計画を断念
AMD、AzureでSmartNICをサービスとして提供することを明らかに
工業デザイン：AMDが第4世代Epycのパワーを組み込みアプリケーションに導入
AMD、Ryzen 7000チップの揚げ物に関する報告を調査

AMDがMI250Xの後継機を発表

AMD は、新しい CPU と並行して、次世代の Instinct MI300 アクセラレータを再び紹介する機会を得ました。

今回、チップメーカーは、MI300Xと呼ばれるGPUのみの構成で少なくとも1つのバージョンのチップを提供する計画を発表しました。以前に発表されたパフォーマンスに関する主張に基づくと、少なくとも2つのX SKUが登場する可能性があると予想されます。

これまでAMDの公開情報のほとんどは、MI300Aと呼ばれるチップのAPU版に集中していました。このAPUは、ローレンス・リバモア国立研究所が開発中のスーパーコンピューター「El Capitan」に搭載される予定で、複数のCPU、GPU、高帯域幅メモリダイを1つのパッケージに統合しています。

1 月に、AMD は 1,460 億個のトランジスタを搭載した APU が、現行の MI250X と比べておよそ 8 倍高速な AI パフォーマンスを提供し、ワットあたりのパフォーマンスも 5 倍向上することを発表しました。

今週発表されたMI300Xは、APUの24個のZenコアとI/Oダイを廃止し、CDNA 3 GPUの搭載数を増やし、さらに大容量の192GB HBM3を搭載した、よりシンプルな設計となっています。AMDによると、これはFalcon-40B大規模言語モデルを単一のGPUに搭載するのに十分な容量です。

チップメーカーは新型GPUの発表と同時に、AI推論と学習を念頭に設計された8基のMI300Xアクセラレータを単一の標準システムに接続するAMD Infinityアーキテクチャを発表しました。このコンセプトは、最大8基の自社製GPUをサポートするNVIDIAのHGXマザーボードといくつかの類似点があります。

しかし、MI300のどちらのバージョンもまだ一般公開の準備が整っていないようです。AMDによると、MI300A APUはすでに顧客向けにサンプル出荷されており、GPUのみのバージョンは第3四半期中にベンダーへの出荷が開始される予定です。

新しいDPUが登場

最後に、AMD は、今年後半にリリース予定のコード名 Giglio という新しいデータ処理ユニット (DPU) を含む、ネットワークロードマップを少しだけ公開しました。

覚えていない人もいるかもしれないが、AMD は昨年春、Pensando を 19 億ドルで買収し、新興の DPU 市場に参入した。

詳細はほとんど明らかにされていないが、AMD は、CPU からネットワーク、セキュリティ、仮想化タスクをオフロードするように設計された最新の DPU は、現在の世代の P4 DPU と比較してパフォーマンスと電力効率が向上すると主張している。

同社の DPU はすでに、Microsoft、IBM Cloud、Oracle Cloud など、数多くの大手クラウドプロバイダーや、VMware のハイパーバイザーなどのソフトウェアスイートでサポートされています。

AMD は、今年後半に予定されている Giglio の発売に先立ち、同社の DPU 上でワークロードをより簡単に展開できるように設計された「ソフトウェアオンシリコン開発キット」により、互換性のあるソフトウェアのリストを拡大したいと考えています。®

AMDの最新Epycはコアがぎっしり詰まっていて、キャッシュがぎっしり詰まっている。