Hot Chips Intel は、今週の Hot Chips カンファレンスで、同社の主力データセンター GPU (コード名 Ponte Vecchio) をこれまでで最も詳しく披露しました。独自の内部ベンチマークでは、このチップが AMD の MI250x を上回り、Nvidia の次期 H100 GPU と真っ向から競合していることが示されました。
昨年発表されたPonte Vecchioは、AI/MLおよびHPCアプリケーション向けの高性能GPUを提供するというIntelの真剣な試みの第一弾です。このチップ自体は、IntelのFoverosとEMIBパッケージング技術を組み合わせてメモリとコンピューティングダイを「スタック」状に接着したもので、アクセラレータごとに2つのスタックが配置されています。
Intel フェローの Hong Jiang 氏によると、これらのスタックは、アプリケーションのニーズに応じて、GPU ダイのペアのように動作することも、単一の論理ダイとして動作することもできます。
Intel は、Ponte Vecchio は設計の選択に基づいて 52 テラフロップスを実現し、同じピーク FP32 および FP64 パフォーマンスを可能にし、昨年発表された AMD の 47.9Tflops (FP64) の MI250X をわずかに上回り、H100 の 60Tflops (FP64) に肉薄すると主張している。
ヴェッキオ橋…ホットチップスで間近に。出典:インテル
ちなみに、通常、FP32はFP64の2倍の精度を持ちます。これはFP32の方が精度が低いためです。しかし、IntelはFP32のパフォーマンスをFP64と同等に抑えることを選択しました。おそらく、FP64とAIに適した精度が、昨今では32ビット浮動小数点よりも重要だと考えているのでしょう。
IntelはHot Chipsで、XMX行列アクセラレータの性能についても説明しました。これは多くの点でNVIDIAのTensorコアに類似しています。単精度行列計算(Tensor float)において、IntelによるとこのGPUは419Tflopsの性能を発揮します。
パフォーマンスの一部は、64 MB のレジスタ ファイル、64 MB の L1 キャッシュ、408 MB の L2 キャッシュ、および 128 GB の HBM メモリを含む Ponte Vecchio の大容量キャッシュによるものです。
- インテル初のディスクリートGPUはホームランにはならないだろう
- Nvidia、Hopper搭載DGX H100にIntelのSapphire Rapids CPUを採用
- インテルの Falcon Shores XPU は、プロセッサ パッケージ内で CPU と GPU を混在させることができます。
- インテル、ハイブリッド統合ディスクリートグラフィックスを搭載したGPUロードマップを発表
「これは、HBM メモリにアクセスする必要がなくなり、ダイ上にデータを保持できるので非常に役立ちます」と Jiang 氏は語ります。
対応するPCIe 5.0 CPUがない
Intel と Nvidia の GPU はどちらもホストとの接続に PCIe 5.0 に依存しているため、AMD の PCIe 4.0 ベースの MI200 シリーズ GPU と比較するのは厳密には同等の比較にはなりません。
新しい PCIe 仕様では、ホストに 2 倍の帯域幅が提供されますが、Intel または AMD のいずれかの次世代 CPU が必要ですが、どちらもまだ提供されていません。
Nvidia は、AMD の Epyc 4 チップがこの秋に発売されるときにそれを簡単に選択することも、独自の Grace CPU を使用することもできたが、Intel は完全に Intel のアーキテクチャを維持するようだ。
HotChipsでは、幹部らが1Uシャーシに収められた液冷式Ponte Vecchio GPU 4基と、長らく発売が遅れていたSapphire Rapids Xeon スケーラブルプロセッサ2基を組み合わせたものを披露しました。Jiang氏によると、同社のXe Linkファブリックを使用することで、1つのノードに最大8基のGPUを接続できるとのことです。
最新の報道によると、チップの発売は当初の予定より1年半以上遅れて、2023年第1四半期まで延期されたという。
その結果、Intel は CPU 部門が Sapphire Rapids を提供するまで、完全に優れた GPU を待つことになるかもしれない。
- AMDは5nm Ryzen 7000 CPUに大きな期待を寄せている。そして、ここから盛り上がりが始まる。
- この小さなIntel Xeon搭載PCボードは、Raspberry Piをいつでも持ち運べます
- インテル、知的財産管理会社との契約で約5,000件の特許を譲渡
- インテルはついにソフトウェア最適化のヒントを得た
スーパーチップの登場
実際にポンテ・ヴェッキオが完成する頃には、比較ははるかに不利なものになるかもしれません。
AMDは、Instinct MI300アクセラレータを2023年にリリースする予定で、同社はこれを「初のデータセンターAPU」と謳っている。
これらのチップは、Zen 4プロセッサとCDNA 3ベースのGPUをパッケージングして搭載されます。AMDは今春のプレゼンテーションで、APUはMI250Xと比較して8倍の性能向上を実現すると発表しましたが、実際のパフォーマンスにそれが反映されるかどうかは不明です。
もしこの話に聞き覚えがあるとしたら、それはIntel、Nvidia、AMDがいずれもこの方向に進んでいるからです。今春のGTCで、NvidiaはArmベースのGrace CPUとGH100 GPU、そして512MBのLPDDR5Xメモリと80GBのHBM3メモリを1000Wの単一パッケージに搭載したGrace-Hopperスーパーチップを発表しました。
負けず劣らず、インテルも5月にFalcon Shores XPUに関する同様の計画を発表しており、この計画ではチップメーカーがHBMを搭載したSapphire Rapids CPUとPonte Vecchio GPUスタックを1つのパッケージに統合する予定です。
インテルは、このプラットフォームは「現在のプラットフォーム」と比較して、ワットあたりのパフォーマンス、メモリ容量、帯域幅が5倍向上すると主張している。
地平線にリアルト橋が見える
Ponte Vecchio は、Nvidia や AMD との競争に直面しているだけでなく、これ以上延期された場合、Rialto Bridge というコード名の後継チップによって寿命が短くなる可能性もあります。
実際に、2021 年初頭に発売された Intel の第 11 世代 Rocket Lake CPU でこのようなことが一度発生しましたが、数か月後には、大幅なパフォーマンス、コア数の向上、プロセスの改善を実現したはるかに優れた Alder Lake リフレッシュに置き換えられました。
来年サンプル出荷が始まる予定の Rialto Bridge では、Intel がモジュールあたりの消費電力を 800W に引き上げ、液体冷却が必要になる予定だ。
いずれにせよ、ポンテ・ヴェッキオの到着を待ちわびている顧客が少なくとも一つある。米国エネルギー省傘下のアルゴンヌ国立研究所だ。同研究所は、このチップをAuroraスーパーコンピュータに搭載する予定だ。つまり、Intelのせいで大幅な遅延が生じた末、ようやくポンテ・ヴェッキオが到着する時が来るということだ。®