AMDは、スーパーコンピューターやハイエンドAI処理向けの最も強力なシリコンと言われるMI100 GPUを発表した。

Table of Contents

AMDは、スーパーコンピューターやハイエンドAI処理向けの最も強力なシリコンと言われるMI100 GPUを発表した。

AMDは月曜日、スーパーコンピューターやハイエンドサーバーのAIソフトウェアや数学負荷の高いワークロードを高速化することを目的としたGPU、Instinct MI100アクセラレーターを発表した。

これはTSMC製の7nmプロセスGPUで、コードネームはArcturus。AMDのCDNAアーキテクチャを採用した初のGPUです。ハードウェアには120個の演算ユニットと7,680個のストリームプロセッサが搭載され、最大11.5TFLOPSのFMA64およびFP64精度演算を実行可能とのことです。AMDによると、FP16行列演算では184.6TFLOPS、流行のbfloat16演算では92.3TFLOPSの性能を発揮します。PCIeカードに搭載されて出荷されます。

「本日、AMDは世界最速のHPC GPUであるAMD Instinct MI100を発表し、エクサスケールコンピューティングへの道のりを大きく前進させました」と、AMDのデータセンターGPUおよびアクセラレーション処理担当コーポレートバイスプレジデントであるブラッド・マクレディ氏は述べています。「科学計算において重要なワークロードに的を絞った当社の最新アクセラレータは、AMD ROCmオープンソフトウェアプラットフォームと組み合わせることで、科学者や研究者の皆様にHPC研究のための優れた基盤を提供するように設計されています。」

AMDMI100

MI100アクセラレータカード…出典:AMD。クリックして拡大

AMDは先週の記者会見で、トランジスタ数やダイサイズを公表しませんでした。しかし、公開されている仕様によると、各チップはPCIe 4インターフェースを採用し、32GBのHBM2メモリを搭載し、最大1.2TB/秒のメモリ帯域幅を維持し、最大TDPは300Wです。また、3つのAMD Infinity Fabric Linkにより、カードあたり340GB/秒の帯域幅を転送可能です。

MI100アクセラレータは、NVIDIAの最新GPUであるA100に対抗するように設計されています。しかし、A100はRAMとメモリ帯域幅(最大80GB、2,039GB/秒)が優れています。また、MI100はFP64の基本性能(11.5TFLOPS、A100は9.7TFLOPS)も優れていますが、Tensorコアを使用すると、A100のFP64性能は19.5TFLOPSにまで急上昇します。A100は低精度でも高い性能を発揮し、最大TDPも高くなっています。

AMDは、MI100アクセラレータがA100と比較してより高いコストパフォーマンスを提供することで、顧客にエクサスケール・スーパーコンピュータ構築へのより安価な道筋を提供すると考えています。このハードウェアは、機械学習フレームワークPyTorchとTensorflowを高速化できるAMDのROCm 4.0オープンソースプラットフォームによってサポートされています。

AMDのEpycサーバープロセッサと併用するように設計されたMI100 GPUは、高負荷の機械学習ワークロードや、気候モデリング、天体物理学、流体力学といったシミュレーションを高速に処理することが期待されています。MI100は、HPE、Dell、Supermicro、Gigabyteなど、複数のベンダーから提供され、今月中に出荷開始される予定です。®

Discover More