AMD、HPCおよび標準ワークロードフレーバーでAWSに第4世代Epycを追加

Table of Contents

AMD、HPCおよび標準ワークロードフレーバーでAWSに第4世代Epycを追加

AMD の第 4 世代 Eypc プロセッサが、汎用および高性能コンピューティング (HPC) タスクの選択肢として Amazon Web Services に登場しました。

AmazonのHpc7aインスタンスから始まるこれらのVMは、数値流体力学や数値気象予測など、コンピューティングとメモリ帯域幅が制限されるワークロード向けに最適化されていると言われています。Amazonによると、AMDの第3世代Epycを採用した旧型のHpc6aインスタンスと比較して、最新インスタンスは最大2.5倍高速です。

VMは、24、48、96、192コアから選択できます。通常、記載されているvCPU数はスレッド数を指しますが、Amazonによると、今回の場合、パフォーマンスを最大化するために同時マルチスレッド(SMT)が無効になっているとのことです。つまり、Amazonは96コアCPUを2つ使用しており、おそらく3.7GHzまでブースト可能なEpyc 9654と思われます。

確かなことは、AmazonがAMDのキャッシュスタック型Genoa-X CPUを採用していないということです。これらのチップは、6月に開催されたAMDのデータセンターおよびAIイベントで発表され、最大1.1GBのL3キャッシュを搭載できます。膨大なL3キャッシュを搭載していないにもかかわらず、AMDの第4世代Epycには、HPCやAIベースのワークロードに役立つと思われる多くの機能が追加されています。これには、AVX-512、Vector Neural Network Instructions(VNNI)、BFloat 16のサポート、そしてソケットあたり最大12レーンのDDR5によるメモリ帯域幅の向上などが含まれます。

Amazon の Hpc7a インスタンスは、24 〜 192 個の vCPU を備えた 4 つの SKU で利用できます。

Amazon の Hpc7a インスタンスは、それぞれ 24 から 192 個の vCPU を備えた 4 つの SKU で利用できます... クリックして拡大

これらのインスタンスのコア数は調整可能で、コア単位のライセンスでワークロードを実行しているユーザーにとってメリットとなりますが、その他の仕様は同じです。4つのSKUはすべて、768GBのメモリ、Amazon Elastic Fabric Adapterによる300Gbpsのノード間ネットワーク、そして25Gbpsの外部帯域幅を備えています。

この標準化は偶然ではありません。メモリ構成を一定に保つことで、お客様はコアあたりのメモリまたは帯域幅の比率を個別に調整できます。HPCワークロードはコア数よりもメモリ帯域幅によって制限されることが多いため、これは大きなメリットとなります。これはAMDのインスタンスに限ったことではなく、Amazonは以前発表したGraviton3EベースのHpc7gインスタンスでも同様の取り組みを行っています。

高速なノード間ネットワークも重要な要素です。Amazonは、顧客がワークロードを単一のVMで実行するのではなく、クラスター内のノードのように複数のインスタンスに分散させることを想定しています。そのため、AmazonのBatchおよびParallelClusterオーケストレーションプラットフォーム、そしてFSx for Lustreストレージサービスをサポートしています。

  • AWSは96コア、192スレッドのカスタムXeonサーバーを稼働している。
  • AMDの最新Epycはコアがぎっしり詰まっていて、キャッシュがぎっしり詰まっている。
  • アマゾンは、AMDのメニーコアBergamoプロセッサに搭載された小さなZen 4cコアに満足していない
  • 2017年以降のほぼすべてのAMD CPUがInceptionデータ漏洩攻撃に対して脆弱

AWS M7aインスタンスのパフォーマンスが向上

最速のクロック速度やメモリ帯域幅を必要としないユーザー向けに、Amazon は 6 月に予告した M7a 汎用インスタンスもリリースしました。

Amazonは、これらのインスタンスはEpyc MilanベースのM6a VMと比較して最大50%高いパフォーマンスを提供し、それぞれ3.7GHzのvCPUを最大192個搭載できると主張しています。AmazonがこれらのインスタンスにSMTを使用していると仮定すると(詳細を問い合わせました)、Amazonはこれらのインスタンスに1基のEpyc 9654を使用している可能性が高いと考えられます。偶然にも、このプロセッサは最大3.7GHzで動作します。

Amazon の M7a インスタンス パックには、最大 192 個の vCPU と 768 GB のメモリが搭載されます。

Amazon の M7a インスタンス パックは、最大 192 個の vCPU と 768GB のメモリを搭載できます... クリックして拡大

VM は、1 GB のメモリと 12.5 Gbps のネットワーク帯域幅を備えた単一の vCPU から、768 GB のメモリと 50 Gbps のネットワーク スループットを備えた 192 個の vCPU の大規模なインスタンスまで、12 種類の異なる構成で利用できます。

これらのインスタンスはすべて、ネットワーク、ストレージ、セキュリティなどのさまざまな機能をホスト CPU からオフロードする Amazon のカスタム Nitro データ処理ユニット (DPU) によってサポートされています。

しかし、Intel 側のものをお探しの場合は、最近、48 コアの Sapphire Rapids Xeon を 2 基ベースにした同社の M7i インスタンスを検討しました。

Amazon の M7a インスタンスは、クラウド プロバイダーのノースバージニア、オハイオ、オレゴン、アイルランドのデータセンターで一般利用可能になりました。®

Discover More