マイクロソフト、Azure 上で HPC ワークロードを処理する強力なカスタム AMD チップを発表

Table of Contents

マイクロソフト、Azure 上で HPC ワークロードを処理する強力なカスタム AMD チップを発表

Ignite巨大企業であることの利点の 1 つは、インフラストラクチャの基盤となるシリコンをカスタマイズできることです。これは、Microsoft が今週シカゴで開催される Ignite カンファレンスで実演する予定です。

レドモンドは、カスタム ハードウェア セキュリティ モジュール (HSM) と独自のデータ処理ユニット (DPU)、さらに魅力的なカスタム AMD プロセッサを Azure クラウド プラットフォームに導入し、高性能コンピューティング (HPC) ワークロードを対象とする仮想マシン インスタンスを強化します。

MicrosoftのCPUベース・スーパーコンピューティングにおける最新の進歩と評されるAzure HBv5仮想マシンは、カスタムAMD Epyc 9V64Hプロセッサを搭載しています。これらのプロセッサは、最新のZen 5テクノロジーではなく、Zen 4 CPUコアをベースにしており、最大4GHzのピーク周波数を実現します。

通常、他の VM インスタンスとプロセッサを共有するほとんどの VM インスタンスとは異なり、Azure HBv5 は 4 つの Epyc 9V64H プロセッサに分散され、最大 352 個のコアとコアあたり最大 9 GB のメモリを備え、400~450 GB の HBM3 メモリ全体で 6.9 TBps のメモリ帯域幅をサポートします。

Microsoftは、このメモリ帯域幅は、競合プラットフォームで利用可能な最新のベアメタルまたは仮想マシンインスタンスの最大8倍であると主張しています。そのため、同社はHBv5を、数値流体力学、自動車および航空宇宙シミュレーション、気象モデリング、エネルギー研究、分子動力学、コンピュータ支援エンジニアリングなど、メモリ制約が最も厳しいHPCアプリケーションに売り込んでいます。

各インスタンスには、最大 50 GBps の読み取りと 30 GBps の書き込み帯域幅と、800 Gbps の Nvidia Quantum-2 InfiniBand ネットワークが可能な 14 TB のローカル NVMe SSD も搭載されます。

レドモンドが明らかにした興味深い事実の 1 つは、各 HBv5 インスタンスを構成するカスタム チップのクラスター間の Infinity Fabric 帯域幅の合計が、「これまでのどの AMD Epyc サーバー プラットフォームよりも」 2 倍になるということです。

このことから、 The Regシステムデスクの一部メンバーは、Epyc 9V64Hは実際にはAMDのMI300A APUチップの、GPUコアとCPUコアの混合ではなくCPUのみを搭載したバージョンではないかと推測しました。Microsoftに詳細を問い合わせており、新たな情報が入り次第、改めて報告します。

ただし、Azure HBv5インスタンスはまだテクノロジープレビューとして提供されていません。Microsoftによると、興味のある方は誰でもプレビューへのアクセスにサインアップでき、2025年上半期に開始される予定です。

  • Microsoft Fabricは、単一のデータベースサービス上でトランザクションと分析を実現することを約束します。
  • マイクロソフト、349ドルのWindows 365 LinkミニPCでシンクライアント化
  • データベースの王者SQL Server 2025がAIに完全対応
  • マイクロソフトが自律型AIエージェント「Copilot」をパブリックプレビューで公開

Azureには、Microsoft初の自社製DPU「Azure Boost DPU」も搭載されます。想像力豊かな名前が付けられたこのDPUは、 Reg読者の皆様にはご存知のとおり、データセンターサーバーのホストCPUからネットワークやストレージ処理をオフロードするために設計されたプログラマブルチップです。

Azure ブー​​スト DPU

これは、クラウドの巨人が昨年のFungible社の買収で獲得した技術に基づいており、高速イーサネットとPCIeインターフェースを、ネットワークおよびストレージエンジン、データアクセラレータ、セキュリティ機能とともに、完全にプログラム可能なシステムオンチップに統合しています。

「Azure インフラストラクチャ専用に構築された Azure Boost DPU は、ハードウェアとソフトウェアの共同設計であり、カスタムの軽量データフロー オペレーティング システムを実行して、従来の実装と比較して、パフォーマンスが向上し、消費電力が少なく、効率が向上したアジャイル プラットフォームを実現します」と、Fungible の元共同創設者兼 CEO でシリコン担当コーポレート VP の Pradeep Sindhu 氏は述べています。

もう一つのカスタムシリコンはAzure Integrated HSMです。このタイプのチップは、暗号化/復号化を実行し、関連するキーをチップ自体に安全に保存する専用のハードウェアセキュリティコンポーネントです。

Azure 統合 HSM

この種のリソースは新しいものではなく、Azureを含むクラウドプラットフォームではすでに利用されています。しかし、Microsoftによると、Azure Integrated HSMは、リモートHSMサービスへのネットワークラウンドトリップの遅延や、リモートHSMからの鍵の解放要求を排除します。

「Azure Integrated HSMは、ワークロード環境に安全にバインドするサーバーローカルHSMとして、機密性の高い仮想マシンと汎用仮想マシン、そしてコンテナの両方にローカル接続されたHSMサービスを提供します。これにより、ネットワーク接続HSMの往復呼び出しに伴う遅延の欠点を回避しながら、業界をリードする使用中のキー保護のメリットが得られます」と、最高技術責任者のマーク・ルッシノビッチ氏は、この新しいシリコンを発表するブログで説明しました。

Microsoft によれば、来年から、Azure に導入されるすべての新規サーバーに Azure Integrated HSM が組み込まれるようになるという。®

Discover More