Metaが最新ハードウェアを公開 – 顔には装着できないので、慌てる必要はありません

Table of Contents

Metaが最新ハードウェアを公開 – 顔には装着できないので、慌てる必要はありません

火曜日に開催された2022 Open Compute Project (OCP) Global Summitで、Metaは機械学習と推論のための第2世代GPU搭載データセンターハードウェア「Grand Teton」というシステムを発表しました。

「OCPコミュニティに貢献する、大規模AI向け次世代プラットフォーム『Grand Teton』を発表できることを大変嬉しく思います」と、Metaのエンジニアリング担当副社長であるアレクシス・ビョルリン氏はThe Registerへのメモで述べています。「他のテクノロジーと同様に、私たちは長年にわたりOCPコミュニティにAIプラットフォームを熱心に提供してきました。今後もパートナーシップを継続していくことを楽しみにしています。」

Grand Teton は、データセンターでの大規模 AI ワークロードの高速処理向けに調整されており、ホストから GPU への帯域幅が 4 倍、コンピューティングおよびデータ ネットワーク帯域幅が 2 倍、電力エンベロープが 2 倍向上するなど、前世代の Zion と比べて数多くの改善を誇ります。

メタOCPグランドティトンボックス

MetaのGrand Tetonオールインワンボックス

Zion-EX プラットフォームは複数の接続されたサブシステムで構成されていましたが、Grand Teton ではそれらのコンポーネントを単一のハードウェア シャーシに統合しています。

Björlin氏によると、ZionはCPUヘッドノード、スイッチ同期システム、GPUシステムで構成され、すべて外部ケーブルで接続されています。Grand Tetonは、電源、コンピューティング、ファブリックインターフェースを統合した単一のボックスで、パフォーマンス、シグナルインテグリティ、熱性能が向上しています。この設計により、データセンターへの統合が容易になり、信頼性も向上するとされています。

Grand Tetonは、ディープラーニングレコメンデーションモデル(DLRM)のような、メモリ帯域幅が制限されるワークロードをより適切に処理できるように設計されており、トレーニングだけでゼタフロップスの演算能力が必要になることもあります。また、コンテンツ理解のような演算能力が制限されるワークロードにも最適化されています。

Metaは、自社が販売するVRゴーグルを使ってデータセンターの設計図を閲覧したいというユーザーの期待に応えるため、ハードウェア設計の3Dモデルを公開するウェブサイト(metainfrahardware.com)を立ち上げました。同社は、VRヘッドセットを使ってアクセスできる、相互接続された仮想現実世界の銀河「Metaverse」の推進に注力しています。

  • HPE、クラウドネイティブワークロード向けArmベースのProLiantサーバーを発表
  • オープンコンピューティングプロジェクトは、戦略2.0でオープンシリコンと光学系を設計します。
  • Supermicroの「ユニバーサルGPU」システムはあらゆる要素を歓迎する
  • 標準の欠如が液浸冷却の進歩を妨げているのでしょうか?

OCPは2011年にFacebookによって設立されました。Facebookは昨年、スキャンダルを抱えることのないMetaという親会社のもとで再編されました。OCPは、コンピューティングパワーの大規模消費者が、エンタープライズおよびハイパースケール向けに最適化されたデータセンターサーバーおよび関連機器のハードウェア設計を共有できるようにすることを目的としています。OCPは、Facebook、Google、その他のクラウド事業者が、サーバーベンダーに設計を指示させるのではなく、必要なサーバーを正確に指定し、契約メーカーにオンデマンドで製造を依頼できるようにしました。このプロジェクトはその後、コミュニティを拡大してきました。

つまり、OCPは、相互運用可能な機器を構築したい場合やクラウド大手からインスピレーションを得たい場合など、人々が参考にしたり活用したりできるオープンな仕様、ベストプラクティス、その他の要素を集約したものです。提供された設計は、大手企業がデータセンターのニーズに関してどこに向かっているのか、そして望ましい規模を実現するためにどのような設計上の決定を下しているのかを知る上で、有用かつ興味深いものです。

OCP の市場への影響は比較的控えめです。企業は 2020 年に OCP キットに 160 億ドル以上を費やし、その数字は 2025 年までに 460 億ドルに達すると予測されています。データセンター インフラストラクチャ市場全体は、2025 年には約 2,300 億ドルになると予想されています。

Metaは、ラックマウント型IT機器の導入と保守を容易にすることを目的とした、共通ラックおよび電源アーキテクチャの最新版であるOpen Rack v3(ORV3)についても言及しています。ORV3は、ラック内の任意の場所に設置できる電源シェルフを備えています。

「1本のバスバーに複数の棚を設置することで30kWラックに対応でき、48VDC出力は将来的により高い電力伝送ニーズにも対応します」と、ビョルリン氏は本日公開予定のブログ記事で述べています。「また、バッテリーバックアップユニットも改良され、従来モデルの90秒から4分に容量が延長され、棚あたり15kWの電力容量を実現しています。」

ORV3 は、空気補助液体冷却や施設水冷などのさまざまな液体冷却戦略に対応するように設計されています。

「電力需要の増加と液体冷却の進歩の必要性により、プラットフォーム、ラックと電源、データセンター設計のあらゆる要素について、異なる考え方を迫られています」とビョルリン氏は説明する。®

Discover More