Cray 社は、複数の CPU、GPU、相互接続をサポートするほぼ構成可能な計画のスーパーコンピュータである Shasta を発表しました。これには、ノイジー ネイバー ネットワークの輻輳問題を解決する新しい高速 Slingshot イーサネット互換ファブリックが含まれます。
Shastaは、従来のHPCのようなモデリングとシミュレーション、AI、アナリティクスなど、複数のワークロードタイプを実行できるように設計されています。標準的な19インチラックまたは水冷ラック(温水冷却を含む)を使用して構築できます。
これらの水冷ラックは、ブレードごとに複数のプロセッサを搭載した64枚のコンピューティングブレードを収容できるように設計されています。このシステムは、500Wを超えるプロセッサをサポートできます。
クラスタ化された処理ノード、Cray の ClusterStor およびその他のストレージがあり、キャビネットの数は 100 台を超える場合があります。
コンピューティング面では、IntelおよびAMDのx86 CPU、Marvell Thunder X2 ARMプロセッサ、Nvidia TeslaやAMD RadeonなどのGPU、そしてFPGAをサポートしています。これらを単一のShastaシステム内で混在させて使用できます。Crayの新しいSlingshot、Mellanox InfiniBand、IntelのOmniPathなど、複数のインターコネクトオプションも利用可能で、これらもShastaシステム内で混在させて使用できます。
Cray は Shasta システム管理ソフトウェアを開発しており、このソフトウェアにより、特定のプロセッサ、相互接続、ストレージを使用するワークロードの作成が可能になる予定で、これは一種のコンポーザビリティのように見えます。
Shasta システムは 2019 年第 4 四半期に利用可能になる予定です。
スリングショット
これは、Rosetta ASICを内蔵したスイッチを用いた相互接続です。これらのスイッチは、64個の200Gbit/sポートと12.8Tbit/sの双方向帯域幅を備えています。Slingshotは最大25万のエンドポイントをサポートし、Slingshotファブリックを通過するホップ数は最大3です。これは、Crayの現在のXCシステム相互接続で必要な5ホップよりも大幅に短縮されています。
スリングショットの属性に関する独自の図
このインターコネクトは、アダプティブルーティングと輻輳制御機能を備えており、ワークロードによる帯域幅の占有、ノイジーネイバーネットワークの問題、そしてサービス品質の確保を防止します。また、イーサネットとの互換性も備えています。SlingshotがHPCインターコネクトコアの周囲にイーサネットエッジを備えていると考えてみてください。
イーサネットと HPC トラフィックを混在させて同じ回線上で実行できます。
Cray 氏は、Shasta は IP ルーティングとリモート メモリ操作の両方をサポートすると述べました。
NERSC パールマッター
米国エネルギー省の国立エネルギー研究科学計算センター(NERSC)は、ノーベル賞受賞科学者ソール・パールマッターにちなんで名付けられたシャスタ・システムを1億4,600万ドルで購入する。
この Xeon フリー システムには、CPU と GPU アクセラレーション ノードの異種組み合わせがあります。
- AMD Epyc CPU
- Tensor Coreテクノロジーを搭載したNvidia GPU
- スリングショットインターコネクト
- 直接液体冷却
- Lustreファイルシステム
オールフラッシュのスクラッチファイルシステムを搭載し、4TB/秒以上の速度でデータを移動します。
Perlmutterシステムは2020年に導入され、NERSCのCoriスーパーコンピュータの3倍の計算能力を発揮すると予想されています。実際のペタFLOPS値は明らかにされていませんが、ウェルズ・ファーゴのシニアアナリスト、アーロン・レイカーズ氏はピーク性能が約100ペタFLOPSであると述べています。
「次世代スーパーコンピュータが特に大規模で複雑なデータ分析に対応できると聞いて大変嬉しく思います。このシステムが『パールマッター』と名付けられると知り、大変光栄に思います」と、パールマッターの名を冠した科学者は述べた。
「とはいえ、コンピューターにイライラする気持ちは誰もが知っているので、少し不安も感じています。難しいデータセットと長い待ち行列に格闘した一日の後、誰も私を責めないでほしいです!少なくとも、ログインするために10文字の名字を入力する必要がないことは保証されています。」®