汗だくの学生たちが武漢の闘いに備えて高温のHPCクラスターを準備する

Table of Contents

汗だくの学生たちが武漢の闘いに備えて高温のHPCクラスターを準備する

HPC ブログアジア学生スーパーコンピュータ コンテスト (ASC) は、学生クラスター コンテスト国際サーキットで開催される本物のストックカー レースに最も近いものです。

ASC では、主要スポンサーである Inspur によって提供されるノードを、限られた構成範囲で駆動します。

以下の各チームは、ほぼ同一の基本ノードを使用しており、各ノードにはデュアル 10 コア Xeon プロセッサ、128 GB の RAM (ただし、1 つのチームは電力を節約するために RAM の一部を取り外しました)、および Mellanox Infiniband FDR 相互接続が搭載されています。

しかし、下のグラフからわかるように、大きな違いもあります。一部のチームは「スモールボール」アプローチを採用し、ノード数は少ないものの、アクセラレータの数が多いシステムを構築しました。

この構成は、チームがLINPACKの王座を狙っていることを示す場合もありますが、必ずしもそうとは限りません。また、ほとんどのアプリケーションでアクセラレータを使用し、その他のアプリケーションではチューニングによって栄光を勝ち取る能力にチームが自信を持っていることを意味する場合もあります。

一方、これは単なる不運を意味する場合もあります。香港バプテスト教会の場合のように、4 番目のノードを MPI で動作させることができなかったケースがこれに当たります。

構成がグループ分けされているのが興味深いところです。6ノード以下のチームが5チーム、7~9ノードのチームが6チーム、10~12ノードのチームが5チームです。3,000ワットの電力制限を考えると、小規模なクラスタチームはフル稼働できると思われるかもしれませんが、必ずしもそうではありません。こうした小規模なシステムであっても、制限内に収めるためには綿密な管理が必要であり、頻繁にスロットリングを行なわなければなりません。

ハードウェアの規模を考えると、ノード数の多い企業は明らかに有利だと思うかもしれませんが、必ずしもそうではありません。3,000 ワットの制限内に収めるためには、アプリケーション実行中にクラスターの大部分をアイドル状態にしておく必要があることがよくあります。®

Discover More