学生が競争的クラスタリングLINPACKの世界記録を破る

Table of Contents

学生が競争的クラスタリングLINPACKの世界記録を破る

HPC ブログISC17 学生クラスター コンテストで大きな出来事がありました。フリードリヒ アレクサンダー大学 (FAU) の学生が、HPL (LINPACK) の学生クラスター コンテストの世界記録を更新しました。

これにより、地元ドイツチームが念願の最高LINPACK賞を獲得しました。

ドイツのチームが母国で主要なパフォーマンス賞を受賞したのは今回が初めてであり、地元ニュルンベルクでパレードや銅像の建立が行われる国民の祝日が宣言される可能性も高い。

リンスが最大限に詰め込まれた

LINPACKベンチマークでは、上位5校のグループ分けはかなり拮抗しており、FAUは2位のPurdue/NEUより10%未満のスコア差でトップの座を獲得した。

両チームともGPUを多用したシステムを採用していました。Purdue/NEUは2つのノードに驚異的な16基のNVIDIA P100 GPUを搭載していましたが、FAUはデュアルノードのマシンに12基のP100しか搭載しないという保守的なアプローチを採用していました。(ええ、12基のP100は保守的ですね…笑)

大会前、FAUチームは私に、16GPU構成でテストした結果、GPUの数が少ない場合よりもパフォーマンスが低かったことを打ち明けてくれました。彼らは、16GPUはPCIバスの処理能力を超えており、その結果生じるバスの混雑がパフォーマンス低下の原因だと推測していました。

Purdue/NEU はマシンを使用する時間があまりなかったため、考えられるすべての構成をテストする機会がありませんでした。おそらくこれが FAU の発見を逃した理由です。

EPCCは「3のルール」クラスタ(3ノード、9基のGPU、そして液冷システム)でまさにその点にありました。GPUをオーバークロックして液冷システムの利点を活かしてほしかったですね。そうすれば、3位入賞かLINPACKトロフィー獲得かの分かれ目になったはずです。でも、私が一体何を知っているというのでしょう?クラスタを組んだことなんて一度もありませんから。

上位4チームはすべて、無錫で開催されたASC17大会で樹立されたHPLの既存記録30.71を上回りました。南洋はわずかにその記録を下回りました。

歴史的に、LINPACK の数値は次のように表されます。

ご覧のとおり、SC16ではNVIDIA P100 GPUが登場し、スコアは飛躍的に向上しました。ASC17でも若干の改善が見られましたが、ISC17では再び大幅な向上が見られました。

今回、なぜこれほど大きな伸びが見られたのかは分かりませんが、優勝チームが使用していたフォームファクターに関係しているのではないかと考えています。1つのノードに8つのGPUを搭載することで、4つの異なるノードに8つのGPUを搭載するよりも、GPU同士、そしてホストプロセッサとの通信がはるかに効率的になります。

ISC17 の学生たちも学生 HPCG 記録を破りましたので、お楽しみに…

Discover More