HPC ブログISC17 学生クラスター コンテストで大きな出来事がありました。フリードリヒ アレクサンダー大学 (FAU) の学生が、HPL (LINPACK) の学生クラスター コンテストの世界記録を更新しました。
これにより、地元ドイツチームが念願の最高LINPACK賞を獲得しました。
ドイツのチームが母国で主要なパフォーマンス賞を受賞したのは今回が初めてであり、地元ニュルンベルクでパレードや銅像の建立が行われる国民の祝日が宣言される可能性も高い。
リンスが最大限に詰め込まれた
LINPACKベンチマークでは、上位5校のグループ分けはかなり拮抗しており、FAUは2位のPurdue/NEUより10%未満のスコア差でトップの座を獲得した。
両チームともGPUを多用したシステムを採用していました。Purdue/NEUは2つのノードに驚異的な16基のNVIDIA P100 GPUを搭載していましたが、FAUはデュアルノードのマシンに12基のP100しか搭載しないという保守的なアプローチを採用していました。(ええ、12基のP100は保守的ですね…笑)
大会前、FAUチームは私に、16GPU構成でテストした結果、GPUの数が少ない場合よりもパフォーマンスが低かったことを打ち明けてくれました。彼らは、16GPUはPCIバスの処理能力を超えており、その結果生じるバスの混雑がパフォーマンス低下の原因だと推測していました。
Purdue/NEU はマシンを使用する時間があまりなかったため、考えられるすべての構成をテストする機会がありませんでした。おそらくこれが FAU の発見を逃した理由です。
EPCCは「3のルール」クラスタ(3ノード、9基のGPU、そして液冷システム)でまさにその点にありました。GPUをオーバークロックして液冷システムの利点を活かしてほしかったですね。そうすれば、3位入賞かLINPACKトロフィー獲得かの分かれ目になったはずです。でも、私が一体何を知っているというのでしょう?クラスタを組んだことなんて一度もありませんから。
上位4チームはすべて、無錫で開催されたASC17大会で樹立されたHPLの既存記録30.71を上回りました。南洋はわずかにその記録を下回りました。
歴史的に、LINPACK の数値は次のように表されます。
ご覧のとおり、SC16ではNVIDIA P100 GPUが登場し、スコアは飛躍的に向上しました。ASC17でも若干の改善が見られましたが、ISC17では再び大幅な向上が見られました。
今回、なぜこれほど大きな伸びが見られたのかは分かりませんが、優勝チームが使用していたフォームファクターに関係しているのではないかと考えています。1つのノードに8つのGPUを搭載することで、4つの異なるノードに8つのGPUを搭載するよりも、GPU同士、そしてホストプロセッサとの通信がはるかに効率的になります。
ISC17 の学生たちも学生 HPCG 記録を破りましたので、お楽しみに…