欧州ではNVIDIAとIntelの技術を搭載したスーパーコンピュータ4台が建設される予定で、そのうち1台はAIアプリケーション向けに構築された史上最強のスーパーコンピュータになるとGPU大手は予測している。
Leonardoというニックネームを持つこの最上位マシンは、FP16精度でありながら10エクサフロップスの性能を達成すると予想されています。スーパーコンピュータはFP64でベンチマークされることが多いですが、AIにはFP16でも十分だと考えられています。NVIDIAがLeonardoを「世界最速のAIスーパーコンピュータ」と謳ったのは、FP16以下の精度で機械学習やデータ分析アルゴリズムを実行する場合、公に知られている中で最速のコンピュータとなるからです。FP16を超える精度を必要とするワークロードの実行となると、他のスーパーコンピュータに大きく差をつけられるでしょう。
伝えられるところによると、レオナルドには、NVIDIA の最新の Ampere A100 GPU が約 14,000 個搭載され、70 の大学と 4 つの政府資金によるイタリアの研究機関、およびイタリアの教育・大学・研究省で構成される非営利団体 CINECA によってイタリアで運営される予定です。
レオナルドの新しいイタリアの家。出典:Nvidia。クリックして拡大
「LeonardoはAtos Sequanaノードから構築され、各ノードには4基のNvidia Tensor Core GPUと1基のIntelプロセッサが搭載されます」とNvidiaは述べています。Intelチップは10nmプロセスSapphire Rapids Xeonスケーラブルプロセッサで、来年発売予定です。このスーパーコンピューターは、フランスに本社を置くIT企業Atosによって構築され、ネットワークにはNvidia傘下のMellanoxのHDR Infinibandが採用されます。
CINECAはこのマシンを、薬物研究、天体物理学の問題の解析、異常気象の予測などに活用します。ワークロードの高速化には、NVIDIA CUDAライブラリを使用します。
本日発表された4台のスーパーコンピュータは、EUが支援する欧州高性能コンピューティング(EuroHPC)共同事業の一環として構築されます。これは、加盟国がコンピューティングリソースを共有するプロジェクトです。このグループは、FP64で少なくとも100PFLOPSの性能を発揮するサブエクサスケール・スーパーコンピュータ(Leonardoを含む)を合計3台、1PFLOPSのマシンを5台構築する予定です。
Nvidiaのワールドワイドソリューションアーキテクチャおよびエンジニアリングチームのリーダー、マーク・ハミルトン氏は、世界で最も速い公に知られているスーパーカーのトップ500リストの作成は「科学というよりも芸術」であり、2022年にリストが完成したらレオナルドがどの順位になるかはNvidiaとしては「待って見るしかない」とEl Regに語った。
Leonardoと同様に、他の3つのスーパーコンピュータもすべてNvidiaのA100チップを採用しています。MeluXinaもルクセンブルクのAtos社によって構築され、800基のGPUを使用して、FP16 AIコンピューティングで約500ペタフロップスの処理能力を発揮します。チェコ共和国のIT4Innovations国立スーパーコンピューティングセンターに設置される次のスーパーコンピュータはHPE社によって構築され、560基のA100を搭載し、最大350ペタフロップスの処理能力を発揮します。最後に、スロベニアに設置され、同国の著名な数学者Jurij VegaにちなんでVegaと名付けられた4番目のスーパーコンピュータもAtos社によって構築され、ピーク時150ペタフロップスで動作する240基のGPUと、1,800個のHDR 200Gb/s Infinibandエンドポイントを備えています。
4 台のコンピューターはすべて、64FP および 32FP のほか、bfloat16 および 8 ビット整数など、より高い精度とより低い精度でシミュレーションを実行できます。®