HPC サプライヤーの DDN は、自社のストレージを Nvidia の DGX-1 GPU サーバーと組み合わせることで、エンタープライズ AI の主流に進出する小規模ながらも成長を続ける企業の一群に加わりました。
DDN は最近、エンタープライズ ストレージの資格を拡大するためにいくつかの措置を講じており、エンタープライズ アレイの販売のために Tintri を買収し、さらに A3I ブランドのスケーラブルなリファレンス アーキテクチャ製品で AI システム分野に参入しています。
DDN A3I スケーラブル リファレンス アーキテクチャ
エンタープライズAIシステム市場は、PureがAIRIのFlashBladeアレイとDGC-1を組み合わせたことで初めて確立されました。その後、NetAppがA700オールフラッシュアレイとFGX-1の組み合わせで参入し、さらに高速なA800とDGX-1の組み合わせが続きました。Dell EMCはReady Solution for AI: Deep Learningで、CiscoもC480 AI/機械学習サーバーで参入しました。
これらのシステムはすべてオールフラッシュストレージを採用しており、DDNはAI200およびAI400オールフラッシュシステムに加え、フラッシュ/ディスクハイブリッドのAI7990を提供しています。どちらも、Lustreベースの並列ファイルシステムであるDDNのExascalerソフトウェアを実行しています。
AIに100万ドル以上を費やす余裕があるなら、NvidiaのAIRIの妖精、Pureに会ってみませんか。ハイパーコンバージドのモンスターです。
続きを読む
AI200は、2U筐体に最大360TBのデュアルポートNVMeフラッシュドライブ24基を搭載し、4つのEDR InfiniBand (EDR IB)または100Gbit/s Ethernet (100GbitE)でDGX-1に接続します。ファイルシステムのシーケンシャルリードスループットは最大20GB/秒、IOPSは100万を超えます。
AI400は同じエンクロージャを使用し、最大40GB/秒のシーケンシャルリードスループットと最大300万IOPSを実現します。8つのEDR InfiniBandポートまたは100GbitEポートを備え、フラッシュ容量も同じです。
4Uキャビネットに収められた大型のAI7990は、シーケンシャルリード性能が20Gbpsに戻り、最大700,000 IOPSを実現します。SSDおよびディスクドライブ用の3.5インチスロットを90個サポートします。最大4台の拡張シャーシ(各シャーシに90ベイ搭載)を接続でき、最大5.6PBの容量を提供します。
ダウンロード可能な DDN A3I ソリューション概要には、Resnet-50 および Resnet-152、Caffe GoogleNet、Inception V3 などの A3I ソフトウェアを使用した A3I システムの使用例が記載されています。
A3I ソリューション ガイドでは、9 台の DGX-1 サーバーを備えた AI200 の構成例と、Tensorflow、Horovod、TensorRT、Torch、PyTorch などの AI フレームワークを使用したシステム パフォーマンスについて説明します。
様々なGPU数におけるResnet-12の結果。すべてのサプライヤーが各GPU数レベルでの値を提供しているわけではないため、グラフにはギャップがあります。
Resnet-152およびResnet-50テストにおいて、AI200は競合するPure、NetApp、Dell EMCシステムよりも高速であることが示されました。Ciscoは、AIシステムのパフォーマンスに関する公開情報を提供していません。
Resnet-50の結果。繰り返しますが、すべてのサプライヤーが各GPUカウントレベルで値を提供しているわけではありません。
AI200 および AI7990 のデータシートはこちらから入手できます。®