+コメントIBM は、今月初めのニューヨークでのテストの結果、同社の POWER9 機器は、一般的な X86 商用オフザシェルフ (COTS) キットよりも、「認知」作業を行う AI を支援するのに適していると主張しました。
Big Blue は最近「デモ」を実施し、PCIe Gen 4、EDR、QDR InfiniBand、NVMe over Fabrics などの低レイテンシ/高帯域幅技術を使用する FlashSystem アレイにリンクされた自社の専用サーバーを使用することで (他に何が?) COTS サーバーおよびストレージを圧倒できることが実証されたと述べました。
もちろん、E8、Excelero、Pavilion、Formation Data Systems などのスタートアップからは、NVMe over Fabrics アクセス ストレージ アレイがいくつか提供されており、さらに Pure Storage も X86 サーバーからのアクセスをサポートする意向を表明しています。
一方、IBMの展示ではNVMe-over-Fabrics InfiniBand(NVMe-oF)が使用されていました。IBMはAC922サーバーとFlashSystem 900アレイのいずれにおいてもNVMe-oFプロトコルのサポートを正式に発表していませんが、このテクノロジープレビューを見ると、その可能性が示唆されているようです。
デモは12月5日~6日にニューヨークで開催されたAIサミットで行われました。デモでは、AC922はPCIe Gen 4バスを採用しており、これは現在ほとんどのサーバーで使用されているPCIe Gen 3バスの2倍の速度です。
IBM は、POWER9 ベースの AC922 サーバーと 5 つの FlashSystem 900 アレイ間の NVMe-oF リンクを参加者に示し、データ アクセスの遅延が大幅に短縮され、帯域幅が拡大したと述べました。
Big Blue の Flashsystem ポートフォリオおよび有効化戦略担当マネージャーである Woody Hutsell 氏は、AC922 は「x86 サーバー内で使用される PCIe Gen 3 バスと比較して、I/O スループットを最大 5.6 倍まで向上させることができる」とブログに投稿しました。
IBMは、これは「膨大な量のデータを取り込むと同時にリアルタイムの推論(物体検出)」を実行するAIに最適だと述べた。
Hutsell 氏は、FlashSystem 900 はすでに InfiniBand リンクを使用した SRP (SCSI over RDMA プロトコル) をサポートしており、SCSI コードを NVMe コードに置き換えることでレイテンシがさらに低減されると述べました。
IBMのテクノロジープレビューのセットアップ
デモでは、AC922 はデュアル ポート NVMe-oF EDR 100Gbit Mellanox アダプターによって Mellanox Switch-IB 2 7800 に接続され、5 つの FlashSystem 900 エンクロージャーにリンクされ、各エンクロージャーには 4 x 40Gbit/s QDR InfiniBand ポートが装備されていました。
この構成では、23GB/秒の読み取りと18GB/秒の書き込みで合計41GB/秒の帯域幅を実現しました。アクセスレイテンシは非公開です。
IBMは、POWER9サーバーとFlashSystem 900/NVMeoF InfiniBandの組み合わせが、エンタープライズAIに必要な低レイテンシと帯域幅を実現すると述べています。これは、NVMe over Fabricsで他のオールフラッシュアレイに接続されたX86サーバーが実現できる性能よりも優れていることを示唆しています。しかし、レイテンシの数値がないため、この主張を評価することは困難です。
+コメント: COTS セットアップはこれに匹敵しますか?
NASAエイムズ研究所のExcelero NVMe over Fabrics仮想SANシステムでは、4K IOPSの平均レイテンシは199μ秒、最小値は8μ秒でした。システムの帯域幅は、1MBのブロックサイズで140GB/秒以上でした。
このシステムは128台のコンピューティングノードで構成されており、IBMの単一サーバーデモとは大きく異なります。とはいえ、大まかなプレゼンスを示しているだけなので、Xeon SPサーバーベンダーがPCIe Gen 4、NVMe over Fabrics、100Gbit/s Ethernetリンクを備えたオールフラッシュアレイシステムと接続し、どのような結果が得られるか試してみるかもしれません。®