PavilionがRocEとTCP NVMe over Fabricsのパフォーマンスを比較

Table of Contents

PavilionがRocEとTCP NVMe over Fabricsのパフォーマンスを比較

分析Pavilion Data によると、TCP を使用する NVMe over Fabrics では、RDMA RoCE に追加されるレイテンシが 100µs 未満となり、データ センター規模で使用可能になります。

このビジネスは、NVMe-over-Fabrics (NVMe-oF) フラッシュ アレイの先駆者であり、すでに RoCE と TCP NVMe-oF トランスポートの同時サポートを行っています。

製品責任者のジェフ・ソーサ氏はEl Regに対し、「当社はNVMe-over-TCPをサポートしています。NVMe-over-TCP規格はいつでも承認される準備が整っており、年末までに承認される予定です」と語った。

「実際に、当社のアレイの 1 つから RoCE 対応 NVMe-oF と TCP の両方を同時に導入しているお客様がいます。」

Pavilion社によると、NVMe-oFはDASのパフォーマンスとSANの運用上の利点を兼ね備えています。NVMe-oFの実装は完全なHA(高可用性)を実現し、単一障害点がなく、集中データ管理によってホスト処理の負荷を軽減します。

このデータ管理を MongoDB などに使用すると、次のことが可能になります。

  • 書き込み可能なクローンは、ネットワーク経由でデータをコピーすることなく、セカンダリホストに即座に提示されます。
  • 任意のホストでオンデマンドでディスク容量を動的に増加します。
  • 高速スナップショットを使用してクラスタ全体を瞬時にバックアップします。
  • クローンを使用して、テスト/開発/QA用のクラスタ全体のコピーを迅速に展開します。
  • 各ノードがログデータを共有ストレージに直接書き込むことで、ログ転送の必要性を排除します。
  • Pavilion REST API を使用して、すべての操作を調整および自動化します。

Pavilion_RoCE_vs_TCP_test_setup

Pavilion RoCE vs TCP NVMe-oF テストセットアップ。クリックすると拡大表示されます。

Pavilion は、1 ~ 20 のクライアント アクセサーを使用して、RoCE および TCP と NVMe-oF のパフォーマンスを比較し、平均 TCP レイテンシが 183µs、RoCE が 107µs であり、TCP が 71% 遅いことを発見しました。

Pavilion社のお客様によるNVMe-oF TCPの導入は、ラックスケールではなくデータセンター規模で、クライアントとストレージ間に最大6つのスイッチホップがありました。この導入は、1,000台規模の10GbitE非RDMA(NVMe-oF over TCP)クライアントと数十台の25GbitE RDMA(NVME-oF with RoCE)クライアントを対象に、ランダム書き込みレイテンシの測定に重点を置いたものでした。

機器には、光ファイバーによる10/25GbitEブレイクアウトを可能にするMellanox QSA28アダプターが含まれていました。16個のアレイ/ターゲットポートを物理的にケーブル接続するために、4個のスイッチポートが消費されました。8個のポートはRDMA専用、8個のポートはNVMeTCP専用で、どちらのオプションも同じように「メニューに載っていました」。

ストレージ アレイと 10GbitE または 25GbitE クライアント間の速度遷移は発生せず、ポート バッファが圧倒されるリスクが軽減されました。

初期の結果では、NVMeTCP(約200µs)はRoCEv2(約100µs)の2倍、NVMe対応iSCSI(約400µs)の半分でした。現在進行中の実験と調整により、iSCSIを含め、これらの数値はさらに低下しています。

Pavilion は、RoCE と TCP NVMe-oF の強度の違いを示す表を作成しました。

Pavilion_RoCE_vs_TCP_テーブル

TCPを使用したNVMe-oFをサポートするサプライヤーには、Pavilionに加え、Lightbits、Solarflare、東芝(Kumoscale)などがあります。今後、他のNVMe-oFスタートアップ企業や主流のストレージアレイサプライヤーも、NVMe-oFトランスポートとしてTCPをサポートするようになるでしょうか?まだ兆候はありませんが、比較的導入しやすい技術と言えるでしょう。

ここでの Pavilion のメッセージは、基本的に、アクセス遅延を可能な限り低く抑える必要がない限り、標準イーサネットを使用して NVMe-oF を展開することは、NVMe-oF をファイバー チャネル経由で実行しない限り、代替の NVMe-oF トランスポートよりも実現可能で、より手頃であるということです。

El Regは、NVMe-oFのトランスポートとしてFCとTCPを比較したいと考えているようです。ご存知のサプライヤーがいらっしゃいましたら、ぜひご連絡ください。®

Discover More