Apeiron は、NVMe over fabrics なしで NVMe ファブリックの速度を実現できると主張していますが、その仕組みはどのようなものでしょうか?

Table of Contents

Apeiron は、NVMe over fabrics なしで NVMe ファブリックの速度を実現できると主張していますが、その仕組みはどのようなものでしょうか?

背景情報: Apeiron Data Systemsの外付けADS1000アレイは、NVMeメディアを使用してブロックストレージアクセスを提供します。NVMe over Ethernet(NOE)は、イーサネットを使用できるNVMe over Fabricテクノロジー(NVMeF)とは異なります。この微妙な違いはどのように機能するのでしょうか?また、NOEとNVMeFの違いは何でしょうか?

NVMeFは、標準PCIeフラッシュカードドライバをベースにしたNVMeプロトコルを使用し、InfiniBand、イーサネット、またはファイバーチャネル接続を介して、サーバーと外部ストレージアレイをPCIeに近い速度で接続する方法です。アクセス元のサーバーにとっては、ローカルに直接接続されたPCIeフラッシュドライブへのアクセスをネットワーク経由でのみ可能にするようなものです。

データはRDMA(リモート・ダイレクト・メモリ・アクセス)を使用してアレイとの間で転送されます。その方法の一つは、イーサネットまたはInfiniBandケーブルを使用できるIPネットワーク上でiWARP(インターネット・ワイド・エリアRDMAプロトコル)を使用することです。もう一つの方法は、レイヤー2およびレイヤー3のDCB(データセンター・ブリッジング)対応スイッチ上で動作するRoCE(RDMA over Converged Ethernet)です。

NOEは、イーサネットの「配管」を利用する別の方法であり、アクセスサーバーに独自のHBAとストレージソフトウェアを搭載して、アクセスサーバーとADS1000アレイおよびNVMeフラッシュドライブを接続するいわゆるデータファブリックを構築する必要があります。このファブリックを通過するには1.5マイクロ秒(往復3マイクロ秒)かかると言われており、これがNVMeフラッシュドライブのアクセスレイテンシに加算されます。

Apieron統合システムは、Apeiron HBAを介してApeironコンピューティングノードとイーサネットスイッチを備えたADS1000ストレージエンクロージャを接続し、アレイへのアクセスサーバー接続を仮想化する分散ストレージアーキテクチャを備えています。HBAとスイッチはどちらもIntel Altera FPGA ASICを使用しています。アクセスサーバーノードはストレージ処理を担当します。ストレージはブロックレベルのインターフェースで仮想化され、Apeironソフトウェアはポリシーベースのユーザー設定を使用して物理マッピングを管理します。

全体として、システムはアプリケーション サーバーからドライブに NVMe コマンドを渡し、ASIC が NVMe/PCIe からイーサネットへの交換を処理します。

ESG の論文には次のように記載されています。「ドライバーと HBA は、固定の 4 バイト識別子を挿入し、強化されたレイヤー 2 イーサネット経由で統合スイッチと FPGA コンポーネントに送信することで、各ストレージ コマンドを仮想化します。パケットは識別され、ネイティブ NVMe 経由で適切なドライブに直接送信されるか、専用のサーバー間通信チャネルに送信されます。」

さらにこう続きます。「この帯域外サーバーネットワークは、データパスからサーバーの「チャタリング」を排除します。ネットワークの堅牢性を確保するため、Apeironはレイヤー3のすべてのエラーチェックおよび訂正機能をオーバーヘッドなしで統合しました。スイッチングおよびストレージ機能(物理から仮想へのマッピングなど)をFPGAに移行し、スイッチングインフラストラクチャからサーバー間のトラフィックを排除することで、Apeironはペタバイト規模の超高性能NVMeネットワークを開発しました。」

Apeiron は次のように NOE と NVMe をファブリック上で比較し、位置付けています。

アペイロン_NOE_vs_NVMeF

NOE と NVMe over Fabrics の比較

Apeironのシステムは独自仕様ですが、コモディティNVMeドライブとx86ベースのサーバーを使用しています。同レベルのパフォーマンスを必要とするワークロードがある場合、代替製品は限られています。DSSDとMangstorが2つ挙げられますが、E8も間もなく登場します。Tegile、Kaminario、HPEも今後(12~24ヶ月後?)、NetAppと同様にNVMe over Fabricsシステムを提供する予定なので、選択肢は増えるでしょう。

価格、信頼性、可用性、耐障害性、拡張性はすべてNVMeF規格と同様に重要となり、その標準化は購入決定に大きな影響を与える可能性があります。しかし、NVMeFにはiSER、ROCE、iWARPといった実装上の選択肢が数多く存在し、購入者を混乱させる可能性があります。そのような場合、NOEの明確な説明は購入者にとって有益となるかもしれません。

ApeironのADS1000システムのパフォーマンス概要については、こちらのESGレポートをご覧ください。この製品をストレージ環境におけるDSSDのような一角に位置付けることができます。NVMe over Fabricsの速度を備えていますが、NVMe over Fabricsではなく、ASICアクセラレーションEthernetをベースに速度を実現しています。®

Discover More