インタビュー: IntelとSamsungは、標準的な2.5インチドライブよりも長く、より大容量の「ルーラー」フォーマットSSDを導入しました。しかし、普及は遅れています。SupermicroはルーラーSSDを採用したサーバーを投入していますが、他にはほとんど導入されていません。
なぜでしょうか?これらのフォーマットは何か不適切でしょうか?451のシニアアナリスト、スティーブン・ヒル氏に、新しいフォーマットとその普及に影響を与える問題についての見解を伺いました。
インテルの「ルーラー」SSD
簡単にまとめると、Intelの定規は長さ325.35mm、幅9.5mm、高さ38.6mmで、1Uラックマウント筐体の前面に32個収まります。Chipzillaではこれをエンタープライズ&データセンター・ストレージ・フォームファクター(EDSFF)と呼んでいます。
36 基の Samsung NGSFF ドライブを搭載した Supermicro サーバー
Samsung のミニ ルーラー NGSFF (次世代スモール フォーム ファクター) ドライブは、長さ 110 mm、幅 30.5 mm、高さ 4.38 mm で、2U エンクロージャに 36 個が収まります。
Samsung NGSFFドライブカード
Hill 氏は、Ruler フォーマットのドライブの採用には、フォーマット自体と NVMe アクセス プロトコルという 2 つの側面を考慮する必要があると考えています。
El Reg : 容量、スペース密度、電力効率の面で、これらのフォーマットは既存の 2.5 インチ ドライブ フォーマットと比べてどうだと思いますか?
スティーブン・ヒル:業界がフラッシュメモリを外部化する新しいモデルを思いつくのは、まさに時間の問題でした。この技術は、円形の回転ディスクを長方形の穴に押し込むという非効率な方法ではなく、細長いストレージモジュールを設計できるという点で、全く新しいストレージフォームファクタを実現します。
容量は今後の世代のフラッシュ チップでのみ増加しますが、フラッシュ容量の大幅な増加は、熱管理と電力エンベロープの点で新たな一連の課題も生み出します。
今日の高性能かつ大容量のフラッシュ デバイスの消費電力は、回転ディスクとほぼ同じになることがあります。これは、モジュール上のフラッシュ容量が増大するにつれて、パフォーマンスを維持するためにオンチップ処理能力を増強しなければならないという課題があるためです。
フラッシュメモリメーカーが最終的に二層構造のアプローチを採用する可能性はあります。つまり、容量重視では低速だがエネルギー効率の高いフラッシュメモリを提供し、パフォーマンス重視では高速だが小型のモジュールを提供するというものです。しかし、これはあくまで私の推測に過ぎません。モジュールレベルでフラッシュメモリの容量、効率、パフォーマンスに関して「画一的な」アプローチを取る理由は全くありません。
El Reg : これらが JBOF、ストレージ アレイ、ハイパーコンバージド システム、通常のサーバーで使用されることを想定していますか?
スティーブン・ヒル:本当に良い質問ですね。簡単に答えると、上記の全てですが、時間の経過とともに変化していくということです。
フラッシュは、エンタープライズ アプリケーションにおいて誰もが予想していたよりもはるかに優れた耐性があることが証明されているため、フラッシュが最終的にディスクを追い越さないという強い理由 (コスト以外) はありません。
もちろん、下位互換性の維持はストレージでは常に課題となるため、SAS ベースのフラッシュは現在、エンタープライズ ディスクの直接的な代替品としては最低限の共通点となっています。これは、SAS 抽象化によってインバンド メッセージングと管理が処理されるためです。このテクノロジは、NVMe ではまだ開発中です。
SASは10年にわたりエンタープライズクラスで利用されており、従来のアレイモデルで非常に優れたパフォーマンスを発揮してきましたが、NVMeは従来のストレージモデルをバイパスしてPCIeに直接接続できます。これは物理パフォーマンスの点で非常に大きなメリットですが、信頼性、データ保護、管理性も考慮する必要があるエンタープライズストレージの要件においては、これはほんの一要素に過ぎません。第4世代24Gbit/s SASについては既に発表されているため、デバイスレベルでのパフォーマンス比較において、物理帯域幅はそれほど大きな問題ではありません。
もちろん、JBOF が最も簡単ですが、より大きな課題は、非常に高速なペタバイト単位のストレージがぎっしり詰まった 1U サーバーをいかにして最適に使用するかということだと思います。
El Reg : 帯域幅の問題はありますか?
スティーブン・ヒル:内部ストレージに膨大な帯域幅を提供することは重要ですが、1Uまたは2Uサーバーで本番環境で利用できるストレージ容量には限りがあります。アレイやSDSアプリケーションは当然の選択肢ですが、その速度と容量をすべて外部クライアントに拡張するのは全く別の話です。
例えば(カクテルナプキンのような計算ですがご容赦ください)、Intelの設計では1Uに32個のNVMe Rulerモジュールを搭載し、ドライブ接続だけで最低128本のPCIeレーンを使用し、控えめに見積もってもモジュールあたり2GB/秒の読み取り速度を実現できます。これにより、理論上は1Uサーバー1台で64GB/秒、つまり512Gbit/秒の内部ストレージ帯域幅を実現できます。
確かに印象的です (2 つください)。しかし、シャーシから取り出せない場合は、多少非実用的でもあります。そのため、これらの新しいフラッシュ テクノロジを最大限に活用するには、ストレージを再考する必要があると考えています。
エル・レグ:どういう意味ですか?
スティーブン・ヒル:ストレージを評価する鍵の一つは「ボトルネックを追う」ことだと学びました。なぜなら、ボトルネックはコンポーネント、システム、アプリケーションの要因によって変化するからです。これほどの容量とパフォーマンスを備えたエンタープライズストレージは、この課題に全く新たな次元をもたらします。これは、Dell EMCがDSSDで苦労して学んだことです。
フラッシュベースのストレージ、特にNVMeテクノロジーは、最終的にエンタープライズストレージの転換点となると確信しています。NVMeの速度と容量は見逃せませんが、現状では、エンタープライズアプリケーション向けNVMeエコシステムはSASほど完成度が高く、検証も進んでいません。
El Reg : 具体的には、Intel のルーラー形式はサーバーで役立つと思いますか? Samsung のミニルーラー形式も同様ですか?
スティーブン・ヒル:その通りです。現在購入できる最も安価で低性能なPCIe/NVMeコンシューマー向けドライブでさえ、エンタープライズ向け回転ディスクや多くのレガシーアレイよりも数倍高速です。つまり、NVMeの導入は当然のことです。
課題は、NVMeをPCIeに外部化し、SASテクノロジーと同等のホットスワップ機能とエラー処理機能を提供することでした。PCIeは理論上は既にホットスワップ可能でしたが、永続ストレージデバイスをオンザフライで取り外して交換するという一般的な方法では、PCIeが当初設計されていたよりも、BIOS、ドライバ、OS、アプリケーション間の連携がさらに必要になります。
外部化された NVMe に 2 つの物理標準が適用されていることは驚くことではありませんし、どちらにも価値があると私は考えています。
初期情報に基づくと、どちらのモデルも技術的な意味では同等に適しているように見えますが、2 つのモデルの主な違いはストレージ容量と物理サーバーの実面積です。
EDSFF 設計に基づく Intel Ruler モジュールは、物理的には Samsung の NGSFF ベースのモジュールの 2 倍の長さであり、ピン配置に互換性があったとしても、相互運用性の可能性がないことはほぼ保証されています。
容量戦略として NVMe をさらに先取りすると、Intel の設計は長期的には理にかなっているかもしれませんが、エンタープライズ フラッシュの現在の焦点はパフォーマンス層にあるため、Samsung のモジュールの長さが短いことは容量の観点からはそれほど問題にはならず、サーバーの占有スペースも少なくて済むでしょう。
クラウドに特化した1U設計では、非常に長い内部NVMeスティックを使用し、100Gビットイーサネットで接続されていますが、これらはクラウド規模の運用に最適化されています。繰り返しになりますが、フラッシュベースの容量階層モデルは、まだ登場し始めたばかりです。
El Reg:SamsungがミニルーラーSSDにオブジェクトストレージ機能を実装したことについて、どう思われますか? 活用してみたいと思いますか?
スティーブン・ヒル:私たち自身もつい最近その問題について考えていましたが、これは簡単に答えられる質問ではありません。
オブジェクト ストレージは私の主な担当領域の 1 つであり、オブジェクト機能と IP 機能を備えた個別のストレージ デバイスのアイデアは良いと思う一方で、余分なオーバーヘッドですべてのドライブを圧迫するのはあまり意味がないと思う部分もあります。
SeagateのKineticドライブのようなコンセプトを見たとき、オブジェクト抽象化はデバイスレベルでは実際には適合しないと感じました。エンタープライズオブジェクトシステムやSDSシステムは、ステートレスなストレージデバイスを活用・保護するように設計されているからです。しかし、新しい機能には新しい技術が必要です。そのため、経済状況の変化に合わせて、大容量フラッシュモジュールの文脈でこの点を再検討していくつもりです。
さらに、LightNVM や CNEXLabs などの企業が主張する「オープン チャネル」SSD の理念もあります。これらの企業は、NVMe モジュール自体にフラッシュ変換レイヤー (FTL) を配置することさえ非効率的だと考えています。*
物理NANDチップ内での直接的な配置や移動も含め、すべてをソフトウェアに任せましょう。特定のワークロードでは理にかなっていることは理解できますが、デバイスレベルで個別のFTLを持つことで得られるハードウェアの耐障害性よりも、生のパフォーマンスを優先させてしまうのではないかと思います。
さらに、デバイスベースのオブジェクトと Open Channel SSD はどちらも Ethernet ベースのネットワークに大きく依存しており、これも移動ボトルネックに影響を及ぼし、共有ネットワーク上のリソースに対する QOS、セキュリティ、競合に関する明らかな疑問を引き起こします。
+コメント
ルーラーおよびミニルーラーSSDフォーマットの採用は、SASに対するNVMeプロトコルの成熟と密接に結びついています。SASフォーマットはNVMeほど高速ではなく、PCIeバスへの直接接続もできません。
しかし、SASを採用したサーバーやストレージシステムには、デュアルポートやホットプラグのサポートといったエンタープライズ機能が備わっています。NVMeがこれらの機能や同様の機能を備えない限り、その普及は遅れるでしょう。
24Gbit/s SASプロトコルの登場が迫っているにもかかわらず、ルーラー型とミニルーラー型の両方のドライブフォーマットはNVMeアクセスを必要とするというのが一般的な見方です。そのため、NVMeにはそのようなエンタープライズ向け機能が不足しているため、これらの普及は遅れています。
これはおそらく、第一に、主流のサーバーおよびストレージアレイベンダーがまだこのフォーマットを採用していない理由、そして第二に、IntelとSamsungだけがこのフォーマットを開発している理由を説明しているでしょう。他のSSDベンダーは、今後の動向を見守りつつ、いつ、どの方向に踏み込むかを決めているところです。®
ブートノート
* IBM の研究者もホストベースの FTL に注目しています。