Pure StorageのData Domainキラー候補が3月に登場 - しかし、内部構造についてはまだ明らかにされていない

Table of Contents

Pure StorageのData Domainキラー候補が3月に登場 - しかし、内部構造についてはまだ明らかにされていない

Pure Storage社は、EMC傘下の業界大手Data Domain社などのベテラン企業の売上を奪うために、ObjectEngineという名の真新しいバックアップボックスを来月から早々に導入する予定だ。

ObjectEngineは、買収したStorReduce可変長重複排除技術を採用しており、これはオンプレミスのObjectEngine//AハードウェアとAWSで稼働するObjectEngine//Cloudインスタンスで動作します。Commvault、Oracle、Veeam、Veritasのバックアップアプリケーションは、これをバックアップターゲットとして使用できます。

つまり、Pure の売りは、EMC が所有する Data Domain の D2D (ディスク ツー ディスク) スキームやその他の D2D2T (ディスク ツー ディスク ツー テープ) モデルとは対照的に、フラッシュ ツー フラッシュ ツー クラウド (F2F2C) バックアップ スキームです。

PureのF2F2Cスキームは、ローカルフラッシュからのリストア、クラウド経済性、そしてクラウドアプリによるクラウド内データの再利用を可能にします。ObjectEngineを搭載したFlashBladeは、オンプレミスのデータ(分散)ハブとしても機能します。

Pure_ObjectEngine_Scheme

クリックして拡大

オブジェクトエンジン//A

Pureは、2台の筐体に4ノード(最小クラスタサイズ)を搭載した3U OE//A270オンプレミスシステムを提供しています。25TB/時のバックアップと15TB/時のリストア速度を提供し、15PBのフロントエンド容量を備え、パブリッククラウドへのデータ送信も可能です。

そこには、「15PBの制限は、4つのOE//Aノードに保存できるメタデータの量に起因しています。実際の重複排除データは、FlashBladeとAmazon S3の組み合わせに保存されます。最新の保存データはFlashBladeから迅速にアクセスでき、古いデータはS3からアクセスできます」と記載されていました。

Pure は次のように付け加えています。「当社はデータをクラウドに階層化していません。ObjectEngine がクラウドに保存するように構成されている場合、すべてのデータのコピーがクラウドに保存され、オンプレミスのデータのローカル キャッシュが保持されます。」

同社はボックスの内部構造については口を閉ざしており、CPU、DRAM、内部ストレージの詳細、システムのアーキテクチャ、接続性などを明らかにしなかった(ブラックボックスとして扱っていた)が、The Register はこれを非常に不思議に思った。

このシステムは超並列アーキテクチャを備えていると述べられています。

ピュアオブジェクトエンジンAE_270

4 ノードのツイン ボックス OE//A270 とその下に 1 つの FlashBlade バックエンド ボックス。

各 3U OE//A270 ボックスには 2 つのノードが含まれており、サイズが 3U であるため、一般的な 1U、2 ソケット ラック サーバーに含まれるコンポーネントよりも多くのコンポーネントが内部にあると考えられます。

StorReduce のドキュメントには次のように記載されています。

StorReduce サーバーは、専用の物理マシンまたは仮想マシン上で実行されます。StorReduce では、ローカル SSD ストレージの使用を推奨しています。各 StorReduce サーバーは、達成される重複排除率とインデックス情報に使用可能な SSD ストレージの容量に応じて、最大 40 ペタバイトの生データを処理できます。

データ量が少ない場合は、SSDの代わりに磁気ディスクを使用できます。StorReduceは複数のストレージバケットの作成をサポートし、すべてのバケットにわたってグローバル重複排除を実行します。

OE//A270 ボックスには重複排除インデックス用のローカル フラッシュ ストレージが含まれていると評価します。

OE//A270システムにFlashBladeボックスを2台搭載した場合、使用可能容量は1PB、FlashBladeあたり0.5PBとなり、ラックの3分の1を占有します。OE//A270を4台、FlashBladeを4台搭載した場合、使用可能容量は2PB、バックアップ速度は100TB/時、リストア速度は60TB/時となります。

これらは、Data Domain DD9800 (PDF) と比較したものです -body =>

これらは、4Uのスペースを占有し、1PBの使用可能容量、CloudBoostを使用した68TB/時のバックアップ速度、パブリックリストア性能を備えていないData Domain DD9800(PDF)と比較したものです。ちなみに、Dellによれば、DD9800は標準の60ドライブDS60ディスクパックを使用した場合、ラック1つ分のスペースも占有しません。

Pure 社によると、Amazon からの 2 つのデータベースの OE//A リストアは 1 TB/時間です。FlashBlade からの 2 つのデータベースの OE//A リストアは 7 TB/時間、4 つのデータベースの OE//A リストアは 10 TB/時間です。

オブジェクトエンジン//クラウド

マウンテンビューの同社はまた同時に、FlashArray に DirectFlash Fabric NVMe over Fabrics アクセスを追加することも確認しました。

OE//Cloudは、100TB/時間以上のバックアップ速度に対応し、100TB以上のデータを保護できるクラウドネイティブソフトウェアです。11ナインの耐久性、単一のグローバル名前空間、S3 APIを備え、内部的にレプリケーションされています。

Pureは、OE//Cloudの復元速度に関する数値を公開せず、「クラウドプロバイダーの仮想ハードウェアとネットワークインフラに大きく依存している」と述べている。同社はさらに、「OE//Cloudの一般提供開始が近づきましたら、数値を公開します」と付け加えた。

カリフォルニアのストレージ企業は、Actifio、Cohesity、Delphixのコピーデータ管理製品に賭け、自社のObjectEngine技術がテストや開発、分析などのデータ再利用に役立つ可能性があると述べた。

DirectFlashファブリック

Pure は、主力製品である FlashArray キット内で NVMe ドライブと NVMe アクセスを提供した後、最終段階として FlashArray への NVMe over Fabrics アクセスを追加しました。

同社は、DirectFlash Fabric (RDMA over Converged Ethernet) が 250μs のレイテンシを実現できると示唆しました。これは、iSCSI と比較して 50%、ファイバー チャネルと比較して 20% のレイテンシ削減に相当します。

NVMe ドライブとシェルフを備えた FlashArray//X へのサーバー アプリの全体的なデータベース クエリ時間は、500μs のレイテンシで 5 秒かかる可能性がありますが、DirectFlash Fabric を追加すると 2.5 秒に短縮されます。

将来的には、データベース全体のクエリ時間を1秒に抑えながら、レイテンシを100μs未満にまで削減できる可能性が示唆されています。このさらなる削減のために、アクセスサーバーなどにストレージクラスメモリが追加される可能性も考えられます。

可用性

ObjectEngine//Aは3月に一般提供開始、CloudDirectは5月にリリース予定です。OE//Cloudは2019年後半にリリース予定です。RDMA over Converged Ethernetは1月に一般提供開始となりました。Pureは今後、NVMe over Fibre ChannelとTCPもサポートする予定です。®

Discover More