SNW Europe El RegによるStorageNetworkWorld Europe(別名Powering The Cloud)レポート第2弾。ヨーロッパ最大級のストレージショーから、またしてもストレージの素晴らしさをたっぷりとお届けします。ホットなものから、サクサクしたものまで…ぜひご覧ください。
BridgeSTOR と DDFS
BridgeSTORのCEO、ジョン・マッツェ氏は、テープとクラウド向けのDDFS(データ重複排除ファイルシステム)について詳しく説明しました(背景はこちら)。同社の声明では、データ保護におけるテープの重要性が改めて強調されています。
2010年12月のESGレポート「NERSC – テープ上のプライマリデータ保存による成功」によると、世界のデータのほぼ半分が磁気テープに保存されています。実際、世界最大の銀行10行すべてが、バックアップとアーカイブデータの保存にテープストレージを利用しています。世界最大の通信会社10社すべて、そして製薬会社10社のうち8社も同様です。
BridgeSTOR以前、マツェ氏は重複排除ハードウェアを開発していたExar社向けに第一世代の重複排除製品を開発していました。しかし、「Exar社は2012年2月に製品とチームを縮小し、従業員全体の40%を失いました。」
つまり、DDFS は Matze dedupe mk II です。
Matze氏は、DDFSテクノロジーが最も有効に機能するのは仮想マシンのバックアップだと考えています。VMware VMとVMDKSは、ディスクブロックのアライメントがずれているため、重複排除がうまくいかないとMatze氏は言います。DDFSは512KBのVMヘッダーを4096バイトに変換します。VMデータ用の2MBのデータコンテナも4096バイトのブロックに格納されます。
BridgeSTORテクノロジーは、CRUNCHと呼ばれるWindows VHD形式の仮想重複排除アプライアンスとして提供されます。既存のバックアップサーバーまたは仮想マシンイメージが保存されているサーバー上で実行され、VMware、Hyper-VなどのすべてのVMイメージを重複排除します。VMはLTOテープと同じサイズの重複排除コンテナに「クランチ」され、テープドライブによって圧縮と暗号化が行われ、テープに書き込まれます。
CRUNCHで書き込まれたテープには、基本的に2つのファイルまたはコンテナが含まれています。1つはデータ用、もう1つはメタデータ用です。テープには重複排除されたメタデータがすべて保存されています。
BridgeSTOR CRUNCHプロセスフロー
BridgeSTORは、VMによるデータ削減率が20.6:1であることを発見しました。33GBの生データが16GBに削減されます。もちろん、状況によって結果は異なります。
DDFSの「ブロックレベル」重複排除では、ハッシュアルゴリズム(SHA-1)を用いてデータブロックを「フィンガープリント」し、各データブロックに固有の「短縮形」識別子を生成します。DDFSでは、ハッシュテーブルをメモリ上に常駐させることができます。ハッシュテーブルを保持するために必要なメモリ量は、使用される物理容量と重複排除ブロックサイズによって決まります。
DDFSはWindowsのフィルタードライバーのようなものです。受信データは一定サイズのチャンクに分割され、処理されます。メタデータは1つのファイルに書き込まれ、物理データはコンテナに格納されます。マツェ氏は次のように述べています。「Overland Storage(彼がCTOを務めていた)のREOソフトウェアを私が書いたのと同じように、DDFSも私が書きました。今は私のチームがパッケージ化しています。」BridgeSTORは非上場企業であり、ベンチャーキャピタルからの資金提供はありません。
BridgeSTOR は次のように説明しています。「DDFS では、データの復旧時に無制限の数の「復旧ポイント」から復元できます。「初期データ同期」が完了すると、DDFS はデータ重複排除操作の頻度に基づいて復旧「マップ」を構築し、維持します。」
例えば、DDFS(CRUNCHアプライアンスなど)を毎日実行すると、複数のリカバリポイントが利用可能になり、そこからデータを復旧できます。タイムマシンのように、復旧対象のデータが正しく安定していたと判明していた時点まで時計を巻き戻すことができます。
Matze氏によるLTO-5テープドライブを接続したMacBook AirでのDDFSとLTFSのデモでは、MacBook AirユーザーがDDFSでLTFSをマウントする様子が紹介されました。メタデータはキャッシュのためにローカルディスクに移動されます。これにより、ドライブに触れることなくテープの内容を閲覧できるようになります。Matze氏はDDFSサービスを起動し、DDFSをマウントし、ファイルがスキャンされるとテープドライブから読み取られます。
DDFSは、重複排除されたファイルをテープに書き込んだり、「クラウド」を含むリモートサイトに送信したりするために使用できます。Matze氏は、複数のNASベンダーとDDFSの活用可能性について協議しています。多くの顧客がバックアップ用にNASを購入しているため、SynologyやQNAPなどのベンダーはDDFSに興味を持つ可能性があります。「DDFSはネイティブNASに適した製品です。CRUNCH製品はNASのプラグインです。」
CommVault の Simpana 製品もデータの重複を排除してテープに書き込むことができますが、少なくとも Matze 氏によれば、「CommVault はあまりにも高価すぎます。」
CRUNCHは将来、重複排除されたデータをクラウドプラグイン経由でクラウドやAmazonなどに送信できるようになるため、テープを経由する必要がなくなります。マッツェ氏は次のように述べています。「Iron Mountainは不要になります。クラウドプロバイダーを利用してテープイメージを長期保存することになります。」
Matze氏はCRUNCHをMicrosoftのDPMと連携させ、CRUNCHをテープドライブのように扱えるようにする予定です。ユーザーはCRUNCHのネットワーク共有を通じて、データを即座に閲覧できるようになります。
CRUNCH は、月額 200 ドルのサービスベースのモデルで利用可能だ。「これは、1 か月あたり LTO テープ 2 本分の料金に相当します」と Matze 氏は言う。