分析Reduxioのアレイは、巧妙な重複排除機能を備えたハイブリッドアレイで、iSCSIインターフェースに制限されています。それでは先に進みましょう。いや、そうではありません。なぜなら、その裏では驚くべき何かが起こっているからです。
共同創業者兼CTOのニール・ペレグ氏は昨日、イスラエルのペタク・チクヴァにあるReduxio本社で行われた記者会見で、この仕組みについて説明しました。ペレグ氏によると、クライアントアプリは永続ストレージにアクセスし、ファイル名やオブジェクトID、ブロックアドレスなどのタグを使ってデータを書き込む(保存する)仕組みで、その後、同じタグ、あるいは保存操作中に返される追加のタグを使ってデータを読み出すとのことです。
理論上、1 つのデータ ブロックには異なるタグからアクセスできます。タグは単にストレージ スペース内の場所に到達するための手段であり、場所に到達する方法は複数存在する可能性があります。
例えば、世界中のすべてのデータを含む大きなバケツがあるとします。それぞれのデータチャンクはバケツに一度だけ保存され、一意の名前が付けられます。そして、バケツの外側にタグを追加することで、既にバケツ内にあるデータチャンクをその名前で参照できるようになります。
タグはクライアントによって(暗黙的または明示的に)提供され、データチャンクは異なるコンテキストで複数のタグを持つ場合があります。例えば、同一のデータブロックが異なるボリュームや異なるオフセットに存在する場合などです。
増分ストレージ技術の進化は失敗した
この考え方を何らかのストレージリポジトリ(バケット)に当てはめ、そこに個々に一意のデータチャンクの集合が格納されていると想像してください。新しいチャンクが保存される際、制御システムは配列内に同一のチャンクが存在するかどうかを確認します。存在する場合は、配列内のチャンクの名前を使用します。存在しない場合は、そのチャンクをバケットに書き込み、今後そのチャンクに使用される新しい一意の名前を付けます。
重複排除とバックデート
データベース/インデックス/ポインタシステムがあり、データチャンクの名前を与えると、バケット内のアドレスを返します。そのため、データチャンクをバケット内(例えば、あるメディア層から別のメディア層へ)移動しても、バケット内のアドレスは変化しますが、名前は変化しません。メディアの種類や場所を変更しても、参照元のストレージオブジェクトには影響を与えません。
このようなシステムは本質的にデータの重複を排除し、一意のデータ チャンクのみが保存されます。
Reduxioの共同創設者兼CTO、Nir Peleg氏
各チャンクがバケットに書き込まれる際にタイムスタンプが付加されていれば、チャンクセットを以前の時点に復元できます。スナップショットやその他のポイントインタイムのデータのコピー、あるいはジャーナル化されたファイルシステムは必要ありません。過去のデータに単一のトランザクションでアクセスでき、管理オーバーヘッドは一切発生しません。
上記のすべては、主にキーと値のストアを使用して実装できます。Reduxio は、これを「キーストア」という用語を使用してシステムで実現しています。フラッシュメディアと最新の X86 プロセッサを使用したキーストア操作は、高速、つまり超高速とまでは言えないデータストアを実現するのに十分な速度です。
バケット全体は、チャンク名と物理的な位置を保持するキーストアインスタンスとして実装できます(メタデータストアをイメージしてください)。ストレージオブジェクト(ファイル/ボリューム/オブジェクト)は、データチャンク名を持つタグ(クライアント指定、明示的または暗黙的)を保持するキーストアインスタンスで表現できます(データストアをイメージしてください)。キーストアの固有の構造により、どちらも複数のノードに分散できます。
移行と回復
これにより、上位レベルのメタデータストアはサイズが小さいため、宛先ノードに迅速に送信できるため、データ移行が容易になります。その後、宛先システムのユーザーから要求されたデータオブジェクトを、データストアにストリーミング送信できます。最初のアクセスはネットワーク経由で行われますが、その後はキャッシュの読み込みなど、ローカルで行われる可能性があります。
Reduxioは、米国のバーンスタブル警察にシステムを納入しました。同警察はランサムウェア攻撃を受け、すべてのデータが暗号化され始めました。皮肉なことに、これは皮肉な出来事でした。しかし、暗号化は停止され、タイムスタンプフィルターを使用して攻撃開始の数秒前のデータにロールバックされたため、数分ですべてのデータが復旧されました。
将来を見据えて
まだまだ探求すべき点が多く、Reduxio のアレイへの iSCSI アクセスのサポートは今後拡張される予定です。開発ロードマップには以下のような内容が含まれると認識しています。
- 異なるシステム上のバケットセットを使用したスケールアウトストレージ
- NVMeFの作業
- VVOLの追加を検討中
- フラッシュ層の追加を検討中
- OpenStack Cinderドライバは次期OpenStackリリースで提供され、Cinderボリュームをバックデートできるようになります。
- REST APIが登場
- Puppetのサポートが近づいています
コンテナのサポートが登場しても驚きません。
すでに50社以上のお客様が有料で本番環境で使用しており、さらに20社以上のお客様が評価中です。Reduxioの営業チームがサポートするチャネルセールスです。
同社は70名の従業員を擁しており、そのうち45名はイスラエルで研究開発・エンジニアリングに従事し、25名は米国にいます。グローバル本社はサンフランシスコにあり、米国におけるアウトバウンドマーケティングとセールスは7つのオフィスで行われています。
2回の資金調達ラウンドで合計3,000万ドルを調達しました。SQL Server、Oracle、MySQL、SAPなどのデータベースがサポートされています。
イスラエルの大手ホスティング会社がNetApp(10年の実績)からReduxioに移行し、1ラックから3Uに移行した結果、サーバーパフォーマンスが劇的に向上したと聞いています。2台目へのリストアも問題なく機能し、データ削減率は3:1にまで向上しています。
Reduxio をチェックしてみてください。きっと驚くような発見があるはずです。®