OASIS: 脱水症状に悩む二次ストレージユーザーのためのリフレッシュメント?

Table of Contents

OASIS: 脱水症状に悩む二次ストレージユーザーのためのリフレッシュメント?

Comment Cohesity は、組み込みのハイパーコンバージド インフラストラクチャ アプライアンス プラットフォームのようなもので、包括的なセカンダリ ストレージ製品を開始しました。

私たちがこのスタートアップの技術について初めて知ったのは6月でした。

その目的は、顧客が通常複数の異なるシステムを使い分ける、多種多様なセカンダリストレージユースケースをカバーする、いわばスーパーセカンダリストレージリポジトリを提供することです。Cohesityは、これらのシステムをすべて単一のシステムに統合し、容量ベースのライセンスを回避することで、顧客の異なるシステムの使用に伴うCAPEX(設備投資)とOPEX(運用コスト)を削減できると述べています。

Cohesity Data Platform は、4~40 ノード(ブロック)のスケールアウト型クラスタアーキテクチャを採用しています。各ブロックは、2U シャーシに 4 台のクラスタサーバーを搭載し、直接接続ディスクと PCIe フラッシュドライブを備えています。

C2000製品ラインには2つのモデルがあります。C2300は、48TBの物理ディスク容量と3.2TBのPCIeフラッシュストレージ(ノードあたりそれぞれ12TBと800GB)を備えています。C2500は、96TBのディスク容量と6.4TBのフラッシュストレージ(ノードあたりそれぞれ24TBと1.6TB)を備えています。

40ノードのC2500システムは3.84PBの物理容量を持ち、少なくとも2つのラックが必要です。

オペレーティングシステムはOASIS(Open Architecture for Scalable Intelligent Storage)です。OASISデータサービスには以下が含まれます。

  • 無制限のスナップショットとシンクローンによる仮想化環境のデータ保護(バックアップとリカバリ)
  • バックアップデータからのクローンによるDevOpsサポート
  • NFS および SMB をサポートするファイル サービス
  • グローバルかつポリシー主導の重複排除
  • 分析機能 - 組み込みおよびプログラム可能
    • ネイティブ分析機能によりリアルタイムの指標と予測を提供
    • プログラマブル分析ワークベンチはデータセットに対してカスタムクエリを実行します
    • Cohesity クラスタ上でインプレースで実行される分析
    • 分析はMapReduceに基づいています

コヒシティC2000

C2000ハードウェアブロック

分析機能は、実行時にCPUサイクルを必要とするのは明らかですが、実行していない時には必要ありません。では、分析機能が実行されていない時、CPUサイクルは何をしているのでしょうか?Cohesityが別途指示しない限り、CPUサイクルはアイドル状態のままであり、これは無駄です。アイドル状態でない場合は、ストレージタスクに使用されています。そこで疑問が生じます。分析機能の実行中に、どのようにストレージパフォーマンスを維持するのでしょうか?何らかのサービス品質(QoS)機能があるのでしょうか?

Delphix、Actifio、Catalogic のコピー削減テクノロジーは、開発者向けの OASIS のファイルのシン クローニングと連携できるようになりました。

Cohesityによると、このシステムは既存のオンプレミスストレージと連携するように設計されているため、顧客は既存のセカンダリストレージシステムを丸ごと交換する必要はありません。つまり、このケースでは、既存のセカンダリストレージサイロを置き換えることはできますが、それでも新たなセカンダリストレージサイロとしてスタートすることになります。そして、そのサイロが初めてコスト削減につながるのです。

お客様は一度に1ノードずつスケールアウトできます。Cohesityはこれを「pay-as-you-grow(成長に応じた支払い)」アプローチと呼んでいます。現時点では、コンピューティングとストレージを個別に拡張することはできないようです。ノード/ブロックが追加される際に、全体のワークロードが再調整され、ブロック間でワークロードが均等に分散されるような、何らかの負荷分散機能が備わっていると想像します。もし備わっていないのであれば、何らかの機能があるはずです。

Cohesity の CEO である Mohit Aron 氏に、今回の製品リリースで私たちが興味を持った点についていくつか質問しました。

El Reg : スケールアウト ハードウェア設計は、ストレージ専用のハイパーコンバージド インフラストラクチャ アプライアンスのように見えると思いますか?

Mohit Aron : はい、GoogleやAmazonなどのWebスケール企業が普及させている、高密度で標準ベースのサーバーを活用しています。私にとって、この種のハードウェア向けに設計された分散システムソフトウェアの構築は3回目です。1回目はGoogleでGoogle File Systemを開発し、この種のアーキテクチャの先駆者となりました。2回目は、Nutanixで構築したハイパーコンバージドアーキテクチャを用いて、これをプライマリストレージ仮想化に適応させたことです。

これにより、コンピューティング、ネットワーク、ストレージのハードウェアが統合されました。現在、私はセカンダリストレージにおける、データ量とデータ保護、DevOps、ファイルサービス、分析といったワークロードの種類という、より大きな課題に取り組んでいます。Cohesityはハードウェアコンポーネントを統合するだけでなく、セカンダリストレージのワークフローも統合します。

El Reg:分析実行中にストレージのパフォーマンスをどのように維持していますか?何らかのサービス品質機能はありますか?それとも、分析が実行されていないときにアイドル状態になる専用の分析CPUリソースはありますか?

Mohit Aron : きめ細かなQoSはプラットフォームの基本的な機能であり、ワークロードプロセスごとに設定可能です。管理者は、分析やバックアップなど、特定のワークロードにリソースを割り当て、パフォーマンスを分離することができます。ただし、この割り当ては作業負荷を抑えるためのものです。つまり、100%使用されていない場合は、そのリソースを他のワークロードに再割り当てします。

組み込みのストレージ分析機能は、Cohesityクラスタを拡張し、環境内のセカンダリストレージワークロードの固有の組み合わせを最適化するための有用な統計情報を経時的に提供します。また、ワークロードごとに調整可能なポリシーも提供しています。例えば、重複排除機能は、バックアップの場合はインラインで実行し、テスト/開発ワークロードの場合はポストプロセスで実行するように設定できます。

El Reg : HDFS コネクタが追加される予定はありますか、あるいは Hadoop スタイルのデータにリンクする他の方法が追加される予定はありますか?

Mohit Aron : はい、HDFSとApache Sparkのサポートは現在開発中です。乞うご期待ください。

El Reg:Cohesityの製品アイデアをActifio、Delphix、Catalogicの製品アイデアとどのように比較検討されますか?例えば、ファイルコピーの削減などが考えられます。

Mohit Aron : これらのベンダーは、特定のユースケース(例えば、Delphix のデータベースや Actifio のバックアップ)におけるデータのコピーという、特定の症状に焦点を当てることで、データスプロール問題に取り組んでいます。これらの製品の主な違いは、既存のサイロ化されたストレージ製品に追加される点です。また、複数の製品がある場合でも、大規模なデータ容量を管理しやすい方法で処理できるようにスケールアウトすることはできません。

Cohesityは問題の根本原因を突き止めています。各システムの利用率が100%ではないにもかかわらず、なぜストレージサイロが存在するのでしょうか?バックアップの場合、バックアップ先が保険のようにアイドル状態のまま放置されるため、これは特に深刻な問題となります。Cohesity Data Platformは、多様なワークロードを同時に処理し、それに応じてQoS(サービス品質)を管理できるストレージアーキテクチャとして設計されています。これにより、バックアップストリームの実行、開発用クローンの起動、ファイルサービスの提供、分析の実行など、すべてを同時に実行できます。

これを実現するのは、非常にスマートな分散システムソフトウェアと、PCIeフラッシュを搭載したハイパーコンバージドハードウェアプラットフォームの組み合わせです。これは、サーバー統合に見られる現象に似ています。Cohesityはセカンダリストレージの統合を実現し、データセンターに新たなレベルの効率性とシンプルさをもたらします。

El Reg : Cohesity の製品アイデアと、ビデオ トランスコーディングなどのストレージ システム レベルのアプリケーション機能のアレイ処理も行っている Coho の製品アイデアとを比較すると、どうなりますか。

Mohit Aron : データが保存されている場所の近くでコンピューティング サービスを実行するというコンセプトは、効率的に移動するにはあまりにも多くのデータが生成されていることに人々が気付くにつれて、プライマリ ストレージで確実に普及しつつあります。

当社では、分析などのコンピューティング サービスをセカンダリ ストレージで実行する方が合理的であると考えています。その理由は、(a) これらのミッション クリティカルでないサービスがプライマリ ストレージで実行されているミッション クリティカルなサービスと競合しない、(b) 現在、セカンダリ ストレージはアイドル状態であり、保険としてのみ使用されているため、アイドル状態のコンピューティング サイクルを使用して使用率を向上させ、お客様にさらなる価値を提供する、(c) セカンダリ ストレージにはプライマリ ストレージよりもはるかに多くのデータを保存できるからです。

El Reg : コンピューティングとストレージを別々に拡張することはできないようですが、これは問題でしょうか?

Mohit Aron : Cohesity のソフトウェアは、異機種混在のハードウェアに対応できるよう設計されています。そのため、コンピューティング能力を拡張するには、クラスタ内にコンピューティング能力の高いノードを追加する必要があります。また、ストレージ能力を拡張するには、クラスタ内にストレージ能力の高いノードを追加できます。現在、異なるストレージ容量を持つ 2 つのハードウェアモデルがあり、これらを同じクラスタ内で混在させることができます。今後、さらに多くのオプションを提供していく予定です。Cohesity は、お客様が必要な時に必要なものだけを購入し、時間の経過とともにニーズに合わせて拡張できるため、お客様の投資を保護します。

潜在的に包括的なシステムであるため、お客様はその機能を慎重に確認することをお勧めします。C2000のデータシートはこちら(PDF)から入手できます。AnalyticsのPDFデータシートはこちらです。

Cohesity のデータ プラットフォームは現在、120,000 ドル未満からご利用いただけます。®

Discover More