「パブリッククラウドの容量価格で比類のないパフォーマンスを提供するプライベートクラウド向けに設計されたフラッシュ調整されたスケールアウトストレージアーキテクチャ」の開発者である、元ステルス系スタートアップ企業の Coho Data が、B ラウンドの資金調達で 2,500 万ドルを獲得しました。
このラウンドはIgnition Partnersがリードし、当初の投資家であるAndreesen Horowitzも出資しました。彼らはCoho Dataに強い関心を寄せているので、同社について、そして出資者にとってCoho Dataがなぜ魅力的なのかを探ってみましょう。
Coho Dataはソフトウェアベースのストレージを開発中だとしているが、ハードウェアであるDataStream 1000アレイも出荷している。同社は、同社のストレージソフトウェアによって企業が「自社データ用にAmazonスタイルの高性能ストレージを独自に構築」できるようになると謳っている。
それは決して小さな主張ではありません。
箱
DataStream 1000アレイは、OEM供給されたコモディティベースのサーバーハードウェアを搭載した2Uデュアルコントローラーです。分散システムソフトウェアを使用することで、スケールアウト方式で追加できます。オンプレミスのシステム群で構築されたプライベートクラウドにおいて、パブリッククラウドの「成長に応じた投資」という経済性を実現することを目指しています。
上部にスイッチを備えた 4 つの DataStream 1000 マイクロアレイ
シャーシには、2台のXeonサーバー、2枚のNIC、2枚の800GB Intel 910 PCIeフラッシュカード、6台の3TBディスクドライブ、そしてネットワーク機能とOpenFlow対応の10GbitEファシリティを備えた、いわゆるMicroArrayモジュールが2つ搭載されています。MicroArrayは、52ポートのOpenFlow対応DataStream 10GbitEスイッチでクラスタ化されています。各MicroArrayペアは、アクティブ:アクティブの障害保護を提供します。
総容量は39TBで、コントローラーはベアメタル・オブジェクト・ストアを実装しています。「各MicroArrayは任意の数のスパースオブジェクトを作成でき、これらのオブジェクトには所有者のみがアクセスできるようにします。各MicroArray上の個々のオブジェクトは粗粒度のコンテナであり、データパーソナリティによってプリミティブとして使用することで、より複雑なストレージ抽象化を構築できます。」と説明されています。
つまり、すべてのデータは、最初はデータ アクセス プロトコル、ファイル、または iSCSI ブロックを使用してオブジェクトとして保存され、その上に階層化され、変換ソフトウェアが配置されて変換が行われます。
MicroArray ソフトウェアは、ストレージ ハイパーバイザーとも呼ばれ、(Coho はサーバー仮想化の魔法を導入したいと考えています)、データ アクセス プロトコル、耐久性、パフォーマンスのニーズを記述するアプリケーション固有のプロファイルをサポートします。
Cohoはこのソフトウェアについて次のように述べています。「データハイパーバイザーは、分離とパフォーマンスのみを重視しています。追加の階層化ファイルシステム、ボリュームマネージャ、RAIDパリティ計算、規定のプロトコル実装といった余分な機能は追加しません。スケーラブルなストレージハードウェアを複数のアプリケーション間で安全かつ効率的に共有できるようにするのが、このソフトウェアの役割です。」
各 MicroArray ペアは 180,000 IOPS (ランダム 80/20 読み取り/書き込み、4K ブロック サイズ) を実現します。
データアクセスプロトコルには、NFS、SMB、iSCSI、そしてDataStreamのDirectConnect APIが含まれます。Cohoによると、将来的にはHadoopジョブを「ストレージプラットフォーム内で直接実行し、本番ワークロードの背後でバックグラウンドで実行」できるようになるとのことです。
HTTPベースのキー/値APIがサポートされます。その他のアクセスプロトコルも追加可能です。
マーケティング資料によると、アレイスイッチ設計の特徴は、「データストリームスイッチはSDN機能を利用して、単一の論理IPアドレスを介して複数のバックエンドサーバーにクライアント接続をインテリジェントにルーティングし、NFSなどのレガシープロトコルをデータプロファイルで容易に拡張できるようにする」ことです。実際、この設計はマイクロアレイ間でNFS操作を並列化しているようです。
スケールアウトによる拡張は、単一のMicroArrayから始めることができます。クラスター化されたMicroArrayのグループは連携して動作し、「ハードウェアとソフトウェアの完全な耐障害性を備えながら、データの保存と複製を行います。スイッチは、「ワークロードプロファイルに基づいて自動的に階層化と負荷分散を行う単一の名前空間」を提供します。
システムは、ワークロードのパフォーマンスまたは容量が不足しそうになると警告を発します。必要に応じて別のMicroArrayを購入し、クラスターをスケールアウトすることができます。異なる世代のMicroArrayは、クラスター内で連携して動作できます。
Cohoオブジェクトストレージ
データ(オブジェクト)は分散ノードに配置され、ルーティングされ、負荷分散を実現します。また、マイクロアレイ内では、プロファイル(パーソナリティ)とデータアクセス頻度の組み合わせに基づいて、フラッシュからディスクへと階層化されます。つまり、プライマリデータはフラッシュに保存され、クールデータはディスク層に送られるということです。
データ保護は、個別のMicroArrayノードにオブジェクトのレプリカを配置するという考え方に基づいています。失われたオブジェクトの再構築には、すべてのMicroArrayが関与する可能性があります。私たちが確認したCohoのドキュメントでは、消失訂正符号とオブジェクトハッシュについては触れられていません。
実際、Coho氏は次のように述べています。「RAIDやオブジェクトストレージシステムで一般的な消失訂正符号技術といった従来のストレージ手法では、複数のデバイス間でデータを均等に分散させようとする、不透明な統計的割り当てが用いられます。この手法は、多数のデバイスがあり、データへのアクセスが非常に均一な場合には有効です。しかし、PCIeフラッシュのように、比較的少数のデバイスでも非常に高性能なシステムを構築できる場合や、非常に人気のあるデータのサブセットに深刻なホットスポットが存在する場合には、あまり役に立ちません。」
Amplidata、Caringo などのオブジェクト ストレージのスタートアップ企業にとって、消失訂正符号が RAID のようなストレージ データ保護の古いアプローチとして分類されることは、あまり喜ばしいことではないと思われます。
価格と性能
11UのCohoシステムは、スイッチ1台と5台のMicroArrayで構成され、190TBの容量と90万IOPSを実現します。定価は53万ドルです。決して安くはありません。Cohoによると、従来の190TBモノリシックアレイを入手するには、定価で150万ドルかかるとのことです。必要なラックスペースは50Uで、IOPSはわずか25万IOPSです。
Coho によれば、同社のシステムは以下を提供する。
- IOPS/Uの18倍
- 66%低い$/GB
- ラックスペースが5分の1に削減
また、MicroArrayクラスタは、ボックスを追加するだけで、パフォーマンスや容量に制限なく、直線的に拡張できると主張しています。追加するボックスは、電源投入からクラスタ内で完全に稼働するまで15分かかります。クラスタは新しいボックスを自動検出し、自己構成を行い、拡張されたクラスタ全体のワークロードをバックグラウンドで再調整します。
データストリームアーキテクチャ
ネットワークはインテリジェントで、Coho は「DataStream スイッチのソフトウェア定義ネットワーク (SDN) 機能により、データの配置、ルーティング、負荷分散、分散プロトコル サービスなどの主要なストレージ システム ロジックをネットワーク自体から提供できるようになります」と述べています。
ベアメタル オブジェクト ストアは、「プロトコル、耐久性、パフォーマンス要件に関係なく、あらゆるアプリケーションをサポートする拡張性を実現します」と述べています。
Cohoはストレージプロファイルについて次のように述べています。「これらのパーソナリティはSDNスイッチに直接統合され、個々のマイクロアレイ上の独立したコンテナに直接ホストできます。…当社の初期製品におけるホスト型NFS実装は、すべてのマイクロアレイ上で動作しますが、スイッチと連携して単一の外部IPアドレスを提供します。…スイッチは、パーソナリティと個々のマイクロアレイ間のプライベートな内部相互接続を提供します。再利用可能なディスパッチロジックライブラリにより、新しいクライアントをこのデータパスプロトコルに統合し、ストライピング、レプリケーション、スナップショット、オブジェクト範囲の再マッピングを直接かつ構成的にサポートできます。」
これは Coho システムのユニークな特性のようです。
競争
もちろん、Cohoは自社のマイクロアレイをモノリシックストレージと比較し、NetAppのClustered ONTAPなどのデュアルコントローラスケールアウトアレイを無視している点で、必ずしも現実的ではありません。この比較には、Nimble Storage、Tegile、Tintriといったハイブリッドアレイのスタートアップ企業も含まれています。
Cohoは実際、EMCのVMAX、HDSのVSP、IBMのDS8000に対抗し、ハイエンドのモノリシックアレイの代替製品となることを望んでいると我々は考えています。しかし、モノリシックアレイの顧客は、ミッションクリティカルなストレージニーズに適した、ストレージパフォーマンスと管理機能のフルセットを求めているため、実現は難しいでしょう。これらの強力なストレージシステムを、ストレージスタートアップ企業の実績のない製品群で置き換える企業はないでしょう。
より現実的なのは、顧客が NetApp、EMC VNX、HP 3PAR ストレージ、Dell Compellent、HDS HUS などの代替として MicroArray を購入することです。つまり、他のハイブリッド アレイの新興企業も参入しており、競争が激しい分野であるということです。
創業者と創設者
このスタートアップ企業は、VeritasとXenSourceの業界ベテランによって2011年に設立されました。最初のAラウンドの資金調達はAndreesen Horowitzから1,000万ドルを調達しました。現在、調達総額は3,500万ドルに達しています。この新たな資金は、「Coho Dataは、今年後半に予定しているCoho DataStreamの一般提供開始に向けて、研究開発と市場投入に向けた取り組みを加速させる」とされています。
共同設立者は3人でした。
- CEOのラマナ・ジョナラは、以前はベリタスで勤務した後、XenSourceに入社した。
- アンドリュー・ウォーフィールド、CTO、Xenハイパーバイザーのオリジナル作者の一人であり、XenとCitrix出身
- Xenハイパーバイザーのチーフアーキテクト兼主要著者であるKeir Fraser氏
この3人は、アンドリーセン・ホロウィッツのピーター・レバイン氏と、現在はイグニション・パートナーズのマネージングディレクターを務めるフランク・アルタレ氏と共に取締役会に名を連ねています。レバイン氏は以前XenSourceに在籍し、その後CitrixによるXenSource買収後にCEOに就任しました。コーホー氏は「AmazonのEC2サービスは、XenSourceのサーバーおよびストレージ仮想化技術を基盤としていた」と指摘しています。
はい、メッセージは理解できました。XenSource の背景は良いものです。
DataStream 1000に関するESGレポート(PDF)はこちらからダウンロードできます。その結論は次のとおりです。
Coho Dataはステルス状態から脱したばかりで、同社の技術が長期的に現場でどのように実証されるかはまだ不明ですが、適切に実行されれば、このソリューションは、パブリッククラウドから学んだ教訓をプライベートクラウドやハイブリッドクラウドモデルに活かし、企業が強力でスケーラブルかつ効率的な方法で社内ストレージサービスを提供するための、有望で魅力的な新しいアプローチを提供すると確信しています。
ホワイトペーパー(PDF)もございます。適度に複雑ですが、読む価値のある内容です。コーヒーを片手に静かな場所で読んでみてください。®