メタデータファーミング、データサイロ化を打破するスタートアップ:さあ、構造化されていないデータを持ってきてください

Table of Contents

メタデータファーミング、データサイロ化を打破するスタートアップ:さあ、構造化されていないデータを持ってきてください

+コメント ストレージSaaS(Software as a Service)業界の新参者であるHammerspaceは、今週、自社の名を冠したSaaSアプリケーションの一般提供を発表しました。このソフトウェアは、Primary Data(そう、あのPrimary Dataです)の技術を用いて開発され、ハイブリッドITおよびクラウド環境に適用され、SaaSクラウド制御プレーンを提供します。

大型ハンマーでセメントブロックを粉々にする

Primary Dataは停止を表明、Hammerspace、InnodiskはSSDを一部調理、富士通はブロックチェーンへ

続きを読む

The Reg は、ファイル サイロを単一のネットワーク接続ストレージ (NAS) リソースに統合し、ハイブリッド クラウドでもパブリック クラウドでも、どこからでもオンデマンドで非構造化データにアクセスできるようにする方法を提供する Hammerspace について、取締役会長、CEO、および創設者の David Flynn 氏に話を聞きました。

フリン氏はPrimary Dataの共同創業者兼会長であり、それ以前はフラッシュストレージのパイオニアであるFusion-ioを創業・経営していました。Primary Dataは、プライマリデータのためのメタデータ駆動型のコントロールプレーンを目指していましたが、今年初めに閉鎖されました。The Register紙がこの点について質問したところ、フリン氏は、同社がハイブリッドITとパブリッククラウドの世界に適応しきれていなかったため、オンプレミスで稼働するソフトウェアに特化していたためだと説明しました。

Hammerspaceはエンジェル投資家からの資金提供を受けており、従業員数は約25名です。Primary DataとTonianの技術を買収しています。AWS、Azure、Google Cloud Platformに加え、Western Digital、NetApp、Cloudian、Red Hatとも提携しています。

何をするのか

オンプレミスのHammerspaceソフトウェアインスタンスは、ローカルに保存されているファイルとオブジェクトを検出し、それらを記述するメタデータカタログを構築します。グローバル重複排除とWAN最適化を利用して、このデータとメタデータをクラウド上のHammerspaceインスタンスに複製します。そこからファイルまたはオブジェクトの形式で提示し、データが必要なオンプレミスまたはクラウド上の他の場所に送信できます。

たとえば、クラウド内のコンテナ化されたアプリケーション (AMI) は、Hammerspace コントロール プレーンを介してデータにアクセスする必要がある場合があります。また、オンプレミスのワークロードは、集中的なコンピューティング処理のためにクラウドにバーストする必要がある場合があります。あるいは、地球を一周して太陽を追う必要がある場合もあります。

同時実行制御を提供し、複数のプロセスがデータの単一の共有コピーを安全に更新および読み取りできるようにします。

実際、Hammerspace (漫画のキャラクターが物体を引き抜く、見えない空気のポケットにちなんで名付けられました) はメタデータを収集し、そのメタデータを使用して、複数のクラウドや場所にわたるファイルやオブジェクトの分散、グローバル検索、保存されたアイテムのレポートと分析などのデータ管理サービスを提供します。

このソフトウェアは、エンターテインメントやメディア、石油・ガス、半導体チップ設計などの業界や MSP におけるデータ集約型のワークロード向けに設計されています。

データの範囲と柱

ハンマースペース社によると、このソフトウェアは複数のデータセンターと複数のプロトコルにまたがり、一次データ、二次データ、三次データなどあらゆる種類のデータを対象としており、特に一次データに重点​​を置いているという。

それは 3 つの柱の上に構築されています:

  • 機械学習による自動化により、ファイルレベルの粒度で複数のデータセンターにまたがり、
  • インテリジェントなメタデータにより、データ所有者はタグやキーワードなどを使用してファイルを細かく制御できます。
  • 極めて高いパフォーマンスレベルでデータを提示する能力

これを裏付ける数字はまだ出ていません。フリン氏は、メタデータを非常に高速に複製し、それに従ってデータを複製することが重要だと述べました。

フリン氏によると、データは決定論的な方法で管理され、望ましい結果が述べられ、それを達成するためハンマースペースシステムがデータを整理するとのこと。

このソフトウェアには、機械学習による自動意思決定機能も備わっています。

データ制御プレーン

Hammerspaceは、マルチテナント、マルチクラウドのデータコントロールプレーンです。データはストレージから抽象化され、あらゆるクラウド、あらゆるコンテナ、あらゆるアプリで利用できます。メタデータ駆動型の機械学習によってデータ管理を自動化することで、アプリケーションをデータサイロに蓄積するのではなく、クラウド間で移動できるようになります。

クラウドストレージゲートウェイ、キャッシュ、そして競争

しかし、これは Nasuni、Panzura、Egnyte がクラウド ストレージ ゲートウェイ ソフトウェアで行っていることではないでしょうか。つまり、離れた場所間で大きなファイルを共有し、オンプレミスとパブリック クラウドのハイブリッド IT セットアップを支援することではないでしょうか。

ウォズの呪いが再び襲う ― まずFusion-ioが消滅、今度はPrimary Dataがダウン

続きを読む

フリン氏は次のように語った。「HammerspaceはNasuniやPanzuraと似ています。これらはデータ集約型の環境には適していません。低パフォーマンスのファイルを世界中に同期するだけでは、私たちの得意分野ではありません。重要なのは大規模かつ高性能なサービスなのです。」

キャッシュはどうですか?

フリン氏は「キャッシュというのは中途半端な方法だ」と語った。

彼は、Hammerspace のテクノロジーは他のファイルシステム再設計者とは異なり、非侵襲的であると述べました。「私たちが行っていることは非破壊的です。お客様のストレージを当社のストレージに置き換える必要はありません。」

Pixit Media が使用する Excelero や Spectrum Scale などの製品などの他のストレージ テクノロジは、パブリック クラウドでは動作しません。

Hammerspace を Cohesity や Rubrik と比較するように求められると、同氏は次のように答えた。「当社はストレージではなく、メタデータに重点​​を置いており、非構造化データの高性能な消費を可能にしています。」

The Regはパフォーマンスが重要な要素になると考えているようです。Hammerspaceの速度をNasuniやPanzuraと比較したパフォーマンス数値をぜひ見てみたいと思います。

NetAppのデータファブリックコンセプトは、SnapMirrorを活用し、ハイブリッドIT環境におけるファイル配置の柔軟性を実現します。HammerspaceとNetAppのデータファブリックの柔軟性の違いについて、Flynn氏に伺いました。

Flynn 氏は次のように語っています。「NetApp SnapMirror は、新しい場所で利用できるようになる前に、データボリューム全体を移動します。Hammerspace はデータを仮想化し、メタデータを通じてどこからでも瞬時にアクセスできるようにします。」

機械学習により、ファイルレベルの粒度で予測可能なオンデマンドのデータが利用可能になるため、データ利用者はすぐに業務を開始できます。さらに、Hammerspaceは、複数のストレージベンダーのデータをハイブリッドクラウド全体の同じグローバル名前空間に提示できるため、データ利用者はデータをコピーすることなく、ストレージサイロを超えて操作するために必要な柔軟性を得ることができます。

フリン氏は、Hammerspaceがサーバー仮想化やソフトウェア定義ネットワークのようなプラットフォームになることを目指していると述べた。「私はあらゆるストレージサイロを終わらせたい。最大のサイロはクラウドだ。これを終わらせ、クラウドが人々のデータを閉じ込めないようにしたい」

+コメント

Hammerspaceは新たなPrimary Dataになるのだろうか?Flynn氏は、同社はオンプレミスデータから脱却し、ハイブリッド・マルチクラウドの世界にしっかりと根付いていると述べた。同社が主張するデータアクセス速度の優位性を早期に実証することは、高性能分散データアクセス市場における地位を確立し、クラウドストレージゲートウェイのサプライヤーとの差別化を図る上で有益な手段となるだろう。

また、データ保護と管理のサービスを提供する Cohesity や Rubrik、ファイル データのライフサイクル管理機能を持つ Komprise との差別化も必要になります。

Hammerspace がこれを実現できれば、12 ~ 18 か月以内に事業構築のための資金調達ラウンドを予定できる可能性があります。®

Discover More