Analysis DataGravity は、中小企業がデータ サイエンティストを雇わずにデータ分析を実行できるように、非構造化データ用の GUI 駆動型 SQL のようなものに取り組んでいるようですが、これは確認されていません。
Vulture Central は、DataGravity のブログや、ネット上の他のブログやレポートを綿密に調査した結果、このスタートアップがどのような企業なのかを大まかに把握できたと考えています。
DataGravityは、2008年にDellがEqualLogicを14億ドルで買収した後に、EqualLogicを設立したポール・ロング氏と、EqualLogicのマーケティングおよび製品管理担当役員であるジョン・ジョセフ氏によって設立されたスタートアップ企業です。
私たちが注目しているのは、オンプレミス、リモート オフィス、クラウドなど複数のサイロに保存された非構造化データを蓄積している中小企業 (SMB) 向けの DataGravity アプライアンスのようです。
人事、マーケティング、営業、法務、財務などの部門のビジネス ユーザーは、たとえば、特定のタイプの新入社員が他の新入社員よりもパフォーマンスが優れている理由や、最終的にどのソーシャル ネットワーキングの投稿が最も多くの収益をもたらしたかなどを調べるためにファイルを調べる必要がある場合があります。
これらは SQL を使用して簡単に生成できないアドホック クエリです。データは構造化されておらず、エンド ユーザーは SQL を知らず、知りたいとも思っていません。
彼らは、画面の前に座り、強力でありながら分かりやすいGUIを使って、社内の様々なストレージシステムに分散された複数のファイルに保存されているあらゆる種類の情報や画像を表示したいと考えています。例えば「石油 + ガス」と「マーケティング」を一度で検索するだけで十分なのに、メール記録などを個別に手動で検索するのは面倒だと感じています。
したがって、DataGravityのアプライアンスは、自社が石油・ガス市場へいつ、誰が販売し、誰がどの程度貢献したか、何が成功し、何が失敗に終わったかをリアルタイムで分析できるようになると推測されます。その狙いは、社内の既存の専門知識とリソースを活用することで、より迅速かつ的確な意思決定を行い、ビジネスパフォーマンスを向上させることです。
DataGravity 分析の概略図。
さて、ソースデータがストレージ上の様々な場所、配列、ファイルタイプに分散している状態で、どうやってリアルタイムにこれを実現できるのでしょうか?ターゲットとなる配列とファイルをすべて調べなければ、これは不可能です。「ゼロ」「ゼロ」「ゼロ」といった具合です。
アプライアンス内のメタデータを検索する必要があります。つまり、論理的には、そのメタデータは、中小企業のファイルストアを巡回し、様々なファイル形式やストレージ施設の場所やアクセス方法を認識する何らかのボットによって生成される必要があります。
言い換えれば、ファイルシステム全体のメタデータをインデックス化し、構造化されたメタデータデータベースを構築する(と推測しますが)一種のコンテンツ管理システムが存在します。ユーザーは、GUIを介して事前に構築された分析ルーチン(いわゆる検索リクエスト)にパラメータを指定してメタデータを検索し、結果(いわゆるレポート)をリアルタイムで取得できます。
ユーザーは、物事をより速く、より良く進める方法を見つけるために必要なデータと専門家にアクセスできます。ユーザー向けのコラボレーション機能も提供される予定です。
一つ疑問なのは、DataGravityのソフトウェアが非構造化データファイルに対して全文インデックスを作成するかどうかです。そうなれば、分析対象となる検索語句の範囲は大幅に広がりますが、メタデータファイルのサイズも大幅に大きくなります。また、ユーザーはメール、ドキュメント、動画、画像、連絡先情報など、あらゆるソースデータを取得できるようになります。
もう一つの疑問は、DataGravityの顧客がソフトウェアの利用から早期に大きな成果をどのように得られるかということです。当初は、検索対象と検索タイプは、最も有望なデータ領域に限定されると考えられます。
DataGravityは先日ラスベガスで開催されたVMware PEXに出展し、パートナーを募集しています。製品発表は今年後半を予定しています。
注意:上記はすべて、入手可能な資料に基づいて作成したものです。DataGravityのブログを読んで、ご意見をお聞かせください。®