スタートアップ企業iguazioがエンタープライズ分析でNVMe推進ミサイルを発表

Table of Contents

スタートアップ企業iguazioがエンタープライズ分析でNVMe推進ミサイルを発表

iguazio の Data-as-a-Service Enterprise Data Cloud は、アクセス抽象化レイヤーの背後でさまざまなストレージ アクセス プロトコルとユース ケースを統合し、低コストで Amazon やオールフラッシュ ファイラーよりも優れたパフォーマンスを発揮すると主張しています。

このスタートアップ企業の売り文句は、ビッグデータ分析におけるデータの入力、抽出、読み込み、保存は、複数のステップと、ユーザーに公開されるべきではないデータのコピーによって、極めて複雑で非効率であるということです。その結果、データ分析処理が遅延し、価格が高騰し、理解しにくくなっています。そこで同社は、より優れたストレージソフトウェアとメディア活用によって、複雑さを仮想化・抽象化するソフトウェアプラットフォームの活用を提案しています。

iguazio の共同設立者兼 CTO である Yaron Haviv 氏は、次のように述べています。「当社は、HPC、ネットワーク、ストレージ、DB、セキュリティ、管理などに関する長年の経験を活かし、従来の OS 要素のほとんどを回避してスタックをゼロから構築し、世界最速かつ最低コストのマルチモデル DB エンジン (さまざまなデータ タイプを保存してインデックスを作成する DB に関する Gartner などの定義) を開発しました。このエンジンの上には、複数の既存の API/プロトコルをエミュレートする (アプリを変更する必要がない) ステートレスでプラグ可能な API プロキシ レイヤーがあります。」

エンタープライズ・データ・クラウド(EDC)ソフトウェアはPaaS(Platform as a Service)機能を提供し、そのパフォーマンスとコストは桁違いです。わずか4台のデータアプライアンスで、ラックあたり最大10PBのデータを保存でき、コストは月額0.03ドル/GBからと謳っています。このプラットフォームは、ストリーミング、NoSQL、オブジェクト、ファイルを問わず、1秒あたり1,000万トランザクション、50GB/秒のスループット、100マイクロ秒未満のアプリケーションレイテンシを実現します。その理由の一つはNVMeフラッシュです。

EDC は、次の中央ソフトウェア層で構成されています。

  • 4つの利用アクセス方法
    • ファイルとオブジェクト - S3、Swift、NFS、HDFS、Linux FS
    • ストリーミング - Kinesis、Kafka、Spark DF
    • キー/値とレコード - DynamoDB、時系列、Spark DF
    • カスタマーサービス - Docker とイベント駆動型またはスケジュールされたタスク
  • コアソフトウェアには次のものが含まれます。
    • きめ細かなデータファイアウォール
    • 動的インデックス、検索、ACID、プロシージャ、データ最適化、ライフサイクルのための高速統合データプロセッサ
    • メタデータとキャッシュ用の仮想メモリ - 100Gbit RDMA でクラスター化された NV Mem + NVMe フラッシュを使用
    • 直接接続された不揮発性メモリ、フラッシュ、ディスク、リモートディスク、クラウドへのキー/値 API アクセス

同社は、統合データサイロと動的階層化により、こうしたデータに対してGBあたりのコストが最も低いと謳っています。そのパフォーマンスは驚異的です。

  • AWS や他のサービスと比較して、S3 の 60 倍のオペレーション/秒
  • シャードあたり AWS Kinesis と比較して 100 倍のストリーム出力/秒
  • Cassandra および DynamoDB と比較して 25 倍の NoSQL オペレーション/秒
  • オールフラッシュアレイの10倍のNAS IOPS

いくつかのグラフにより、パフォーマンスに関する主張にさらに実質的な内容が加わります。

イグアツィオパフォーマンス1

イグアツィオ・パフォーマンス2

Haviv氏は次のように述べています。「ベアメタル(内部FSやブロック層を持たない)上のDBエンジンであるということは、すべてのインデックス/メタデータ/データが、データ認識型ストレージ階層による最適な検索のためにエンコード/保存されていることを意味します。特定のメタデータやコンテンツを持つファイルを検索するために、ディレクトリトラバーサルを必要とせずに高速SQLクエリを実行するといった巧妙なトリックも採用しています。また、様々な分析タスクをシステム上で直接実行し、重要なアプリ処理をオフロードすることも意味します。」

コストの主張も同様に印象的です。

  • DynamoDB と比較して NOSQL コストが 15 倍低い
  • Stream は AWS Kinesis と比べて 15 倍のコスト削減
  • AWS ElasticCache と比較して、メモリ内 DB コストが 100 倍低い
  • オールフラッシュNASに比べてNASコストが10分の1

Haviv 氏は次のように語っています。「当社の極めて高密度な設計 (サーバーあたり 4 x 100GbE + 8~24 x NVMe + JBOD/F) により、GB あたりのコストが非常に低く抑えられ、独自の Biz モデルと組み合わせることで、ほとんどのストレージ ベンダーや AWS と比べて月間総コストが 10 分の 1 になります。」

同社は、ユーザーは統合後1日以内にAWS Redshiftよりも桁違いに高いパフォーマンスを実現できると主張しています。iguazioの共同創業者兼CEOであるアサフ・ソメク氏は、「ベータ版のお客様は、データアクセス速度の大幅な向上に加え、コストの大幅な削減と運用の簡素化を実現しています」と述べています。

同社のソフトウェアは、開発者とオペレーター向けのセルフサービス ポータルと API を備え、オンプレミスまたはハイブリッド クラウド アーキテクチャに導入できます。

iguazioのEDCを使用すると、ステートレスなクラウドネイティブアプリは数秒でデータをプロビジョニングし、標準APIを介してデータを利用できます。開発者とビジネスユニットは、多層的なロールベースのアクセス制御を備えた抽象ポリシーを通じて、データを共有し、検索、監視、そしてデータライフサイクルのプロビジョニングを実行できます。

Equinixはiguazioと提携しています。9月27日から29日まで開催されるStrata+Hadoop World(ブース番号658)にて、エンドツーエンドのリアルタイムデモを実施します。iguazioのEDC製品は、金融サービス企業、クラウドベースサービス企業、大規模IoT導入企業で初期導入中です。2017年第2四半期に一般提供開始予定です。®

Discover More