iguazio の Data-as-a-Service Enterprise Data Cloud は、アクセス抽象化レイヤーの背後でさまざまなストレージ アクセス プロトコルとユース ケースを統合し、低コストで Amazon やオールフラッシュ ファイラーよりも優れたパフォーマンスを発揮すると主張しています。
このスタートアップ企業の売り文句は、ビッグデータ分析におけるデータの入力、抽出、読み込み、保存は、複数のステップと、ユーザーに公開されるべきではないデータのコピーによって、極めて複雑で非効率であるということです。その結果、データ分析処理が遅延し、価格が高騰し、理解しにくくなっています。そこで同社は、より優れたストレージソフトウェアとメディア活用によって、複雑さを仮想化・抽象化するソフトウェアプラットフォームの活用を提案しています。
iguazio の共同設立者兼 CTO である Yaron Haviv 氏は、次のように述べています。「当社は、HPC、ネットワーク、ストレージ、DB、セキュリティ、管理などに関する長年の経験を活かし、従来の OS 要素のほとんどを回避してスタックをゼロから構築し、世界最速かつ最低コストのマルチモデル DB エンジン (さまざまなデータ タイプを保存してインデックスを作成する DB に関する Gartner などの定義) を開発しました。このエンジンの上には、複数の既存の API/プロトコルをエミュレートする (アプリを変更する必要がない) ステートレスでプラグ可能な API プロキシ レイヤーがあります。」
エンタープライズ・データ・クラウド(EDC)ソフトウェアはPaaS(Platform as a Service)機能を提供し、そのパフォーマンスとコストは桁違いです。わずか4台のデータアプライアンスで、ラックあたり最大10PBのデータを保存でき、コストは月額0.03ドル/GBからと謳っています。このプラットフォームは、ストリーミング、NoSQL、オブジェクト、ファイルを問わず、1秒あたり1,000万トランザクション、50GB/秒のスループット、100マイクロ秒未満のアプリケーションレイテンシを実現します。その理由の一つはNVMeフラッシュです。
EDC は、次の中央ソフトウェア層で構成されています。
- 4つの利用アクセス方法
-
- ファイルとオブジェクト - S3、Swift、NFS、HDFS、Linux FS
- ストリーミング - Kinesis、Kafka、Spark DF
- キー/値とレコード - DynamoDB、時系列、Spark DF
- カスタマーサービス - Docker とイベント駆動型またはスケジュールされたタスク
- コアソフトウェアには次のものが含まれます。
- きめ細かなデータファイアウォール
- 動的インデックス、検索、ACID、プロシージャ、データ最適化、ライフサイクルのための高速統合データプロセッサ
- メタデータとキャッシュ用の仮想メモリ - 100Gbit RDMA でクラスター化された NV Mem + NVMe フラッシュを使用
- 直接接続された不揮発性メモリ、フラッシュ、ディスク、リモートディスク、クラウドへのキー/値 API アクセス
同社は、統合データサイロと動的階層化により、こうしたデータに対してGBあたりのコストが最も低いと謳っています。そのパフォーマンスは驚異的です。
- AWS や他のサービスと比較して、S3 の 60 倍のオペレーション/秒
- シャードあたり AWS Kinesis と比較して 100 倍のストリーム出力/秒
- Cassandra および DynamoDB と比較して 25 倍の NoSQL オペレーション/秒
- オールフラッシュアレイの10倍のNAS IOPS
いくつかのグラフにより、パフォーマンスに関する主張にさらに実質的な内容が加わります。
Haviv氏は次のように述べています。「ベアメタル(内部FSやブロック層を持たない)上のDBエンジンであるということは、すべてのインデックス/メタデータ/データが、データ認識型ストレージ階層による最適な検索のためにエンコード/保存されていることを意味します。特定のメタデータやコンテンツを持つファイルを検索するために、ディレクトリトラバーサルを必要とせずに高速SQLクエリを実行するといった巧妙なトリックも採用しています。また、様々な分析タスクをシステム上で直接実行し、重要なアプリ処理をオフロードすることも意味します。」
コストの主張も同様に印象的です。
- DynamoDB と比較して NOSQL コストが 15 倍低い
- Stream は AWS Kinesis と比べて 15 倍のコスト削減
- AWS ElasticCache と比較して、メモリ内 DB コストが 100 倍低い
- オールフラッシュNASに比べてNASコストが10分の1
Haviv 氏は次のように語っています。「当社の極めて高密度な設計 (サーバーあたり 4 x 100GbE + 8~24 x NVMe + JBOD/F) により、GB あたりのコストが非常に低く抑えられ、独自の Biz モデルと組み合わせることで、ほとんどのストレージ ベンダーや AWS と比べて月間総コストが 10 分の 1 になります。」
同社は、ユーザーは統合後1日以内にAWS Redshiftよりも桁違いに高いパフォーマンスを実現できると主張しています。iguazioの共同創業者兼CEOであるアサフ・ソメク氏は、「ベータ版のお客様は、データアクセス速度の大幅な向上に加え、コストの大幅な削減と運用の簡素化を実現しています」と述べています。
同社のソフトウェアは、開発者とオペレーター向けのセルフサービス ポータルと API を備え、オンプレミスまたはハイブリッド クラウド アーキテクチャに導入できます。
iguazioのEDCを使用すると、ステートレスなクラウドネイティブアプリは数秒でデータをプロビジョニングし、標準APIを介してデータを利用できます。開発者とビジネスユニットは、多層的なロールベースのアクセス制御を備えた抽象ポリシーを通じて、データを共有し、検索、監視、そしてデータライフサイクルのプロビジョニングを実行できます。
Equinixはiguazioと提携しています。9月27日から29日まで開催されるStrata+Hadoop World(ブース番号658)にて、エンドツーエンドのリアルタイムデモを実施します。iguazioのEDC製品は、金融サービス企業、クラウドベースサービス企業、大規模IoT導入企業で初期導入中です。2017年第2四半期に一般提供開始予定です。®