IO、IO、Weka.ioへ出発だ。ファイルシステムの新興企業を見てみよう。

Table of Contents

IO、IO、Weka.ioへ出発だ。ファイルシステムの新興企業を見てみよう。

Weka.ioは、同社のファイルストレージデバイスは数十億件のドキュメントに対応できると主張しています。この種のデータを処理するには、オブジェクトストレージに頼るのではなく、ファイラー自体を刷新するだけで十分であり、同社は既にそれを実現したと考えています。

WekaIO Matrixは、いわば再発明されたファイラーと言えるでしょう。SSDを搭載したあらゆるコモディティサーバーやクラウドコンピューティングインスタンス上で動作し、単一のクラスタを形成するソフトウェアです。このストレージプール用の単一の高性能でスケーラブルなグローバル名前空間を、クラスタ内で実行されるアプリケーションに提供します。

Weka社によると、このソフトウェアは並列処理が可能で、フラッシュ向けに設計されており、POSIX準拠です。SPEC SFS 2014ソフトウェアビルド対決では、IBM Spectrum Scaleの2倍のワークロードを処理でき、世界最速の分散ファイルシステムと言われています。このベンチマークでは、500回のビルドで動作することが示されました。Weka社は、500回のビルド結果テストで使用した60個のクラウドコンピューティングインスタンスではなく、120個のクラウドコンピューティングインスタンスを使用した2回目のSFS2014-swbuildテストで、1,000回のビルドを達成し、コンピューティングインスタンスの追加に応じてシステムのパフォーマンスが線形に向上することを期待しています。

SPEC SFS2014-swbuildのサマリーを見ると、Weka Matrixのメモリ使用量は約14TBであるのに対し、Spectrum Scaleは1TB、Oracle ZFS Storageは640GBでした。つまり、Wekaがベンチマークで勝利したとしても、価格性能比が最も優れているかどうかは別の問題です。テストではそれが分かりません。

ベンチマークノートには、「単一のWekaIO Matrixファイルシステムが作成され、Amazonクラスタ内の60個の[EC2]インスタンス全体に均等に分散されました」と記載されています。「データは15+2の障害レベルまで保護されました。すべてのデータとメタデータはクラスタ全体に均等に分散されています。」

導入モデルはハイパーコンバージドアーキテクチャであり、ストレージとアプリケーションサービスの両方が同一のインフラストラクチャ上で実行されます。各EC2インスタンスには、32個のvCPU、244GiBのメモリ、そしてインスタンスにローカルな2x320GB(合計640GB)のSSDが搭載されています。利用可能な32コアのうち2コア(6.25%)はMatrixFSでプロビジョニングされ、残りの30コアはアプリケーションでの使用に利用可能でした。各インスタンスには、13GB(5%)のメモリがWekaIOに割り当てられていました。

ウェカIO_GUI

マトリックスユーザーインターフェースのスクリーンショット

コンピューティングインスタンスは、クロック周波数2.50GHzのIntel Xeon E5-2670 v2 CPUを使用し、Wekaはインスタンスごとに2コアと13GBのメモリを使用しました。サーバー内のローカルSSDは1つの論理プールに集約され、ホストアプリケーションには単一の名前空間として提供されます。透過的な階層化レイヤーにより、コールドデータは任意のS3またはSwiftクラウドオブジェクトストアにオフロードされ、単一の名前空間内で無制限の容量拡張が可能です。

リラン・ズヴィベル、オムリ・パルモン、マオル・ベン・ダヤンの3人は、2008年にIBMに買収されたXIVに続く2番目のベンチャーとして、2013年にシリコンバレーに拠点を置くWekaを設立しました。この新興企業は、本日からソフトウェアの購入注文を受け付けています。®

追伸:はい、Wekaのホームページに何かとても見覚えのあるものがあることに気づきました。それが何なのか、はっきりとは分かりません。

Discover More