背景説明 これは、シリコンバレーのオブジェクト ストレージの専門家 Philippe Nicolas* による素晴らしいオブジェクト ストレージ履歴マップです。彼は、コンテンツ アドレス可能ストレージ (CAS**) (一般にオブジェクト ストレージとも呼ばれる) の歴史を詳述したスプレッドシートを作成しました。
この市場セグメントのサプライヤーやテクノロジーについて、あまりにも奇妙な話をたくさん耳にしてきたので、プレイヤー、コメント、分析をまとめた独自のマップを作成することにしました。このマップ(下図)は、X軸にシンプルなタイムライン、Y軸に企業、プロジェクト、または製品を配置することで、多様な起源を持つ様々な製品の誕生の経緯をまとめたものです。
多くのイノベーションと同様に、この地図はほぼすべてのシステムが小規模な企業から生まれていることを如実に示しています。他のIT分野で当てはまることは、ストレージにも当てはまります。たとえストレージがハードウェアやインフラストラクチャと関連していたとしても、そして今もなおそうなのです。
マップの上部には、いくつかのインターネット大手企業によって発表された重要な論文がいくつか記載されています。これらの論文は、大規模(ハイパースケール)環境向けのオブジェクトストレージアプローチの商用実装のきっかけとなりました。
Google File System、MapReduce、BigTable、そしてHadoop、Amazon Dynamo、Yahoo! MObStor、Facebook Cassandraは、マップに掲載されたほぼすべての企業にとって、当時も今も重要な参照先となっています。これらの企業は、想定されるニーズに十分に対応できる商用製品を見つけることができませんでした。また、製品の制限や複雑さに多額の費用を費やすことを望まず、強固なLinux DNAに基づいて、独自の技術を設計、構築、開発、管理、そして習得することを優先しました。
読みやすくするために、左下の凡例にすべての色付きシンボルの意味が説明されており、地図を理解しやすくなっています。
Philippe Nicolas 氏の愛情のこもったスプレッドシート - CAS/オブジェクトストレージ開発履歴マップ。チャートをクリックすると拡大表示されます。
第一波
1998年から2005年にかけて、CASプレーヤーによる明確な第一波が見られます。FilePoolは、ポール・カルペンティエ氏のおかげで、この分野の先駆者であり、固定コンテンツ専用のストレージへの新たなアプローチを確立しました。同社は、大量のデータを長期間効率的に保存するための革新的な方法を設計しました。この取り組みは、ディスク上のデータアーカイブの新たな潮流の幕開けとなりました。
次に、Bycast、Evertrust、Permabit、Archivas、Honeycomb プロジェクトを含む Sun、そして Paul Carpentier 氏の次のストーリーである Caringo を挙げることができます。Caringo は、CAS とその後のオブジェクト ストレージ フェーズの間に実際に橋渡しをする存在です。
この有望なセグメントの魅力を示すため、これらの企業のほぼすべてが買収されました。例えば:
- 2001年にEMCがFilePoolをCentera製品として発表した。
- 2005年にNexsanがEvertrustを買収し、Assureonに改名した後、2013年にImationが1億ドルで買収した。
- 2007年に日立データシステムズが1億2000万ドルでArchivasを買収し、日立コンテンツプラットフォームに生まれ変わった。
- 2010 年に NetApp によってバイパスされました。
第二波
第二の波は2004/2005年から2009年にかけて起こり、真のオブジェクトストレージのパイオニアが登場しました。この時期は、先に定義されたCAS時代とわずかに重なっています。ここでの主要プレーヤーは、Caringo、Cleversafe、後にAmplidataとなったB-Virtual、Compuverde、Bucket File Systemを開発したDDN、そしてフランスのAtosのRedcurrantプロジェクトです。Redcurrantプロジェクトは、ほぼ10年後の2015年にOpenIOとして分岐します。
また、2つの有名なオープンソースプロジェクトであるCephとGlusterの誕生についても触れておきます。これらは市場で大きな注目を集め、後にRedHatに買収されました。それぞれ2014年にInktank経由で1億7,500万ドル、さらにそれ以前の2011年には1億3,600万ドルで買収されました。RedHatは2003年にSistinaを3,300万ドルで買収し、そのクラスタボリュームマネージャとクラスタファイルシステムを買収することで、ストレージ買収戦略を開始しました。
この時期は、CleversafeとAmplidataが推進した、データ整合性と耐久性を向上させるためのデータ保護の新手法、イレージャーコーディングがストレージ業界に初めて登場した時期でもあります。2006年は、オンライン小売大手Amazonが発表した画期的なストレージモデル、Amazon S3の登場年でもあり、IT業界に永遠の変化をもたらしました。このクラウドストレージサービスは、非常にシンプルなサブスクリプションモデルでインターネット経由のリモートアクセスを可能にしました。翌年の2007年には、この市場のエンタープライズ市場への参入を目指してNirvanixが設立されました。
第三波
第 3 の波は 2008 年から 2009 年にかけて現在まで続き、次のようなオープン ソース プロジェクトや製品が数多く登場しました。
- OpenStack Swift、
- スカイラブル、
- マンタとジョイエント、
- ミニオ、
- オープンIO、
- LinkedInのAmbryさん、
- CoreOSのTorus、
- マイクロソフトアジュール、
- Google Cloud Storage、
Hadoopへの本格的な取り組みが進み、企業、通信事業者、サービスプロバイダーのオンプレミスニーズをターゲットとした商用製品が数多く登場しています。複数のアクセスプロトコルやアクセス方法を究極の統合要素として、次世代のデータストレージプラットフォームの構築・提供を目指すプレーヤーも現れています。
消失訂正符号によるデータ保護やアクセスメソッドは比較に役立つ優れた機能ではあるものの、ソリューションの差別化は困難になり始めていました。一部の企業はHDFS接続機能を追加し、Hortonworksはこれらのシステムの統合の可能性を示すOzoneプロジェクトを開始しました。結局のところ、HDFSは単なるアクセスメソッドに過ぎません。
この期間はおそらく 3 つの波の中で最も活発で、オープン ソース ソリューションが明らかに多数を占めています。
2000年当時、世界に存在していた製品はFilePool、Bycast、Evertrust、そしてPermabitの4つだけでした。現在では、そのうち3つが買収され(BycastのNetApp StorageGRIDなど、一部の製品は現在も開発が続いています)、Permabitは2011年に製品提供を中止したため、これらの製品はどれも存在しません。2010年には、オープンソース製品も含め30以上の製品が存在していました。現在では、45以上のシステムが様々なオープンソース製品とともに市場に出回っています。
このオープンソースの存在は 2004 年に Ceph から始まり、その波は 2008 年に加速し、現在では上記の 45 のオープンソース システムのうち 16 が市場で入手可能となっています。
買収に関して言えば、近年、少なくとも5年間存続した企業による買収が多く行われました。これは地図の右上によく示されています。過去最大の買収は、Amplidata買収をめぐる競争入札の末、IBMに買収されたCleversafeです。
教訓
CAS とオブジェクト ストレージの歴史に関する今回の調査から得られた教訓をいくつか紹介します。
- HTTPはトランスポートプロトコルとしてストレージでその価値を実証してきました。
- S3は事実上の市場標準として登場しました。
- x86コモディティサーバーでストレージを実装することは現実であり、ソフトウェア定義ストレージの出現と存在は、FilePool以来10年以上にわたってこの現実を裏付けてきました。
- 消失訂正符号は特に大規模に行う場合には必須である。
- オープンソースは現実であり、大容量システムの導入をより簡単かつ迅速にします。
- ファイルを忘れないでください。それはまだ存在しており、長年その現実を認めることを拒否してきた多くのオブジェクトストレージベンダーは、ソリューション、メッセージング、ポジションを適応させなければなりませんでした。
- Azure以外のMicrosoftは全く存在しない。
- 長年にわたるデータおよびストレージ管理の大手で、シマンテックから分離して以来独立している Veritas も、製品がなくこのマップから外れています。
そして最後に、イノベーションは小規模なプレイヤーやチームから生まれるということを改めて認識しました。ストレージもこのルールの例外ではありません。®
*フィリップ・ニコラスは、Rozo Systems、OpenIO、Infinit、Solix Technologies、Guardtimeのアドバイザーです。
** CASはContent Addressable Storage、Content Aware Storageとも呼ばれます。