かつての Hadoop ディストリビューションの競合企業 Hortonworks との不公平な合併を終えたばかりの Cloudera は、同社初の大規模な公開イベントで、企業向けに新しいデータ プラットフォームを強力にアピールした。
製品管理の Fred Koopmans が CDP について解説します
それほど新しくはないこの会社の幹部らは(刷新されたロゴとブランドは近日中に発表される予定だ)、今週、Hortonworks の企業合併前の毎年恒例のパーティーである DataWorks Summit のステージに立つ。
シスコとAWSがハイブリッドKubernetesで熱い戦いを繰り広げる
続きを読む
メインカンファレンスに先立つ昨日の報道関係者およびアナリスト向けイベントで、幹部らは同社の新たな主力製品である Cloudera Data Platform (CDP) の詳細を説明した。この製品は、Hadoop の巨人が最近発表した、精彩を欠いた財務状況と広く見なされていたものを受けて、後れを取っていた。
CMOのミック・ホリンソン氏はいつものように控えめに、Clouderaの「エンタープライズ・データ・クラウド」は「世界最大規模の企業のビッグデータ問題を解決すること」にのみ焦点を当てていると語った。
ホリンソン氏は4つの要素を概説した。それは、あらゆる場所での多機能分析、考えられるあらゆるクラウドメカニズムのサポート能力、共通のサポートとガバナンス、そして依然としてオープンプラットフォームであることである。Clouderaのディストリビューションは歴史的にオープンコアであったが、今後はHortonworksと同様に100%オープンソースになると彼は述べた。
CDPの最初のバージョンは夏にリリースされる予定です。AzureとAWSの2つのパブリッククラウドをサポートし、データエンジニアリングとデータウェアハウスの両方をサポートします。年内、あるいは2020年初頭には、プライベートクラウドのコンテナ化とさらなる分析機能をサポートする第2弾のリリースが予定されています。
先週指摘したように、CEO の Tom Reilly 氏は、Cloudera はマルチベンダー クラウドやハイブリッド クラウドも販売できるため、CDP を使用して AWS と競合できると述べています。
箱の中には何が入っていますか?
このプラットフォームの技術仕様は、製品管理担当副社長のフレッド・クープマンス氏によって追加され、同氏はこのサービスがすべての顧客の願いを叶える答えであると宣伝した。
たとえば、同社の顧客の多くにとって「大きな原動力」となっているのは、製品がオープンソースであり「行き止まりがない」ことを保証することである。また、ハイブリッドのマルチクラウド プラットフォームにより、顧客はインフラストラクチャの急速かつ劇的な変化に備えることができる。
クープマンス氏は、両社が昨年夏、約5年ぶりにプラットフォームのメジャーバージョンアップを発表したが、「大多数」の顧客が依然として旧バージョンを使っていると指摘した。顧客からよくある質問だったが、CDPへの直接アップグレードパスが提供される予定だという。
しかし、CDP ははるかに大きな飛躍であり、「新しい種類のプラットフォーム」だと彼は語った。
ビッグデータに多額の資金が投入されているにもかかわらず、誰もそれを収益化する方法を知っていない。
続きを読む
これには、企業内の全員が同じベースクラスターやアップグレードサイクルを共有する必要がない、洗練されたインタラクションモデルが含まれます。クープマンス氏によると、これは企業が社内データへのアクセスを高速化し、より「機敏性を高める」にはどうすればよいかというよくある質問への回答です。
CDPは、ビジネスユーザーがクラスタ外で新しいアプリケーションを展開できるようにすることで、この問題に対処していると彼は主張した。アプリケーションエクスペリエンスの選択肢としては、Distro-Xと呼ばれる柔軟なアプローチと、より簡素化され制約のあるセルフサービスエクスペリエンスの2つがある。後者は柔軟性を犠牲にして、より多くの自動化とセルフサービスを実現する。
例えば、ある企業は、特定のチームと数週間共有できるセルフサービス型のデータマートを構築し、その後「環境全体を破棄」することができます。クープマンス氏によると、これは「一時的な」ものに多くの時間とスクリプトを費やしたくない人にとって最適です。
CDP には新しいコンピューティング モデルも導入されており、ベアメタルに展開したり、Amazon、Google、Microsoft の IaaS でクラウドを実行するのではなく、コンテナ プラットフォームで実行するようになる、と Koopmans 氏は語ります。
「まず、後付けではなくデフォルトで仮想化されています。次に、柔軟性が高いため、これらのリソースをはるかにシンプルかつ効率的に拡張・縮小できます」と彼は述べた。つまり、ストレージとコンピューティングを同じ速度で拡張する必要がないのだ。
データセンターには2つの導入モデルがあります。1つは顧客が用意するモデル、もう1つはClouderaが「バッテリー込み」バージョンを提供するモデルです。「ほとんどの顧客は、コンテナを実行できる汎用Kubernetes環境をまだ持っていません。あるいは、持っていたとしても、ビッグデータアプリケーション向けに最適化されていないのです」と氏は述べました。
クープマンス氏によると、アプリケーションのスケールを大幅に拡大できる新しい管理フレームワークも導入されるという。数千ものアプリケーションがデータレイクとコンピューティング環境を共有する可能性があるため、顧客にとってそれらの統合管理とライフサイクルの自動管理が不可欠だとクープマンス氏は述べた。また、共通のセキュリティとガバナンスを実現する統合メタデータ管理も提供される。
ホリンソン氏は以前、この共通のセキュリティとガバナンスのモデルは「競争上の堀」を作らないため、Cloudera のプラットフォームが他のベンダーのプラットフォームより目立つようになると主張していた。
「多くの企業が、あるワークロードを独自のセキュリティとガバナンスモデルで提供しているかもしれません。しかし、別の企業から別のワークロードを購入する場合は、別のモデルが必要になります」と彼は述べた。「これは大手パブリッククラウドベンダーでも同様です。」
その他の要素としては、クラウドでの操作を簡素化する新しいフォームファクター、新しい移植性と統合ツール、そしてクープマンス氏が主張する、月に2回アップデートがリリースされることにより実行速度が向上する新しい開発モデルなどがある。
ClouderaはHortonworksへの執着を捨て、AWSがずっと悪者だったことに気づく
続きを読む
データ ウェアハウス ツールは拡張され、各ディストリビューションのツールセット (これまでは分岐していた) の最良の要素が取り入れられ、最終的には、顧客の選択を自動化して、ユース ケースに最適なものが自動的に選択されるようにすることが目標となります。
クープマンス氏はまた、既存の顧客が「大規模な変更なしに」利用できる新機能についても言及した。これには、CDH向けのリモートクラスタ管理サービスが含まれる。これはHortonworksが運用面で提供していた機能である。HDPの顧客は、データサイエンティストの生産性向上を支援することを目的とした、Clouderaの統合機械学習モデル開発プラットフォームを利用できるようになる。
ホリンソン氏はまた、同社は「顧客に魚の釣り方を教える」ことに取り組んでいると述べた。これは、Clouderaが顧客に専門的なサービスとトレーニングを販売することを意味している。また、Hadoopを駆使する2社は、それぞれ他の企業とのビジネス関係を継続すると付け加えた。®