オラクルは先週、同社が巨額の財産を築いてきた言語であるSQLをバックグラウンドに据えたデータウェアハウス技術のアップグレードを発表した。
業界初の「唯一の自動運転クラウド データ ウェアハウス」を発表した後、データ統合、データ クレンジング、ETL などのタスクで GUI ドラッグ アンド ドロップ エクスペリエンスがユーザーに約束されている一方で、開発者やアナリストが必要とする場合は SQL も引き続き利用できることが判明しました。
Oracle Autonomous Data Warehouse製品管理担当副社長のジョージ・ランプキン氏は、 The Register紙とのメール取材に対し、次のように述べています。「ビジネスユーザー向けに設計されたセルフサービスツールと、その背後で自動化機能を追加しました。これらのツールは最終的にAutonomous Data Warehouse(ADW)に対してSQLを実行します。ビジネスユーザー向けには、SQLを生成するための、使いやすいドラッグアンドドロップUIを提供しています。」
少なくともクラウドデータウェアハウスでは、SQLはOracleにとって忌み言葉となっている
続きを読む
ただし、明確に言えば、技術ユーザーはSQLを使用してクエリを作成し、独自のデータラングリングを行うことは可能です。「ほとんどのクラウドデータウェアハウスは技術ユーザー向けに構築されており、すべてのデータウェアハウスユーザーがSQLを理解していることが前提となっています。一方、ADWはビジネスユーザーと技術ユーザーの両方に対応しているため、この製品の対象市場が拡大しています」とランプキン氏は述べています。
Oracle は数十年にわたって定着したデータウェアハウスベンダーの 1 つですが、Big Red の最新の戦略は、過去 5 年間で大きく変化した市場に参入することになります。
クラウド向けに設計されたデータウェアハウスであるSnowflakeは、330億ドルのIPOに象徴されるような驚異的な成長を遂げてきました。AWS Redshift、Azure Synapse、GCPのBigQueryといった主要ハイパースケーラー各社が展開する同様の「クラウドネイティブ」なサービスと同様に、Snowflakeはクラウドのオブジェクトストレージ層を活用し、それをコンピューティングから分離することで、これまで煩雑だったデータウェアハウスの導入においてスピードと柔軟性を実現できると主張しています。
Oracle の回答は、同社のクラウド インフラストラクチャとオンプレミスの顧客向けクラウド サービスでのみ利用可能な Autonomous Data Warehouse では、Snowflake よりもはるかにきめ細かいコンピューティング リソースの仕様が提供されていることを指摘することです。
ADWを使用すると、お客様はOracle Compute Units(OCPU、CPU 1個に相当)の正確な数を選択できます。一方、Snowflakeは、コンピューティングリソースを1、2、4、8、16、32、64、128ノードのビルディングブロックでのみ提供しています。同様に、AWS Redshiftの最新世代のハードウェアは、4、12、48個の仮想CPUのブロックを提供しています。Oracleは、価格設定とプロビジョニングの柔軟性により、ユーザーは必要な分だけ支払うことができると主張しています。
「ADWを使用すると、顧客は17 OCPUのシステムを導入でき、1秒あたりの課金で17 OCPU分のみを支払うことになる」とランプキン氏は述べた。
オラクルのアプローチとクラウドネイティブ・システムのもう一つの違いは、ストレージ層です。ランプキン氏によると、オブジェクト・ストレージへの依存度はハイパースケーラーとは異なりますが、ADWは「最高のパフォーマンス、スケーラビリティ、セキュリティを実現するために、ソースコードレベルでOracle Databaseと共同開発されたOracle Exadata Database Machineをベースとしています」とのことです。
同時実行性へのアプローチも異なります。Snowflakeは、同時実行性の増減に合わせてクラスターを自動的に追加・削除します。ベンダーによると、顧客は使用した分だけ料金を支払うことになります。
一方、Oracleでは、顧客がOCPUの数を正確に設定できるようにしており、それによってシステムがサポートする同時SQL文の数が決まります。また、ワークロードの優先順位付けは、高、中、低の設定で組み込まれています。例えば、16個のOCPUを搭載したADWの場合、高では最大3件の同時SQL文、中では最大20件、低では最大4,800件までサポートされるとOracleは述べています。
ワークロードが指定されたOCPU設定を超えると、ADWは自動的に追加のOCPUを提供します。ADWデータベースは、元のOCPU設定の最大3倍の容量まで瞬時に拡張され、お客様は使用した追加のOCPUに対してのみ課金されるとBig Redは述べています。
また、Oracle のデータ ウェアハウス システムに新しく追加されたのは、APEX と呼ばれるローコード アプリケーション開発ツールです。このツールの RESTful サービスにより、他の API 対応システムがデータ ウェアハウスと対話できるようになります。
私のタイプでもあります…
さらに、Oracleはサポートするデータ型を拡張しました。ADWはネットワーク化された関係性の分析をサポートする一方で、グラフデータのサポートはNoSQLドキュメントストアデータベースのJSONドキュメントのサポートと類似点を示しています。これらすべてが、管理されたシステム内で実現されます。
しかし、これらの機能はOracleに固有のものではありません。例えば、Teradataは2013年からグラフをサポートしています。PostgreSQLも同年にJSONファイルのサポートを開始しており、次のオープンソース版ではこれらの機能が強化される可能性が高いでしょう。
ガートナー社のデータおよび分析担当アナリスト兼シニアディレクターのヘンリー・クック氏は、APEX は分析および BI チームがスキルを再配置するのに役立つだろうと述べています。
「これらのチームは、システムを効率的に運用するために、高いスキルを持つ人材を採用・維持するか、プラットフォームのパフォーマンス向上のために多額の費用を費やす必要があります。AIと自律機能を活用することで、両方のメリットを最大限享受できる可能性があり、私たちが得たフィードバックはほぼその通りだということです。」
クック氏は、SQL をバックグラウンドに隠して、Oracle は ADW を「一種のプラットフォーム」として位置付けており、機械学習、NoSQL データ、開発を 1 つの環境で提供することで、技術に詳しくないユーザーにもデータ ウェアハウスを開放すると述べた。
クック氏は、ガートナー社はADWに関して良好なフィードバックを得ており、スノーフレーク社に対抗できなかったのは市場の認識によるものだと述べた。「おそらく、何よりも認知度の問題でしょう。オラクル社の顧客以外では、ADWの存在をあまり知らない人が多いのです。オラクル社は自社の顧客に対しては良いサービスを提供しているものの、スノーフレーク社が注目を集めているのです」とクック氏は述べた。
より大きな問題は、ADWがOracleのプラットフォームでしか利用できないことにあるかもしれません。SnowflakeとTeradataは3つのハイパースケーラーすべてで利用できるため、データウェアハウスの選択によって特定のクラウドインフラストラクチャに縛られたくない組織には選択肢が広がります。®