分析してみましょう: Microsoft は、CosmosDB の新機能で OLAP-OLTP の「リンク」を約束しています

Table of Contents

分析してみましょう: Microsoft は、CosmosDB の新機能で OLAP-OLTP の「リンク」を約束しています

Ignite Microsoft は、トランザクション NoSQL データベースを分析の主力データ ウェアハウスに近づける取り組みの一環として、Azure Synapse Link for Cosmos DB を一般提供しました。

マイクロソフトは昨年5月にこのリンクが2つの主なコンポーネントで構成されると予告した。

まず、Cosmos DBは、既存の行指向のトランザクションストアに加えて、コンテナ内に列指向の分析ストアを格納します。「分析ストアはトランザクションストアから完全に分離されているため、分析ストアへのクエリはトランザクションワークロードに影響を与えません」と、開発者のRamnandan Krishnamurthy氏とSri Chintala氏は昨年のブログ投稿で述べています。

SQL - 湖の概念図

Databricks: うわ、この乱雑なデータレイク環境を見てください。目を細めてください。SQLを使えば、これなら整理できるのに。

続きを読む

次に、Azure Synapse Analytics はランタイム サポートを提供します。つまり、Azure Cosmos DB 分析ストアと、Apache Spark や Synapse SQL サーバーレスなどの Azure Synapse Analytics でサポートされているさまざまな分析ランタイムとの「ネイティブ統合」です。

ライブトランザクションデータに対して分析を実行するというアイデアは、決して新しいものではありません。リレーショナルデータベースの世界では、データベース内のオブジェクトストレージに列指向データを保持するMariaDBのアプローチや、ビジネスアプリケーションデータベース上で直接分析を実行するOracleのCloud Data Science Platformなどがその例です。

それでも、Azure CosmosDb 向けの Synapase リンク (これにより、ユーザーは Azure Synapse Analytics から Azure Cosmos DB コンテナーに直接接続し、別のコネクタなしで分析ストアにアクセスできるようになる) は、Microsoft にとって重要なマイルストーンだったと、Forrester の副社長兼主席アナリストである Noel Yuhanna 氏は述べています。

金融サービス、小売、ヘルスケアなど、多くの垂直産業において、ほぼリアルタイムの分析に対する需要が高まっています。しかし、トランザクションシステムからのデータ移動と処理における遅延が、この取り組みの遅れを招いているケースが少なくありません。

同氏は、OLTP (トランザクション) システムと OLAP (分析) システム間の連携について語り、次のように付け加えた。「Azure CosmosDB 用の Azure Synapse リンクにより、OLTP と OLAP がより密接に連携され、組織が最小限の労力でリアルタイム分析をサポートできるようになります」。

Microsoft が Synapse 環境に別の Azure ソースを導入する動きは、大規模で高度に分散されたアプリケーションに CosmosDB を使用している顧客にとって魅力的であり、また MongoDB API の追加により、ドキュメント NoSQL データベースに精通している人にとって CosmosDB がより魅力的なものになると、Constellation Research の副社長兼主席アナリストの Doug Henschen 氏は述べた。

「CosmosDB と Synapse の統合により、Synapse がサポートするデータ サイエンス、データ エンジニアリング、SQL 分析のコンテキストで、CosmosDB のデータをより簡単に利用できるようになります」と彼は述べています。

コスモスのさらなる調整

Microsoft はまた、Azure Cosmos DB API for Mongo DB サービスでの Mongo v4.0 サーバー サポートの一般提供を発表しました。これは、開発者が、マルチドキュメント トランザクション サポートと「再試行可能な」書き込みを使用して、データベースでエラー処理をより簡単に実行できるように設計されています。

プレビュー版では、Azure Cosmos DB の継続的バックアップとポイントインタイムバックアップをご利用いただけます。これは、過去 30 日間の任意の時点からデータを復旧および復元することを目的としています。Cosmos DB のロールベースのアクセス制御もプレビュー版でご利用いただけます。

データ ウェアハウスの分野では、Microsoft は、従来のデータ ウェアハウスやクラウド データ ウェアハウスから Azure への移行を簡素化するために設計された機能である Azure Synapse Pathway をリリースします。

コンステレーション・リサーチのヘンシェン氏は、開発により「Teradata、Snowflake、IBM Netezza、AWS Redshift、SQL Server、Google BigQueryなどの人気のサードパーティデータソースをSynapseに取り込む」ことが約束されていると語った。

Synapse は、Redshift、BigQuery、そして 330 億ドルの IPO で市場の注目を集めた Snowflake など、他のクラウドネイティブ データ ウェアハウスと競合しています。

Synapse はまだ初期段階だが、「多くの企業や顧客が少なくとも試用を始めている」とヘンシェン氏は述べた。ただし、「これらの導入のうち、どれだけが本格的な生産段階にあると言えるのかは不明だ」とも付け加えた。

また、Synapse は、共有され、一貫して保護され、管理されたデータに対して実行される SQL ベースのウェアハウス環境を備えた Spark 搭載のデータ レイク機能を使用することでも他社とは一線を画していると彼は述べています。

「これは BigQuery、Snowflake、Redshift のデータベース サービスと同じものではありませんが、大規模な SQL ウェアハウスと分析のためのクラウド オプションという意味で、競合関係にあります。

「今のところ、Synapseはまだ初期段階であり、直接比較した競合評価はまだ多くありません。Synapseは明らかに、Azure中心の顧客にとって検討する選択肢となるでしょう」とヘンシェン氏は述べた。

Databricks は昨年、問題を別の方向から捉え、Spark ベースの Delta Lake で BI に対応する SQL Analytics をリリースし、データ レイク環境に SQL を導入する方向に進みました。®

Discover More