Neo4j の「プロパティシャーディング」はスケーラビリティの課題を克服することを約束します

Table of Contents

Neo4j の「プロパティシャーディング」はスケーラビリティの課題を克服することを約束します

Neo4j は「プロパティ シャーディング」を導入しました。あるアナリストによると、これは以前のスケーラビリティの問題を克服するのに役立つと同時に、同じシステム上でトランザクション ワークロードも可能にするとのこと。

Unix のようなシステムにログインした orage VT100 端末を背景にした Gnu / ヌーのイラスト

フリーソフトウェア財団はNeo4jライセンスアドオンからAGPLv3を守るために立ち上がる

続きを読む

BTグループ、リスクインサイト企業のダン・アンド・ブラッドストリート、化学大手BASFなどの顧客に利用されているグラフデータベースの老舗企業Infinigraphは、今月初めにセルフマネージドサービスに新たな分散グラフアーキテクチャを導入するInfinigraphをリリースしました。このシステムは、Neo4jのフルマネージドグラフデータベースサービスであるAuraDBでもまもなく利用可能になります。

グラフ データベースは、リレーショナル データベースの列と行ではなく、ノードとエッジに従ってデータをグループ化します。その構造は、たとえばソーシャル メディアを使用する企業グループ間または個人間の関係のネットワークの分析により適していると考えられます。

Infinigraph により、新たなスケーラビリティが実現するだけでなく、システムはトランザクション ワークロードや、グラフ データベースでよく知られている分析ユース ケースにも対応できるようになります。

Neo4jのテクノロジープレジデントであるSudhir Hasbe氏は次のように述べています。「Infinigraphは、エンタープライズグラフデータベースの新たな標準を確立します。リアルタイムオペレーションとディープアナリティクスを、完全な忠実度と大規模なスケールで同時に実行する単一のシステムです。私たちは、開発者がデータを知識に変換し、無制限に拡張し、複雑さやコストを増やすことなく、最大のデータ課題を解決するインテリジェントシステムを構築できるよう支援します。」

Neo4jによると、Infinigraphは「プロパティシャーディング」と呼ばれる機能を用いて動作する。これは、グラフの構造(ノードと関係性)を単一のグラフシャードに格納し、グラフの構造をまとまりのある単位として維持する。これらのプロパティシャードは、クラスタ内の異なるマシンに分散することで、グラフシャード内で完全に実行されるグラフトラバーサル(検索)を犠牲にすることなく、水平方向のスケーラビリティを実現できる。

また、Infinigraph はトランザクション ワークロードと分析ワークロードの両方を同じシステムで実行することを約束しており、それによって抽出、変換、ロード (ETL) パイプライン、同期の遅延、または冗長インフラストラクチャを回避できると Neo4j は述べています。

しかし、ガートナー社のシニアリサーチディレクター兼アナリストのロビン・シューマッハ氏は、このシステムが RDBMS システムのトランザクションワークロードに勝つ可能性は低いと指摘する。

「この新しいリリースによって、必ずしも既存の DBMS ベンダーから従来の運用ユースケースがなくなるわけではありませんが、標準のグラフ ユースケースに適合する、より大規模なワークロードに対処できるようになります。こうしたワークロードには、高速にトラバースされるトランザクションと長時間実行される分析クエリが混在するワークロードも含まれる可能性があります」と、同氏はThe Registerに語りました。

同氏は、Neo4j はこれまでスケーラビリティに苦労してきたと付け加えたが、これはユーザーの間でも認められている見解だ。

たとえば、2021年に自動車メーカーのジャガー・ランド・ローバーは、スケーラビリティに関する懸念から、主要なグラフデータベースであるNeo4jを拒否し、ライバルであるTigerGraphを選択しました。データおよびアナリティクスの責任者は、TigerGraphは分散システムとしてより優れたパフォーマンスを発揮すると述べています。

シューマッハ氏は、Infinigraphがこうした懸念をいくらか和らげる可能性があると述べた。「Neo4jは、グラフユースケースに対応するDBMSを探している人にとって常に最初のソリューションの一つでしたが、歴史的にはスケーラビリティに苦労するという評判があり、この弱点を競合他社が突いていました。同社のInfinigraphリリースは、この欠点を解消するとともに、トランザクションと分析の両方のトラフィックを含むグラフ駆動型システムに対して、管理の簡素化とサポート強化を実現することを目指しています。」

しかし、コストに関する懸念は依然として残っています。今年初め、The Register紙は、米国宇宙機関NASAにおけるコストの問題で、Neo4jがライバルのMemgraphに敗れたことを報じました。NASAは以前、既存のデータベースを使用して、NASAの様々なエンタープライズアプリケーションからデータを統合し、知識、スキル、能力、タスク、テクノロジー(KSATT)と職業、役割、トレーニングの関係性を把握していました。

  • NASA、コストを理由にNeo4jデータベースをMemgraphに切り替え
  • 参考までに:控訴裁判所はGNU GPLソフトウェアライセンスを廃止する可能性がある
  • マニフェストファイルの運命: JSON 経由で資金ニーズを宣言する
  • グラフデータベースによると、ソーシャルメディア広告戦争でバイデン氏がトランプ氏を上回る支出をしている

さらに、開発者やデータサイエンティストにとってグラフ専用のデータベースシステムが必要かどうかについても激しい議論が交わされています。カーネギーメロン大学のデータベース学准教授であるアンディ・パブロ氏は、この種のタスクはRDBMSでも同様に実行できると主張しています。

例えば、PostgreSQLにはグラフデータベース機能を提供するApache AGEというグラフ拡張機能があります。MicrosoftはPostgreSQLをCosmos DB DBaaSの一部として提供しており、このグラフ拡張機能をサポートしています。®

Discover More