Google は、オープンソース データベースの管理者である Oracle を追い抜いて、MySQL データベース サービスにベクトル検索を導入しました。Oracle はこれまで、大規模言語モデル (LLM) の実行に有利とみなされる機能を追加できていません。
Chocolate Factory は、Cloud SQL for MySQL、Memorystore for Redis、Google の分散データベース管理およびストレージ サービスである Spanner など、複数の Google Cloud データベースにわたるベクトル検索(プレビュー)を発表しました。
Google Cloud のデータベース担当副社長アンディ・ガットマンズ氏は、過去 12 年間にわたり、Google はベクター技術で急速に革新を遂げてきたと語った。
ベクトルはLLMの基盤となる要素であり、ChatGPTが2022年にローンチされて以来、大手テクノロジー企業、政府、そしてメディアの強い関心の的となっています。LLMは、単語やその他の言語構成要素を、他の単語との統計的な類似性に基づいてベクトル埋め込みとして表現することに依存しています。Googleは2013年にリリースされた自然言語処理技術であるWord2Vecを開発しましたが、LLMで採用されているトランスフォーマーアーキテクチャに取って代わられました。
DB-Engines によれば、市場で Oracle に次ぐ第 2 位である MySQL にベクトル検索を導入することで、Google は Oracle のオープンソース MySQL を追い抜いた。
オープンソース・データベース・サポート企業 Percona の技術伝道師 Dave Stokes 氏は、Oracle のエンジニアリング部門ではコミュニティ・エディションでベクトルや近傍検索のようなものをサポートする予定はないと語った。
「残念ながら、OracleはHeatWaveに全リソースを投入している一方で、コミュニティ版には最低限の機能しか提供していないようです」と彼は述べた。「これではMySQLはPostgreSQLや新しいVectorデータベースといった他の選択肢にさらに後れを取ることになります。コミュニティ版には新機能や性能が不足している一方で、商用版にはJavaScriptやベクター機能が組み込まれているため、コミュニティの顧客はGoogleが提供しているような他の選択肢を求めるようになるでしょう。」
The Register はOracle に連絡し、回答の機会を提供しました。
ただし、MySQLサービスにベクトル検索機能を追加したベンダーはGoogleだけではありません。MySQL/Vitesseベースの分散トランザクションシステムであるPlanetScaleも、昨年10月にこの新機能を発表しました。
キャッシュやシステム ブローカーとしてよく使用される人気のインメモリ データベースである Redis は、今後のリリースでベクトル検索を実現すると約束しています。
先週、分散ドキュメント データベースの Couchbase は、DBaaS Capella および Couchbase Enterprise Edition の新機能としてベクトル検索を導入しました。
- MariaDB、IPO失敗から1年以上後に非公開化の提案を受ける
- OracleはGenAIによるエンタープライズデータへの取り組みを継続
- 粗雑なセキュリティを暴露したITコンサルタントに罰金
- データベースを自動的に乗っ取った恐喝ボットにお金を払うよりも悪いことは何でしょうか?
カウチベースの製品管理および事業運営担当上級副社長、スコット・アンダーソン氏は、プラットフォームにベクトル検索を追加することは「顧客が新たな適応型アプリケーションを構築できるようにする」ための次のステップだと語った。
昨年、Oracle データベース、Cassandra、MongoDB、PostgreSQL、SingleStore がデータベース システムにベクトル検索のサポートを追加し、一方で、Pinecone などの専門的なベクトル データベースのセグメントがコンピューティングのトレンドをサポートするために登場しました。
フォレスター リサーチの副社長兼主席アナリストであるノエル ユハンナ氏は、ベクター検索は現在、本格的なエンタープライズ データベースではほぼ標準になっていると述べています。
「ベクターデータベースを導入していない企業は、成長に影響が出る可能性が高いでしょう。当社の調査によると、約35%の企業がベクターデータベースを検討しており、今後18ヶ月で50%に増加すると予想されています」と彼は述べた。
同氏は、顧客インテリジェンス、詐欺検出、チャットボット、コンテンツのパーソナライゼーションの分野で出現しているアプリケーションで、類似のデータ、画像、文書を探すのに役立つ GenAI アプリケーションにとってベクトル検索が重要になりつつあると述べた。
専門的なベクターデータベースには利点があるものの、統合データベースは組織により多くのコンテキストとより豊富なデータエクスペリエンスを提供するとユハンナ氏は述べた。「ベクター機能はまだ進化を続けており、多くのベンダーがハイエンドのスケールを実現できていないため、特に目立つベンダーは存在しません。」
しかし、現在データベース向けのLLM/GenAI戦略を検討している組織は約22%にとどまっています。一方、Forresterは今後2~3年でこの割合が倍増すると予想しています。「私たちが見ている需要の大部分は、新しい展開でベクトルを活用したい新しいGenAIアプリケーションに対するものです。既存のデータベースがベクトルに移行するには、少なくとも数年先を見据えています」とユハンナ氏は述べています。
ClouderaがApache Icebergを採用、データテーブルで最もオープンになるためにDatabricksと競争
続きを読む
Googleは、自社のGenAIモデルを自社の分析環境に統合しようとしています。Googleは、データウェアハウスシステムであるBigQueryのユーザーがVertex AIを介してGeminiを利用できるようにすることを発表しました。AIおよびMLプラットフォームとの新たな統合は、データエンジニアやアナリストがBigQueryデータに対してGeminiモデルを活用し、マルチモーダルかつ高度な推論機能を活用できるように設計されているものです。
Yuhanna 氏は、Vertex AI、BigQuery、BigLake をより緊密に連携させることで、組織はデータの移動を回避できるだけでなく、分析情報の提供、データ ガバナンスとセキュリティの向上、冗長データの削除、管理要件の最小化によるコストの削減にも役立つと述べました。
同氏は、コストを削減し、BI、データ サイエンス、AI/ML、運用インサイト、SQL 分析を単一のプラットフォームで実行するために、現在約 4 分の 1 の企業が採用している、いわゆるレイクハウス コンセプトで、非構造化データと構造化 BI スタイルのデータを統合することが企業のトレンドの一部であると述べました。®