パートナーコンテンツ不確実性が増す世界経済において、AIイノベーションをめぐる競争は激化しています。しかし、多くの企業は依然としてAI活用に必要なツールを欠いています。ガートナーは、2027年までに60%の企業がデータガバナンスへの懸念からAIユースケースの価値を実現できないと予測しています。
AI市場で競争する企業にとって、セキュリティや主権の問題で足踏みする余裕はありません。企業は、自社の独自データとエージェント型AIへの野望とのギャップを埋める、ターンキー型の主権データおよびAIソリューションを必要としています。では、主権データおよびAIプラットフォームとはどのようなものなのでしょうか?
AI対応データから始まる
AIにはデータが必要です。しかし、企業がAIにデータを活用する際に直面する3つの大きな課題があります。
- 安全な方法でデータコーパスの完全な統合ビューを取得する
- AI対応データの信頼性の高いパイプラインの構築
- 独自データの漏洩を防ぎながら AI を本番環境に導入
最初の課題から始めましょう。今日の企業は、パブリッククラウド、プライベートクラウド、データセンターなど、様々な環境に、様々なチームによって管理されている、様々なシステムにデータを分散させています。統一されたデータ戦略がなければ、変革をもたらすAIの取り組みは失敗に終わります。
解決策は、データに対する完全な可視性と制御です。組織は、分散したシステムを統合し、リレーショナル、ベクター、ドキュメント、時系列など、あらゆるデータモデルをサポートできるユニバーサルなデータプラットフォームを選択する必要があります。さらに、Apache Icebergのようなオープンなテーブル形式とのシームレスな統合も必要です。これにより、サイロ間のデータを統合し、選択したクエリエンジンとの互換性を維持しながら、データへのアクセスと統合を確実に行うことができます。
可視性がなければ制御は不可能です。企業は、自社ホスト、オンプレミス、マルチクラウド環境を含むハイブリッドインフラストラクチャ全体にわたってデータベースを管理、監視、拡張するための単一の管理画面を必要としています。さらに、データプラットフォームは、暗号化、SQL保護、アクセス管理、監査、パフォーマンス(インテリジェントな監視と修復の推奨)、そして集中管理された分散クラスタによるほぼゼロのダウンタイムといった機能を通じて、エンドツーエンドのセキュリティを提供する必要があります。
データを流しましょう
企業資産を統合データプラットフォームに統合することは、AIリーダーシップへの不可欠なステップです。しかし、多くのレイクハウス導入企業が失望しているように、データの一元化だけではすべての問題を解決できるわけではありません。企業は、開発者がオンデマンドで利用できる、AI対応データの信頼性の高いパイプラインを必要としています。
問題は、生成AI向けのエンタープライズデータパイプラインが、しばしば9つ以上の個別のステップを含む、扱いにくく難解なものであることです。開発チームは、ベクトル埋め込みとそれに関連するオブジェクトの保存、インデックス作成、クエリの実行方法に苦慮しています。多くの組織は、既存のデータインフラストラクチャに専用のベクトルデータベースを後付けすることでこの問題をさらに悪化させており、その結果、維持管理に専門知識が必要となる、より断片化されたシステムができ上がっています。その結果、AIプロジェクトはデータパイプラインの混乱によって行き詰まってしまいます。
企業には、AIパイプラインを標準化できるAIファクトリーが必要です。データ側では、埋め込み生成、ストレージ、インデックス作成のワークフローを統合し、取り込みから類似性検索までの自動化されたパイプラインを提供することを意味します。言い換えれば、生データを安全でAI対応のアセットに変換するための組立ラインです。
ソブリンAIファクトリーは、開発者、データエンジニア、データサイエンティスト、そしてAI対応データを活用するその他のユーザーが直面するラストマイルの課題にも対処する必要があります。これは、生成型AIアシスタントやインテリジェントエージェントを含むAIアプリケーションの開発を簡素化するローコードおよびノーコード開発ツールの実装、そしてエンタープライズベクターエンジンを基盤とする安全なAIナレッジベースの活用を意味します。
図1: AIパイプライン、ベクトルエンジン、モデルサービング、ローコード開発ツールを独立したコンテナに統合したAIファクトリー
EDB Postgres AI Factoryは、開発段階におけるステップを最大90%削減し、本番稼働までの時間を劇的に短縮します。しかし、主権型AIにおいては、マシン全体をエンドツーエンドでどのようにセキュリティを確保するかを考慮することが不可欠です。
主権を維持する
JPモルガン・チェースの最高情報セキュリティ責任者(CISO)であるパトリック・オペ氏は先日、ベンダーに対し、標準的なクラウドモデルのサイバーセキュリティ上の弱点に対処するよう求める公開書簡を発表しました。オペ氏は、SaaSは「効率性と迅速なイノベーションを実現する一方で、弱点、機能停止、侵害の影響を増幅させ、単一障害点(SPOF)を生み出し、システム全体に壊滅的な影響を及ぼす可能性がある」と述べています。
今日の一般的な風潮はこうです。テクノロジーはデフォルトで安全かつ独立していなければならない。しかし残念ながら、今日の生成AIツールのほとんどは、データをサードパーティのクラウドに送信する必要がある。これはコンプライアンス上の悪夢だ。
データと AI の主権を真に実現するには、プラットフォームは次の要件を満たす必要があります。
- 組み込みのガバナンスで機密情報を保護
- 公開されている大規模言語モデルにどのような情報が送られるかを正確に制御する
- サードパーティのデータ漏洩リスクを排除
- 柔軟な導入オプションを提供し、企業のセルフホスト環境内でエンドツーエンドの機能を完全に実現します。
幸いなことに、イノベーションが主権争いに勝利しつつあります。AI対応データの保護に役立つ画期的な開発の一つが、いわゆる「オフプロンプト」データアクセス管理です。これは、公開されている大規模言語モデル(LLM)に機密情報が漏洩するのを防ぐものです。
オフプロンプト技術は、機密データを設定可能なベクターストアに分離することで機能します。これにより、パブリックLLMに送信されるプロンプトでは、機密データが参照されるものの埋め込まれません。LLMはオフプロンプトデータを参照したり学習したりできないため、お客様の独自データを保存したり共有したりすることはできません。オフプロンプト制御はデータ漏洩を防ぐだけでなく、プロンプトのサイズを縮小することでコスト削減にも貢献します。
図2: エンドツーエンドのソリューション全体でデータとAIの主権を維持
データとAI主権でエージェントAIの溝を越える
ビジネスリーダーは、顧客や競合他社からAI導入を求める圧力にますます直面しています。しかし、現状ではAI導入には複数のベンダーによる複数の専門製品が必要となり、セキュリティリスクやメンテナンスのオーバーヘッドが増大しています。この断片化されたアプローチは、希少なAI人材の確保を困難にし、開発者は時間の50~80%を統合作業に費やしています。また、機密データが外部ベンダーに流出するケースが多く、ガバナンスリスクが生じ、独自のデータ資産の戦略的優位性が損なわれています。
AI Factoryは、組織のデータプラットフォームにシームレスに組み込むことで、実装の複雑さを軽減し、エージェントAIの価値実現までの時間を短縮します。ベクターデータベース、組み込みパイプライン、モデルサービング、エージェントオーケストレーションを単一の統合システムに統合することで、組織は数ヶ月から数年かかる本番環境対応アプリケーションを数時間から数日で導入できるようになります。また、開発者が高度なエージェントAIを構築するためのローコード環境を提供するとともに、シチズンデベロッパーが特定のビジネスニーズに合わせて様々な推論機能やエージェント機能を連携させるためのノーコードオプションも提供します。
この包括的なアプローチは、AIテクノロジーの進化に合わせて柔軟に適応できる柔軟性を提供します。しかし、変化するコンプライアンスや規制上の懸念にも柔軟に対応するためには、信頼できる環境内で完全なデータ主権とガバナンスを維持する必要があります。このようなソリューションは今や手の届く範囲にあり、独立したベンチマーク調査によると、本番環境への導入までの時間を3倍短縮し、アプリケーションパフォーマンスを8倍向上させ、コスト効率を6倍向上させると同時に、総所有コストを51%削減することが可能です。
エージェント AI のキャズムを乗り越える準備はできていますか? EDB Postgres AI のような主権プラットフォームがどのように役立つかをご覧ください。
EDB 提供。