AWS で AI のすべてが揃うショーが続く: テキストからの SQL 生成、ベクトル検索など

Table of Contents

AWS で AI のすべてが揃うショーが続く: テキストからの SQL 生成、ベクトル検索など

re:Invent AWS re:Invent のもう 1 日も、人工知能に関する話題が中心となり、上級役員がステージに上がり、ベクトル データベースがテクノロジーに与える影響などについて熱く語りました。

AWS のデータおよび AI 担当副社長である Swami Sivasubramanian 博士は、AWS CEO の Adam Selipsky 氏も主に AI について講演した翌日、ラスベガスで開催された re:Invent で公式 AI 基調講演を行いました。

データおよびAI担当副社長のスワミ・シヴァスブラマニアン博士は、AWS Generative AI Stackについて説明しました。

データおよびAI担当副社長のシヴァスブラマニアンがAWS Generative AIスタックについて語る

Sivasubramanian 氏はデータベースの観点を解説し、高品質な AI の結果は高品質なデータにかかっていると参加者に説明しました。また、データウェアハウスサービスである Amazon Redshift のテキスト入力から SQL を生成する機能や、OpenSearch Serverless(一般提供開始)、MemoryDB for Redis(プレビュー)、DocumentDB(一般提供開始)といったデータベースマネージャーへのベクトル検索機能の追加、そして Amazon Aurora と MongoDB にも近日中に対応予定の機能など、様々な機能を実演しました。ベクトル検索は、pgvector 拡張機能を介して PostgreSQL でも利用可能です。

では、なぜベクトル検索にこれほど注目が集まっているのでしょうか?「ベクトル埋め込みは、単語、フレーズ、あるいは大きなテキスト単位といったテキスト入力を数値表現に変換する基礎モデルによって生成されます」とシヴァスブラマニアン氏は述べています。「ベクトルを用いることで、モデルは類似した単語間の関係性をより簡単に見つけることができるようになります。例えば、猫は子猫に近い、犬は子犬に近い、といった具合です。」

言い換えれば、データベースマネージャーにベクトル検索機能を追加することで、生成AIへの適合性が向上します。Sivasubramanian氏はAWSが「ポートフォリオ全体にベクトル検索機能を追加する」取り組みを進めていると述べており、今後はこうした取り組みがさらに進むと期待されます。

シヴァスブラマニアン氏は、前日にセリプスキー氏が発表したAI駆動型アシスタント「Amazon Q」に、データベース向けの機能を追加しました。氏は、Redshiftクエリエディタの新機能「Amazon Q ジェネレーティブSQL」のプレビューを行いました。ユーザーがどのような結果を求めるかを指定すると、Amazon QがSQLを生成します。ただし、示された例は比較的基本的なもので、DBA(データベース管理者)や開発者が自分で簡単に記述できるようなものでした。AIは高度な作業よりも単調な作業を支援するという傾向が見られるかもしれませんが、まだ初期段階です。

責任あるAI

シヴァスブラマニアン氏は、AWS Bedrock ツール専用のモデルファミリーである Titan の新機能「Titan Image Generator」をプレビューしました。彼はまずイグアナの画像を入力するよう指示し、次に熱帯雨林の背景を指定するように変更しました。「このモデルを使えば、画像の主題はそのままに、背景をシームレスに切り替えてライフスタイル画像を生成できます」と彼は述べました。

これには明らかなユースケースがいくつかあります。例えば、ユーザーがパーソナライズされたコンテキストで商品を閲覧できるeコマースサイトや、後に女性が自宅のリフォームをしている例などです。しかし、どれもサニタリー感があり、AI生成画像が欺瞞的な方法で利用されるケースは容易に想像できます。

AWSは今年初め、責任あるAIについて議論するためホワイトハウスと面会した数社のうちの一つであり、いくつかの自主的な取り組みを表明しました。シヴァスブラマニアン氏が明らかにした取り組みの一つは、「AI技術の責任ある開発を促進するため、Titanで生成されたすべての画像に目に見えない透かしが付けられます。これらの透かしは、AIで生成された画像を識別するための明確なメカニズムを提供することで、誤情報の拡散を抑制するように設計されています」というものです。プレスリリースによると、これらの透かしは「改ざんされにくいように設計されている」とのことです。

Amazon Bedrock の Guardrails と呼ばれるもう 1 つの機能は、「顧客が生成 AI アプリケーションに合わせてカスタマイズされ、責任ある AI ポリシーに準拠した安全対策を実装するのに役立ちます。」

問題は、ガードレールを気にしない開発者は安全策を実装しないということであり、透かしが堅牢な解決策となる可能性も同様に低い。

  • AWS、AI向けにコア満載のGraviton4とより強力なTrainiumアクセラレーターを発表
  • マイクロソフトはGitHubのAI Copilotを赤字で運営していると報道
  • Alibaba Cloudが独自のカスタムスマートNICでAWSに挑戦
  • マイクロソフトはカスタムクラウドシリコンの開発を進める中で電気技術者に救いの手を差し伸べている

AWSは、AI駆動型アプリケーションが多くの分野で標準となるという立場をとっています。ここで頻繁に表示されるスライドは、AWSがGenerative AIスタックと呼ぶものです。スライドの下部にはインフラストラクチャがあり、GPU、TrainiumおよびInferentia専用チップ、Nitroアクセラレーションネットワークなどが配置されています。Sivasubramanian氏は、カスタムモデルの構築や事前学習済みモデルのデプロイに使用できるオンラインIDEであるSageMakerもこのカテゴリに分類しています。

次にツール、特にBedrockについてです。これはマネージドサービスであり、複数のFoundation Models(AWSの緊密なAIパートナーであるAnthropicの最新版であるClaude 2.1を含む)の選択肢を提供します。Bedrockは、モデルにコンテキストデータを含めることを可能にするRetrieval Augmented Generation(RAG)機能と、モデルを最新の状態に保ち、特定の業界や組織に適応させる微調整と継続的な事前トレーニングと呼ばれる機能もサポートしています。

スタックの最上位には、Amazon QやCodeWhispererなどのツールがあります。これらのツールは、ユーザーがAIに関する知識を必要とせず、AIを活用した支援を提供します。

Amazon Q はおそらく re:Invent での注目のリリースですが、より重要なのはこのスタックのツールとインフラストラクチャ部分です。®

Re:Inventでも

Amazonは例年通り、今年もラスベガスで開催された年次クラウドカンファレンスで、大量の発表を行いました。チャットアシスタント「Q」についてはこちら、AWSのセルベースアーキテクチャに関する提案についてはこちら、CodeWhispererのアップデートについてはこちら、WorkSpacesシンクライアントのリリースについてはこちら、S3の改良についてはこちら、RustとKotlin向けのSDKについてはこちら、カスタム設計されたGraviton4とTrainium2プロセッサについてはこちら、AppFabricの最新の方向性についてはこちら、その他ニュースの概要についてはこちらでご紹介しました。

その間、知っておきたいその他の情報は次のとおりです。

  • 前述の SageMaker Studio には、新しい Web ベースのインターフェースや、Microsoft のオープンソース Visual Studio Code に基づくコード エディターなど、いくつかのアップデートが加えられています。
  • セキュリティツール Amazon Inspector に、追加コードをインストールせずに EC2 インスタンスを監視する機能を含む、さらに 3 つのワークロードスキャン機能が追加されました。
  • Amazon OpenSearch ServerlessのベクトルエンジンとAmazon DocumentDBのベクトル検索(MongoDB互換)が一般提供開始となりました。また、Amazon MemoryDB for Redisのベクトル検索は現在プレビュー版として公開されています。
  • Apache Iceberg テーブルのサポートが Amazon Redshift で一般提供されました。

Amazon の発表のまとめはここで、大きなリストはここでご覧いただけます。

Discover More