re:Invent Amazon は、ラスベガスで開催された re:Invent カンファレンスで、分析と AI を統合した新世代の SageMaker を発表しましたが、SageMaker の名を冠するさまざまなサービスがあるため、混乱が生じています。
現在プレビュー中の SageMaker Unified Studio は、モデル開発、データ、分析、生成 AI アプリケーションの構築をカバーしています。
ただし、旧SageMakerはSageMaker AIに名称変更されて存続し、新SageMakerとは異なるスタジオも備えています。また、引き続き利用可能なクラシックバージョンも存在します。違いは、SageMaker AIは機械学習モデルの構築とトレーニングに焦点を絞っていることです。とはいえ、SageMaker AIはUnified Studioの一部であり、生成AIアプリケーション構築ツールであるBedrockも同様です。Unified Studioは、DataZone APIを介してプログラム的に使用することもできます。
Unified Studio には、Amazon Kinesis などのストリーミング データへのアクセス、Amazon Quicksight ビジネス インテリジェンスとの統合、OpenSearch 検索分析 (Amazon の Elasticsearch と Kibana のフォーク) との統合など、さらなる機能が計画されています。
AWSデータベースサービス担当バイスプレジデントのG2クリシュナムーシー氏によると、次世代SageMakerの中核となるのは、re:Inventで発表されたLakehouseサービスです。「お客様にとって非常に管理しやすい、オープンで相互運用可能なデータ基盤を構築しました」とクリシュナムーシー氏は語りました。
SageMaker Lakehouseは、S3データレイクとRedshift(AWSデータウェアハウス)のデータを統合し、AWS AthenaやApache Sparkなどのツールを使用してApache IcebergデータベースとしてSQLクエリを実行できるようにします。Lakehouseは、DynamoDB、Google BigQuery、MySQL、PostgreSQL、Snowflakeへの接続もサポートしています。データはインポートまたはインプレース分析が可能です。LakehouseとUnified Studioを経由することで、同じデータを分析だけでなく、機械学習や生成型AIアプリケーションの開発にも活用できます。
AWS のエンジニアリング責任者でアナリティクス ビルダー エクスペリエンス担当の Brian Ross 氏は、 The Registerが出席したセッションで次のように述べました。「顧客は、アナリティクス ワークロードが大きくなり、機械学習ワークロードが大きくなり、現在では生成 AI ワークロードも大きくなっており、またそれらは収束し始めていると述べています。」
同じデータが、分析、モデルのトレーニング、そして生成AIのための知識ベースの構築に使用されます。「データに関する大きな課題は、それを見つけることです。組織内のどこかに保管されているものの、どこにあるのか?どうすればアクセスできるのか?」とロス氏は語ります。顧客はこれまで、この問題を解決するためにAWSのサービスやツールを用いて独自のエンタープライズデータプラットフォームを構築する傾向がありましたが、これはコストがかかりすぎました。一方、新しいSageMakerは、これらすべての異なる用途をサポートする「単一のエンドツーエンドのエクスペリエンス」を提供します。
SageMakerにはローコード/ノーコードツールが含まれていますが、ビジネスユーザーではなく、AWSが「ビルダー」と呼ぶユーザーを対象としています。クリシュナムーシー氏によると、ビジネスユーザーはAmazon Q BusinessアプリやAmazon Quicksightダッシュボードをターゲットとしているとのことです。
re:Inventで発表されたSageMakerの機能には、1年前に導入されたモデルのトレーニングインフラを管理するサービスであるHyperPod向けの柔軟なトレーニングプランも含まれています。柔軟なトレーニングプランでは、ユーザーは必要な高速コンピューティングリソースと開始日と終了日の制限を指定します。HyperPodはそれに応じて詳細なスケジュールを提案し、コストを計算します。
高速コンピューティングに対する需要が高いようで、re:Invent の参加者は、使用量が少ない期間を考慮して HyperPod を使用するのがこれらのリソースを保護する最善の方法であると説明されました。
AmazonのAIアシスタントであるQ Developerは、SageMaker Unified Studioに組み込まれています。AWSは、MLモデル構築用のSageMaker AIツールであるSageMaker CanvasにもQ Developerを追加しました。これにより、モデルタイプの選択、データのアップロード、データの準備、テスト、デプロイのためのチャットベースのユーザーインターフェースが提供されます。
料金は一般的なAWSモデルに基づいています。SageMaker Unified Studio自体のご利用には料金はかかりませんが、ほとんどのアクションは他のAWSリソースを消費するため、通常の料金が発生します。ただし、一部のアクションは無料利用枠があり、SageMakerの料金ページに記載されています。不注意な実験によって高額な請求が発生するリスクは多少あります。
Amazon SageMaker は、AWS マネジメントコンソールの一部として、データサイエンティストと開発者向けのサービスとして 7 年前に初めて導入されました。SageMaker は、トレーニングデータの選択、機械学習モデルの選択、モデルのトレーニング、そして Amazon EC2 インスタンスのクラスターへのデプロイのためのシンプルなユーザーインターフェースを提供していました。
- AWSはAIがあらゆるものを破壊できると述べ、Windowsにもまさにそうなることを期待している。
- AWS、4万台のTrainium AIアクセラレーターのクラスターを研究者に公開
- オラクルのAWS買収でビッグ3が完成するも、ライセンスに関する疑問は残る
- ビッグクラウドはAI向けに数千のGPUを導入しているが、そのほとんどは十分に活用されていないようだ
今日のSageMakerは、機能が増えただけでなく、その範囲も拡大しています。SageMakerプラットフォーム全体には、それぞれよく知られている製品が含まれているため、名称が分かりにくい場合があります。なぜSageMakerという名前なのでしょうか?
「アナリティクスとAIの世界は融合しつつあります。そこで、新たに拡張されたSageMakerプラットフォームは、あらゆるデータ分析とAIのための製品、あるいは製品スイートであると表現するのが適切だと考えました。…それが命名上の混乱の原因です」とクリシュナムーシー氏は述べた。「そうでなければ、マイクロソフトがFabricでやったように、新しい名前を考え出すしかなかったでしょう。そうすると、そこに含まれるすべてのコンポーネントを全員に教えなければならなくなるのです。」®