RE:INVENT AWSはRe:inventカンファレンスで、組織内のすべてのデータベースを対象とする移行サービスなど、一連の新しいデータベースおよびMLサービスを発表しました。
ML(機械学習)担当バイスプレジデントのスワミ・シヴァスブラマニアン氏が本日、データに関する基調講演を行いました。彼は、MySQLまたはPostgreSQLと互換性のあるサービスであるAuroraは「MySQLの5倍、PostgreSQLの3倍のパフォーマンス」を誇り、「AWS史上最も急速に成長しているサービス」だと主張しました。
しかし、彼は「クラウド上のデータベースへの移行をためらっている顧客もいる」と懸念を示しました。彼は、組織のデータベースのより多くの部分をAWSクラウドに移行することを目的とした2つの新サービスを発表しました。
1つ目は、RDS(リレーショナルデータベースサービス)Custom for Microsoft SQL Serverです。これは既存のRDS Custom for Oracleに加わるもので、これら2つのサービスは「Oracle E-Business Suite、Microsoft Dynamics、SharePointなど、非常に特殊な構成の商用データベース上で動作するように設計された重要なアプリケーション」をご利用のお客様を対象としています。
RDSカスタムは、お客様がオペレーティングシステムに直接アクセスできないRDSと、EC2上でSQL ServerまたはOracleを実行するハイブリッド型で、すべての詳細がお客様の責任となります。RDSカスタムでは、オペレーティングシステムへの完全な特権アクセスが許可され、カスタムアプリケーションとエージェントをインストールできますが、自動ポイントインタイムリカバリやヘルスモニタリングなど、RDSの利点の一部も引き続き提供されます。Sivasubramanian氏によると、SharePoint、Dynamics、Powなどのアプリケーションに最適です。
- AWSがGraviton3 Armチップなどを発表。しかし、真の話題はIaaSからパッケージソリューションへの移行だ。
- Rustは地球を救えるのか?その理由と、救えない理由
- JetBrainsの全面的改革:リモート開発の導入、新IDEのプレビュー
- AWSは成熟期の入り口にいるが、まだ成熟には程遠い
erBI と Polybase。
次にシヴァスブラマニアン氏は、「お客様から、データベース全体の移行計画を立てるのは困難だという声をいただいています」と述べました。これは、組織がすべてのデータベースをAWSに移行したいと考えているものの、その方法さえわかれば実現できると考えているためです。「本日、AWS DMS Fleet Advisorのプレビュー版をリリースします」とシヴァスブラマニアン氏は述べました。DMSとはデータベース移行サービスのことです。
フリートアドバイザーは、「AWS DMS の新機能で、データベースフリート全体の移行計画を自動化します。DMS フリートアドバイザーは、オンプレミスから Amazon S3 にデータをストリーミングすることで、オンプレミスのデータベースと分析サーバーのインベントリを自動的に構築します。そして、それらのデータを分析し、適切な AWS データストアと照合して、移行計画をカスタマイズします。これらすべてがわずか数時間で完了します」と彼は約束しました。「サードパーティ製のツールや高額な移行コンサルタントに頼る必要はありません。」
エージェントを信頼する
データベース管理者は懐疑的かもしれませんが、アイデアとしては、ユーザーがネットワーク上の 1 つ以上の場所にエージェントをインストールし、データを収集してインベントリを作成し、その結果を S3 にアップロードするというものです。
ドキュメントには、結果として得られたインベントリから「AWS Schema Conversion Tool を使用して移行用のスキーマを変換できます」と記載されています。このツールには、SQL Server から Aurora MySQL への変換など、さまざまなオプションが用意されています。また、データベースを AWS 上で稼働している同じデータベースマネージャーに単純に移行することも可能です。
DMS Fleet Advisor によって検出された在庫
通常、こうしたツールには限界があることが判明しますが、拡大を続けるプラットフォーム上であらゆる種類のデータベースに対応するという同社の決意は疑いようがありません。「AWS Database Migration Serviceを利用して、50万以上のデータベースがAWSに移行されました」とシヴァスブラマニアン氏は述べています。
もう一つの統計として、AWSには20万以上のデータレイクが存在することが挙げられます。Sivasubramanian氏は、AWSが提供するデータベースの種類が多岐にわたることを強調しました。キーと値のペアを扱うDocumentDB、グラフデータを扱うNeptune、イベント処理を扱うTimeStream、インメモリキャッシュを扱うElastiCacheなどが挙げられます。
Re:inventでは膨大な数の新機能が発表されましたが、データとMLの分野も例外ではありません。DevOps Guru for RDSは、Auroraのパフォーマンスや運用に関する問題を検出・分析する新しいサービスです。DynamoDBには新しい低頻度アクセステーブルクラスが追加され、これにより「アクセス頻度の低いデータを格納するテーブルのコストを最大60%削減できる」とされています。
SageMaker Canvas、MLモデルを作成するためのドラッグアンドドロップUI
ML側では、MLモデル開発ツールであるSageMakerに、GPUインスタンスの有効活用によってパフォーマンスを2倍に向上させる新しいトレーニングコンパイラが追加されました。また、SageMaker Studio Canvasは、SageMakerモデルを構築するためのコード不要のドラッグアンドドロップ環境です。Sivasubramanian氏は、これをスプレッドシートの数値を使って予測を立てる代わりに使えるツールと位置付けています。さらに、SageMakerのサーバーレス推論ツールも提供されており、ユーザーはコンピューティングリソースをプロビジョニングすることなくモデルをデプロイできます。
暗号通貨のマイニングは禁止されています
SageMaker Studio Labは、オープンソースのJupiterLabをベースにした無料版のMLサービスです。プロジェクトは1つまで、ストレージは最大15GBに制限されています。ユーザーはCPUまたはGPUランタイムを選択し、最大12時間(CPU)または4時間(GPU)まで使用できます。ランタイムはセッションごとに終了しますが、ファイルは保持されます。可用性は保証されておらず、「暗号通貨のマイニングは禁止されています」。サポートはコミュニティのみで提供されます。
SageMaker Ground Truth Plusと呼ばれるサービスは、実際の人間を巻き込み、AWSが顧客のデータにラベルを付ける専門家を雇用してモデルを構築することを約束しています。「例えば、放射線画像に医療専門家によるラベル付けが必要な場合は、Ground Truth Plusに提供するガイドラインにその旨を指定できます。すると、サービスは放射線科の訓練を受けたラベル付け担当者を自動的に選抜し、データのラベル付けを行います」と本日の投稿には記されています。
いくらかかるのでしょうか?ご想像のとおり、お申し込み後、「AWSエキスパートチームがデータラベリングプロジェクトについてご相談するための電話相談をスケジュールいたします」とのことです。既存のGround Truthサービスでは、データのラベリングに「Mechanical Turk、サードパーティベンダー、またはお客様独自の人材」を活用するオプションが提供されていましたが、新サービスではAWS自身がこの重要なタスクを担います。
Sivasubramanian氏は、AWSエンタープライズ検索サービスであるKendraの新機能も発表しました。Kendraのユーザーインターフェース構築に苦労されていたお客様が多いようですが、Experience Builderを使えば、コードなしで数回クリックするだけでUIを構築できるようになります。
さらに、Search AnalyticsはKendraの使用状況に関するデータを提供し、Custom Document Enrichmentは、自動分類、画像からテキストへの変換、カスタムプロセスを用いたメタデータの追加など、ドキュメントの前処理を行います。データベースのAWSへの移行を容易にすることは、同社にとって明らかに有益なビジネスです。しかし、今回のイノベーションは、機械学習をよりアクセスしやすくすること、そしてデータラベル付けの専門家を提供することにまで至っています。®