Amazon Web Services は、クラウド専用に構築されていないテクノロジーにうんざりしており、現在ゼロから構築しているものがユーザーにとってもより魅力的なものになることを期待しています。
これは、クラウドの巨人による長期にわたる re:invent カンファレンスの今日の「インフラストラクチャ基調講演」からThe Registerが得た情報です。この基調講演では、グローバル インフラストラクチャ リーダーシップ担当副社長のピーター デサンティス氏が、AWS がどのように運営を続けているのかについて少し語りました。
彼が明らかにした重要な情報の一つは、AWSが独自の無停電電源装置(UPS)を設計し、現在では各ラックに1台ずつ設置しているという点でした。AWSがこのアプローチを選んだのは、必要なUPSシステムが非常に大規模で、機器の稼働を維持するために必要な大量の鉛蓄電池を扱うための専用室が必要だったためです。この設備の維持管理の必要性はリスクを高め、故障や災害発生時の「爆発半径」、つまりインシデントの影響範囲を拡大する要因となりました。
AmazonのクラウドMacは1日25.99ドル。77日間使えばMacが買える
続きを読む
AWS は爆発半径が小さいことがすべてだとデサンティス氏は説明し、そのため同社は過去にサードパーティ製品向けに独自の UPS ファームウェアを作成した。
「自社のインフラに自社が所有していないソフトウェアが存在するのはリスクだ」とデサンティス氏は述べ、デバイスのファームウェア問題をベンダーに通知すると、問題の再現を試みるプロセスが開始され、続いて修正プログラムが開発され、展開されるというシナリオを説明した。
「問題の解決には1年かかることもあります」と彼は言った。バグが顧客のダウンタイムにつながる可能性があることを考えると、AWSにとってこれは何ヶ月も遅すぎる。
このアプローチにより、AWS は停電の際に主電源から UPS に切り替える装置であるスイッチギアを管理する独自のソフトウェアも設計しました。
Amazon の自社開発 Arm プロセッサ Graviton2 も同様の理由で開発されました。
インフラ内に所有していないソフトウェアはリスクとなる
デサンティス氏は、市販のUPSや配電装置がアマゾンのニーズを満たさない理由は、それらがアマゾンの要件ではなく、様々な使用シナリオを想定して設計されているからだと述べた。CPUの開発にも同じ論理が当てはまり、インテルやAMDのような企業は、汎用デバイスにすることで売れる製品を設計していると彼は主張した。
その結果、プロセッサはより多くのタスクに対応できるよう機能を詰め込むようになりました。純粋なパワーが求められる時代は、マルチコアCPUが答えでした。CPUの使用率が問題になると、同時マルチスレッドが登場しました。これらの技術はどれもCPUの主流から外れることはなく、その結果、サイドチャネル攻撃を受けやすく、パフォーマンスが不安定なアーキテクチャになっているとデサンティス氏は主張しました。デサンティス氏は、HPCユーザーがSMTを無効にするのは、後者の問題を回避するためだと考えています。
AWSはクラウド向けに設計されたプロセッサを好みます。そのため、Graviton、つまりメニーコアアーキテクチャと大容量キャッシュに投資しています。これらのアーキテクチャは、他の工夫を必要とせずにコアあたりのパフォーマンスを向上させることができるからです。このアーキテクチャは、AWSがソフトウェア開発の主流と見なしているマイクロサービス向けに、根本から設計されています。
「Graviton 2は、当社のクラウド内の他のどのCPUよりも2.5~3倍優れたワット当たりのパフォーマンスを実現します」とデサンティス氏は述べています。
同氏はThe Registerとの会話の中で、このようなパフォーマンスは、クラウドの巨人が仮想化とネットワークの雑用をオフロードするAWSのNitroシリコンのおかげでのみ可能になったと付け加えた。
デサンティス氏はThe Registerに対し、 Nitroデバイスの内部構造について語るのを拒んだが、同社が現在使用しているデバイスは第4世代であり、これをSmartNICと呼ぶのは正しくないと述べた。
「SmartNICはその機能のサブセットです」と彼は述べた。「私たちにとって非常に特化したハードウェアであり、AWS向けに深く構築されています。デサンティス氏は、「論理的には類似点もありますが、より特化しています」と認めた。
そして基調講演で彼はデバイスの 1 つを紹介し、それが Thunderbolt 経由で AWS の新しい Mac インスタンスに接続されると述べました。
左下にあるAWS Nitroカード。クリックして拡大
デサンティス氏の講演の大部分は、AWSの環境への配慮(同社は最近、再生可能エネルギーのスタックを新たに発注したばかり)と、クラウドのライバル企業がアベイラビリティゾーンの物理的な分離を説明する際に用いる言葉遣いに対する、あまり遠慮のない批判に費やされた。AWSは、自社のデータセンターが災害に耐えうる距離に設置されているものの、遅延は1ミリ秒未満であることを明言している、と彼は述べた。
これは、クラウド アプリに必要な構成である、安全を確保するための十分な距離がありながら、ステートレス アプリが苦労するほどネットワークに問題がない構成だと彼は述べています。
デサンティス氏はまた、AWS が新たに発表したオーストラリア第 2 リージョンの計画についても語った。®