マイクロソフトは、火曜日に多数の Azure クラウド サービスと Visual Studio Teams サービスがオフラインになった大規模な障害の原因を悪天候のせいだとしている。
Windowsの巨人である同社は、テキサス州にある米国中南部の施設が、激しい嵐と落雷によって冷却装置に過負荷がかかり、サーバーなどのマシンがシャットダウンを余儀なくされたことを明らかにした。つまり、施設は電力サージに見舞われ、コンピューターの電源を切るかコンピューターを溶かしてしまうかの選択を迫られたため、緊急事態の中、電源プラグが抜かれ、施設はオフラインにされたのだ。
マイクロソフトは落雷について、「米国中南部のデータセンターの近くで落雷を含む悪天候が発生した」と述べた。
その結果、電圧が上昇し、冷却システムに影響が出ました。データとハードウェアの整合性を確保するためのデータセンターの自動手順が発動し、重要なハードウェアは構造化された電源オフプロセスに入りました。
カテゴリー1のハリケーン・ゴードンがアメリカのメキシコ湾岸を脅かす中、激しい嵐がテキサスに押し寄せています。まるで本物の雲が偽物の雲にぶつかっているかのようです。
このシャットダウンにより、テキサス州の施設でホストされていたサービス、データベース、仮想マシンが停止しただけでなく、UTC 9:30頃からAzure Active Directoryサービスも停止しました。その結果、ヨーロッパ、米国、そして世界中のAzureサービスユーザー、特にVisual Studio Team Servicesを使用しているユーザーが一日中悩まされる問題が発生しました。
Azureは、バックアップを最大10年間安全かつ確実に保管することを約束します
続きを読む
Visual Studio チーム サービス グループは、今回の障害について、「米国中南部地域以外の組織の顧客も、内部インフラの依存関係により、CI/CD ワークフローやダッシュボードに影響が出ている可能性があります」と述べています。
マイクロソフトは現在、施設をオンラインに戻し、可能な限り多くのマシンを復旧させるべく取り組んでいると述べているが、本稿執筆時点では多数のサービスがオフラインのままとなっている。
マイクロソフトは、「エンジニアはデータセンターへの電力供給を正常に復旧しました。さらに、エンジニアは影響を受けたネットワークデバイスの大部分を復旧しました」と述べています。
「一部のサービスでは回復の兆しが見え始めていますが、緩和に向けた取り組みはまだ続いています。」
レドモンドは本日(米国太平洋時間)午後に、回復状況に関するさらなる最新情報を提供する予定です。®