Windows Azure コンピューティング クラウドが地球規模で TITSUP に

Table of Contents

Windows Azure コンピューティング クラウドが地球規模で TITSUP に

本日、マイクロソフトの Windows Azure クラウドが世界規模で部分的なコンピューティング障害に見舞われ、レドモンドがサービスをいかに効果的に分割していたかが疑問視されている。

同社のサービスダッシュボードによると、問題は協定世界時午前2時35分に発生し、同日午後10時20分(協定世界時)時点でまだ続いていた。

同社は「クラウド サービスでスワップ デプロイメント操作を手動で実行するとエラーが発生し、サービス管理機能が制限される可能性があります」と述べています。

すべての Azure リージョン (地理的に離れた独立したデータ センターのセット) が影響を受けましたが、後世のために言うと、これには米国西部、西ヨーロッパ、東南アジア、米国中南部、北ヨーロッパ、米国中北部、東アジア、米国東部が含まれます。

同社はUTC午後10時に、「影響を受けたホストサービスについて、このインシデントの影響を可能な限り速やかに軽減するために必要なすべての措置を講じています。状況の最新情報を2時間以内に公開し、お客様にお知らせいたします。お客様にはご不便をおかけしたことをお詫び申し上げます」と投稿した。

スワップ・デプロイメント操作により、開発者はサービスのステージング環境と本番環境間で仮想IPアドレスのスワップを開始できます。スワップ・デプロイメントは、Azure管理サービスと連携する非同期操作です。IaaSクラウドの主要コンポーネントではありませんが、サービス停止は一部のヘビーユーザーにとって煩わしいものであり、グローバルなサービス停止はMicrosoftの大規模サービス管理能力に対する信頼を損なう可能性があります。

WindowsAzureFail

ダッシュボードが壊れる...グローバル障害はクラウドにとって最悪の事態です

コンピューティングのサブコンポーネントへのグローバル障害に加えて、Azure クラウドの Web サイト機能でも、UTC 午後 7 時から始まった「FTP データ アクセス」に関するグローバル問題が報告されており、スワップ デプロイメントを停止させた問題の一部から連鎖的な障害が発生したことが示唆されています。

クラウド コンピューティングの対極にあるのは、すべての地域に同時に影響を及ぼす問題の発生ですが、マイクロソフトが世界規模で同時に失敗したのは、1 年以内に 2 度目となります。

前回の「死の青空」は、セキュリティ証明書の失効により、世界中のWindows Azureストレージサービスがダウンしたことが原因でした。今回はクラウドのはるかに小さなコンポーネントがダウンしましたが、それが世界中でダウンしたという事実は、Microsoftが導入した可能性のあるパーティショニングポリシーに対する厳しい非難です。®

Discover More