英国が記録的な猛暑に見舞われているため、冷却の問題でGoogleとOracleが英国でホストするクラウドサービスとサーバーがオフラインになっている。
イングランド東部で気温が40.3℃(華氏104.5度)に達し、このような気温に慣れていない国としては史上最高気温を記録したため、データセンターは熱に耐えられなくなりました。長期的なダメージを避けるため、一部のマシンの電源がオフにされ、一部のリソース、サービス、仮想マシンが利用できなくなり、ウェブサイトなどがダウンする事態に陥りました。
Oracle Cloud Infrastructureの複数のリソースがオフラインになっています。これには、英国南部のサーバーが提供するネットワーク、ストレージ、コンピューティングが含まれます。Team Oracleのステータスアップデートによると、冷却システムに問題があり、技術者はハードウェアの焼損を防ぐために機器の電源を切ったとのことです。
オラクルは火曜日のUTC16時38分に、「この地域における季節外れの気温の影響により、英国南部(ロンドン)データセンター内の冷却インフラの一部に問題が発生しました」と発表した。「その結果、一部のお客様は、この地域でホストされているOracle Cloud Infrastructureのリソースにアクセスできない、または利用できない可能性があります。」
関係するサービスチームが関与し、影響を受けたインフラを正常な状態に戻す作業を進めておりますが、予防措置として、さらなるハードウェア障害の発生を防ぐため、安全に電源を切断できるサービスインフラを特定中です。この措置は、お客様への長期的な影響を最小限に抑えることを目的としています。
英国時間の昼頃、Oracle の冷却インフラの少なくとも一部が故障したと伝えられています。
液体冷却に関する5つの疑問にお答えします
続きを読む
気温に関連した障害を報告しているIT大手はオラクルだけではない。Google Cloudは、ロンドンの施設の一つであるeurope-west2-aにあるシステムからサービス提供されている複数の製品において、「エラー率の上昇、遅延、またはサービス利用不能」が発生していると発表した。
これらの問題は、BigQuery、SQL、Kubernetesなど、ストレージとコンピューティングに関連する様々なサービスに影響を与えています。GoogleはUTC 16:15にダウンタイムを確認しました。この障害により、英国のWP EngineでホスティングされていたGoogle Cloudを利用したWordPressウェブサイトがダウンしました。
Googleの別の勧告によると、「europe-west2リージョンのeurope-west2-aゾーンをホストする当社の建物の1つで、冷却関連の障害が発生しました」とのことだ。
これにより、該当ゾーンの容量に部分的な障害が発生し、VMの停止と一部のお客様のマシンの損失が発生しました。現在、冷却システムの復旧と該当ゾーンの容量確保に全力で取り組んでいます。europe-west2-aゾーンへのさらなる影響は予想されておらず、現在稼働中のVMにも影響は及ばない見込みです。
マシンへの損傷と長時間の停止を防ぐため、ゾーンの一部の電源を切断し、GCEプリエンプティブの起動を制限しています。新たに起動したPersistent Diskボリュームの一部に地域的な影響が出ており、影響を受けた複製Persistent Diskデバイスの冗長性の回復に取り組んでいます。
The RegisterはOracleとGoogleにさらなるコメントを求めた。
イングランド各地では異常気温の影響で火災が発生し、高速道路、鉄道、電力に影響が出ています。ルートン空港も滑走路の融解により一時閉鎖されています。その他のインターネットサービスにも影響が出ている場合はお知らせいたします。®
追加更新
ここでは、冷却関連の停止の影響を評価する続編を公開しました。