本日、us-east1 リージョンの Google Cloud サーバーを接続する光ファイバー ケーブルが物理的に断線し、外部との接続が遅くなったり、事実上切断されたりしました。
少なくとも過去9時間、そして現在もなお、ネットユーザーやアプリケーションは、アメリカ東海岸にあるこの地域でホストされているシステムやサービスへの接続に苦労している。シリコンバレーの巨大企業が導入した緩和策の中、開発者やシステム管理者は、アプリやウェブサイトの動作を維持するために、ワークロードを他の地域に移行するか、トラフィックをリダイレクトせざるを得ない状況に置かれている。
Googleによると、本日午前7時55分PDT(協定世界時午後1時55分)より、この検索大手は「us-east1ゾーン全体で外部接続が失われており、us-east1と他のリージョン間のトラフィックは約10%の損失が発生している」という。
502エラーが発生し、Cloudflareもその1つです。El Regの読書を30分近く中断する障害が発生しました。
続きを読む
午前9時(太平洋夏時間)までに、Googleは障害の規模を明らかにした。同社のクラウドプラットフォームは「us-east1ゾーン内の複数の独立した光ファイバーリンクが切断された」という。光ファイバープロバイダーは「通知を受けており、現在問題を調査中。サービスを復旧するため、ネットワークの使用量を減らし、お客様のワークロードを優先しています」と伝えられている。
私たちが理解しているところによると、Google は、データセンター地域でホストされている Google.com サービス宛のトラフィックを他の場所にリダイレクトし、残りの接続で顧客のパケットを伝送できるようにしたということです。
太平洋時間の正午までに、Googleはステータスページを更新し、「現在、エンジニアリングチームがus-east1のGoogle Cloud NetworkingとLoad Balancingの問題に対処するための緩和作業を進めています。エラー率は減少していますが、一部のユーザーは依然としてレイテンシの増加に気付く可能性があります。」と発表しました。
しかし、本稿執筆時点では、物理的に損傷したケーブルはまだ完全には修復されておらず、US-east1のネットワークは依然として不安定な状態です。実際、修復には最大24時間かかる可能性があります。太平洋夏時間16時(太平洋夏時間)に投稿された最新のアップデートでは、以下の通りです。
Google Cloudのロードバランシングサービスを利用しているお客様は、設定次第で自動的に他のリージョンにフォールオーバーし、ワークロードへの影響を最小限に抑えられるとされています。また、例えばUS-east4への移行も可能ですが、新しいリージョンを参照するためにコードやスクリプトを修正する必要があるかもしれません。
レジスター紙はGoogleに対し、光ファイバーの損傷について、その発生経緯などの詳細を尋ねた。広報担当者は、前述のステータスページに掲載されていた内容を正確に説明した。
一方、Google Cloudの加入者が、ピンク・フロイドの「アナザー・ブリック・イン・ザ・ウォール」のメロディーに乗せて、今回の障害について短い歌を投稿しました。歌は「クラウドコンピューティングなんて必要ない…」で始まります。