インターネットバックボーン事業者の CenturyLink で障害が発生し、世界中の大手ウェブ企業のパフォーマンスが低下しました。
CenturyLink は障害を認め、このインシデントに関する基本情報を公開しました。
弊社の技術者は、IP障害の解決に取り組んでいます。サービスの信頼性確保は最優先事項です。進捗状況については、定期的にご報告いたします。
— センチュリーリンク(@CenturyLink)2020年8月30日
IP障害の復旧に全力で取り組んでおり、複数の地域で復旧の兆しが見え始めています。可能な限り速やかに障害を解消するため、あらゆるリソースを投入しており、今後も最新情報を随時提供していきます。
— センチュリーリンク(@CenturyLink)2020年8月30日
本日のIP障害により影響を受けたすべてのサービスは復旧いたしました。これらのサービスはお客様にとって非常に重要であると認識しており、今回の障害による影響について心よりお詫び申し上げます。
— センチュリーリンク(@CenturyLink)2020年8月30日
CloudFlareはさらに詳しい情報を提供し、この障害はCenturyLinkが2017年に買収したL3インフラに影響を及ぼし、少なくとも48都市で影響があったと説明した。
原因としてはボーダーゲートウェイプロトコル(BGP)が示唆されている。CloudFlareの投稿には、「UTC 10:04から、大量のBGPアップデートが発生しました」と記載されている。「通常、インターネットでは15分ごとに約1.5MB~2MBのBGPアップデートが行われます。インシデント発生当初、BGPアップデートの数は15分あたり26MB以上に急増し、インシデント発生中も高い状態が続きました。」
指の太いレベル3技術者がインターネットをレベル0に落とす:グリッチで接続が切断される
続きを読む
CloudFlare は、不適切な Flowspec ルールがインシデントの原因であり、BGP の伝播を妨げ、BGP トラフィックの増加につながった可能性があると推測しています。
原因が何であれ、このインシデントにより、CloudFlare は一時的に最高の状態ではなくなっており、Discord、Twitter、Xbox Live、PlayStation Network、Amazon など、一部の大手顧客も同様に最善の状態ではなくなった。
しかし、 The Registerは影響を受けた多くの拠点から障害報告を見つけることができていないため、L3への代替ルートが対応に時間がかかった可能性が示唆されています。CenturyLinkのみに依存している企業の状況はさらに悪化しましたが、少なくとも週の比較的閑散とした時間帯には対応できました。®