IBMは、昨日発生したクラウド全体の数時間にわたる障害について、第三者の責任を主張した。データ損失や攻撃は検知されていないとしているものの、依然として状況は芳しくない。大手クラウドは、本来であればこれよりも高い耐障害性を備えているはずだからだ。
IT 大手のクラウド ステータス ページに掲載された短い通知では、この故障について次のように説明されていました。
これはかなり曖昧な表現ですが、BGP(ボーダーゲートウェイプロトコル)の不注意なミスによってパケットが誤った宛先に送られた場合に発生する可能性のあるトラフィックフラッドの状況と一致しています。BGPのハイジャックや設定ミスは既知の問題であり、IBMのような企業であれば、こうしたエラーに警戒し、それを軽減するための防御策や対策を講じているはずです。
しかし、IBM はトラフィックの急増への対応があまり得意ではないようだ。オーストラリアの電子国勢調査を実施したとき、大量の着信接続を誤ってサービス拒否攻撃と認識し、事態を収拾するためにルーターの電源プラグを抜かなければならなかった。
IBM、Power 搭載の仮想プライベートクラウドと GPU アクセラレーション オプションの提供を終了
続きを読む
もう一つの可能性は、IBMのクラウドサプライヤーが何らかのミスを犯したというものです。IBMはコンテンツ配信ネットワークにAkamaiを使用し、Cloudflareをサービスとして提供し、AT&Tとも緊密な関係を築いていることが分かっています。The Registerはこれらの企業のいずれかが今回の障害に関与したとは示唆していませんが、いずれも世界的な障害に関与するのに十分な規模を持っています。
原因が何であれ、ハイパースケールクラウドは、このような予期せぬ事態に対処できるほどの回復力を備えているはずです。テクノロジーの巨人IBMがクラウド事業に転身したという事実は、安心できるものではありません。IBMのクラウドは競合他社のサービスに比べて運用が依然として劣っているため、この立場を維持するのは容易ではありません。®