誰だ、私?月曜日がやってきた。管理者はイベントログを探しに、エンジニアはコートハンガーに手を伸ばして、またしても「誰だ、私?」という話が飛び込んできた。そう、誰だ、私?
「ジョン」というのは彼の名前ではないが、1990年代末に今は亡き巨大IT企業で働いていた。
大型ハードウェアに頼って計算処理をしていた人々にとって幸運なことに、ジョンの仕事はより現実的なハードウェアに関わるものでした。当時、Novell Netwareはまだ大きな存在でしたが、複数のサーバーでは新興のWindows NT 3.51オペレーティングシステムが稼働していました。Windows NT 4もデータセンターに徐々に浸透し始めており、ジョンの仕事の一つは機器の運搬でした。
問題の日のことを思い出しながら、ジョンはこう語った。「サーバーを積んだ台車をサーバー室から運び出していたときのことでした。」
おそらく十分な注意を払っていなかったジョンは、サーバールームのドアに向かって後ずさりし、そのとき避けられない出来事が起こった。
「スクラムボタンにバックで突っ込んだんです。」
「ビッグ・バッド・ボタン」の名称の由来は、はっきりと特定するのが難しい。制御棒を挿入して緊急原子炉を停止させる行為に由来すると主張する人もいる。伝説によると、初期の原子炉の一つでは、万が一の事態に備えて制御棒を原子炉の燃料デブリに落とすためにロープを切断する必要があったという。この切断を担当した人物は「安全制御棒斧男(SCRAM)」、あるいは「スクラム(SCRAM)」と呼ばれていた。
したがって、「スクラム」ボタンです。
米国原子力規制委員会(NRC)は、はるかに納得のいく説明をしている。あの大きな赤いボタンを押した後、次に何をするのか?「ここから逃げろ」と。
村を救うためにダムに指を突っ込んだオランダの少年を覚えていますか?IT版でも同じです
続きを読む
ジョンの場合、ボタンを押した途端、部屋全体の電源が切れてしまった。マークのように尻をスイッチに押し付けたまま逃げ出す術はなかった。サーバーの照明は消えていた。
「何十台ものサーバーの電源が落ち、部屋全体が不気味なほど静かになりました」と彼は語った。
スクラムボタンは(安全上の理由から)簡単にアクセスできましたが、サーバー自体はアクセスできませんでした。ラックのドアはしっかりと施錠されており、もちろんジョンは全ての鍵を手元に持っていませんでした。電源スイッチにアクセスできず、サーバーを再び起動することもできませんでした。
どうすればいいだろうか?午前6時だった。謙虚な請負業者であるジョンは、自分の悪行に対して、とてつもない非難を浴びることになるだろうと覚悟していた。
彼はキャビネットのドアのメッシュに指を突っ込むことはできなかったが、おそらく何か他の方法でうまくいくだろう。
ジョンは警備員から「借りた」まっすぐなコートハンガーを 1 本取り、ワイヤーをドアに差し込んで慎重にサーバーを起動した。
「すべてを元に戻して作動させるのに約2時間かかりました」と彼は語った。一部のボックスが間違った順序で起動したため、「釣り竿で電源ボタンを長押しして再起動する必要がありました」
驚くべきことに、誰もその障害に気づいていなかったようだ。「ログはいくつか確認されました」とジョンは言う。「しかし、システムは複数のグループ(テスト、開発、本番、企業など)が所有していたため、部屋全体がダウンしたことに気づいた人は誰もいなかったのです。」
企業コミュニケーションは素晴らしいですね。
「ラックは施錠されていたので、鍵を持った誰かが犯行に及んだと推測される」
ジョンは鍵を持っていなかったが、こう付け加えた。「私が救われたのは、当時は中央時刻同期がなかったため、ログには再起動の時刻がすべて異なっていたという事実がほぼ確実です。」
「しばらくして、電源ボタンのいくつかに目立った傷があることに気付きました...」
20年経った今でも、電源ボタン釣りの思い出はジョンに「ラックのドアがロックされているのを見ると冷や汗が出る」という。
サーバー ルームで釣りをしたり、特攻野郎 A チームを喜ばせるマクガイバー風の解決法で自ら招いた問題に対処したりした経験はありますか?
もちろん、あなたはその創意工夫を Who, Me? ® の親切なハゲタカたちと共有すべきです。