オンコール2021 年の 2 つ目のオンコールは、ピザとハッシュを混ぜないようにという警告です。
今日のお話は「ジョン」さんからのものです。彼は自らを「常に人員不足のITチームのマネージャー」と表現しています。多くの人がよくご存知の通り、彼は「IT部門のせい」と片付けられるような問題であれば、ほぼ全てにおいてエスカレーションの真っ最中でした。
問題の夜、ジョンは妻と友人たちとピザとビールを楽しむ準備をしていた。もちろん、せっかくの土曜日なので、彼の職場の電話が鳴った(周りの人たちはきっと大喜びだっただろう)。
「電話の相手は私のチームメンバーの1人で、VMware環境の問題で困惑し、私にアドバイスを求めて電話をかけてきたのです」と彼は説明した。
彼はログインして環境を調べ、vCenter への認証が「完全に壊れている」ことを発見しました。
小屋は一度建てたことがあるけど、データセンターってそんなに難しいものなの?
続きを読む
vCenterはVMwareセットアップの重要な部分です。管理者はこのユーティリティを使用して仮想マシンとESXiホストを管理します。vCenterが故障すれば、関係者全員にとって最悪の事態となります。
チームメンバーがタイムゾーンが遅いことに気づいたジョンは、彼を許し、問題の責任は自分で負うという賢明な判断を下しました。そもそも、そんなに難しいことではないはずです。
結局、それは非常に困難でした。時間が刻々と過ぎ、ジョンは妻と友人たちが楽しみにしていたピザとビールを楽しみに出かけ、置き去りにされてしまいました。彼は勇気を出して、ベンダーにPriority Oneケースを申請しました。
「慣例通り」彼はため息をついた。「サポート担当者は、私がすでに試したすべての手順を再試行するように指示しましたが、効果はありませんでした…」
Jon と彼の新しい友人は、vCenter を混乱させた原因を探すために、構成を細かく調べ始めましたが、何も見つかりませんでした。
ベンダーのサポート組織内で何度かエスカレーションが行われ、ようやく Jon は新しいテクニカル サポート担当者と話をすることができました。
新しい視点で問題がすぐに発見され、構成ファイルが公開されました。
「何が問題なんだ?」とジョンは尋ねた。
「これらのハッシュタグがすべて見えますか?」技術者は辛抱強く説明した。
「ハッシュタグ?何だこれ…?」
ようやく事態が理解できた。ジョンは説明した。「誰かがファイルのかなりの部分(当然ながら#記号付き)をコメントアウトしていたため、週末の定期メンテナンスの一環としてVirtual Centerサービスが再起動した際に認証が切断されてしまったのです。」
変更を元に戻すのに数分しかかからず、ジョンの組織は再び稼働しました。
その後、彼はチームにそのことを伝え、恥ずかしくなった同僚が名乗り出てその行為を告白した。
「彼と私は、重要なインフラシステムの変更に関する手順について、ちょっとしたレビューを行いました。」
間違いなく、錆びた釘がちりばめられた野球のバットの助けがあったのだろう。
では、彼の夜はどうなったのだろうか?ジョンは、蓄積された残業時間を自慢げに語る人たちを冷淡に見ている。「管理職には残業代は出ない。冷めたピザの残り物が1枚もらえるだけだ。」
しかし、輝く役職名とエンボス加工された名刺がそれを補っているに違いありません。
問題解決に苦労したのに、何時間もかけて解決できなかったことを、まるで自分が満足げな目で見ているかのように、一瞬で解決してしまった経験はありませんか?あるいは、パイナップルがトッピングされたピザを、On Callの電話が鳴っているふりをして避けた経験はありませんか?私たちは少なくとも一度は経験済みです。あなたも経験済みですか?ぜひ、On Callにメールであなたの体験談をお聞かせください。®