データセンターの停止によるコストは増加し、100万ドルを超える障害が一般的になっている

Table of Contents

データセンターの停止によるコストは増加し、100万ドルを超える障害が一般的になっている

業界が多くの地域で新たな規制の導入を予想しているにもかかわらず、世界中のデータセンター事業者は持続可能性の要件への備えがほとんどできていません。一方、停電によるコストは増大し、エネルギー効率の向上は停滞しています。

これらの調査結果は、Uptime Institute の 2022 年グローバル データセンター調査から得られたもので、世界最大の IT 組織でインフラストラクチャの管理を担当する人々を含む、世界中のデータセンターの所有者と運営者の経験をまとめたものです。

レポートによると、より環境的に持続可能なフットプリントの創出は、多くの事業者が現在取り組んでいる大きな課題です。しかし、回答者の大多数(63%)が、今後5年以内に地域の当局がデータセンターに環境データの公開報告を義務付けると予想しているにもかかわらず、ほとんどの事業者は現在、主要な環境データ指標を追跡・報告していないことが明らかになりました。

ほとんどの事業者は重要な環境データを追跡・報告していない

Uptime Instituteによると、2020年以降、事業者にとって持続可能性はレジリエンス(回復力)に匹敵するほどの関心事となっています。しかし、回答者の85%がデータセンター全体の電力使用量を報告し、73%が電力使用効率(PUE)などの効率指標を報告している一方で、二酸化炭素排出量に関するデータを収集していると回答したのはわずか37%、そして現在、水使用量を報告している回答者はわずか39%にとどまっています。

水はどうですか?

実際、水の使用を報告した回答者の数も昨年より減少しているが、アップタイム・インスティテュートは、これは水効率の重要性が低下したからではなく、最新の調査が前年よりも大規模で多様なサンプルを採ったためだと考えている。

水使用量を追跡していない事業​​者の多くは、ビジネス上の正当性がないため追跡を行っていないことを示唆しており、コスト、リスク、環境配慮の観点から、経営上の優先順位が低いことを示しています。これは、直接的な水消費を最小限に抑える設計でない限り、データセンターの開発を拒否する当局が増えているにもかかわらずです。これは、将来のデータセンター設計において重要な考慮事項となる可能性が高いでしょう。

そのため、Uptime Institute は、即時の法的要件の有無にかかわらず、すべてのオペレーターがデータセンターに関連するすべての炭素排出量を報告する計画を立て、水の消費量データも収集することを推奨しています。

その他の調査結果では、事業者は以前よりも混乱を招く停止の報告数が減少していることが示されています。しかし、現在では多くの障害が部分的または分散的に発生しており、状況は複雑です。

Uptime Instituteのデータによると、世界的に障害件数は年々増加しているものの、その頻度は世界のデータセンターの規模拡大ほど急速には伸びていません。つまり、容量あたりの故障率は実際には低下しているということです。レポートによると、2022年には調査対象となった事業者の60%が過去3年間に障害を経験しており、これは2021年の69%、2020年の78%から減少しています。

一部の停電の影響が減少している兆候も見られ、調査に参加した事業者の 66% が、過去 3 年間に経験した停電による最大の影響は最小限または無視できる程度だったと述べています。

しかし、深刻な障害は減少している一方で、発生した場合のコストは増大しています。回答者の4分の1は、直近の障害による直接コストと間接コストの両方で100万ドル以上のコストがかかったと回答しています。これは2021年から大幅に増加しており、Uptime Instituteによると、明確な傾向が続いています。さらに45%が、直近の障害によるコストが10万ドルから100万ドルの間だったと回答しています。

100万ドル以上の損害をもたらす停電が増加している

障害コストが増大する理由の一つは、組織の日常業務におけるデジタルサービスとデータセンターへの依存度の高まりです。その他の要因としては、インフレ、罰金、サービスレベル契約違反、人件費、出張費、機器交換費用などが挙げられます。

  • Twitterデータセンター、レイバーデーの猛暑で崩壊
  • GoogleとOracleのデータセンターの熱中症から学ぶべき教訓
  • 災害に強いアプリの導入は思ったより簡単かもしれません
  • インテルがGRCで液浸冷却を深掘り

電力問題

以前のデータセンター調査レポートと同様に、オンサイト電力の問題は、重大なサイト停止の最大の原因として特定されています。その他の一般的な原因としては、冷却装置の故障、ITシステム/ソフトウェアのエラー、ネットワークの問題が挙げられます。

アップタイム研究所は、同社が発表した他の調査によると、電力関連の停電の主な原因は無停電電源装置の故障であり、送電網からバックアップ電源への切り替え機構の故障や発電機の故障はどちらもそれほど一般的ではないことが示されていると主張している。

電力網の障害は停電の主な原因とはされていないが、報告書では、近年電力関連の障害がわずかに増加していることが、一部地域で電力網の信頼性が低下していることと関連している可能性があると述べている。

レポートでは、PUE の改善は 2014 年以降実質的に停滞しているものの、Uptime Institute が 2007 年に追跡を開始して以来大幅に向上していることも明らかになりました。回答者が報告した 2022 年の年間平均 PUE は 1.55 で、これは一般的なデータセンターが、IT 機器で消費されるエネルギーの 55% を冷却、配電、その他の二次機能に費やしていることを意味します。

PUEの進歩は停滞している

しかし、2007年から2014年にかけての急速な進歩は、温風/冷風の封じ込め、冷却制御の最適化、給気温度の上昇といった低コストの効率化策の導入を反映していると報告書は述べている。これらの対策を超える効率向上は、多くの古いデータセンターでは経済的にも技術的にも実現不可能だった可能性がある。

調査では、データセンターでは新しい施設でも依然として空冷が主流であることが明らかになりましたが、今後登場するサーバー プロセッサの熱電力要件が高くなり、さらなる改善が行われる前に業界平均 PUE が上昇する可能性があるなど、直接液体冷却などの技術の採用が広がる要因が現在作用しています。

これを裏付けるように、レポートでは、ラック電力密度がデータセンター分野全体で上昇していると見積もっており、5MWを超える容量の施設を運営する組織の40%が、密度が急速に増加していると述べています。

Uptime Instituteによると、10MW以上の大規模施設では、約半数が20kWを超えるキャビネットを保有しており、5施設に1施設は40kWを超えるラックを運用しています。70kWを超えるキャビネットを保有するデータセンターは、現在では少数ながら増加傾向にあり、そのほとんどは大規模施設に集中しています。

サーバーの寿命も延びており、ベンダー推奨の3~5年を超えるケースも少なくありません。レポートによると、2015年にはサーバーを5年以上稼働させている回答者はわずか34%でしたが、2022年には52%に増加しています。

半導体の供給不足が一因として挙げられており、一部のITハードウェアの納期が延びています。しかし、大手クラウド事業者のほとんどは、コスト削減のため、少なくとも一部のサーバーの寿命を延ばしたと既に報告しています。®

Discover More