クラウド ストレージおよびバックアップ プロバイダーの Backblaze は、最新のドライブ統計レポートを公開し、ドライブの温度データと各データセンターの障害率の追跡を紹介しました。
クラウドベースのストレージ サービスに重点を置く Backblaze は、管理下にある一連のストレージ デバイスの健全性と状態に関するレポートを定期的に発行し、ドライブの動作に関する有用な情報を提供しています。
暦年第 3 四半期のドライブ統計レポートでは、同社がドライブの温度データを調べ、少数のデバイスが少なくとも 1 日間はメーカーの最大レベルを超えていたことを発見しました。
Backblazeによると、ほとんどのドライブの推奨最高温度は60℃(140°F)ですが、同社が運用する12TB、14TB、16TBの東芝製ドライブは例外で、最高温度は55℃(131°F)です。この温度を超えたドライブはごくわずかで、第3四半期に稼働していた259,533台のデータドライブのうち354台、つまり約0.0013%でした。
354台のうち、2台のドライブが故障しました。どちらも4TBのSeagate製(ST4000DM000)です。これはほんのわずかな数字であり、データセンターの運用においては温度変動は日常茶飯事です。しかしBackblaze社は、エンジニアが地球温暖化への対応を確実にするため、根本原因を調査中であると述べています。
第4四半期以降、Backblazeは、温度超過した他の352台のドライブを、通常のDrive Statsの年間故障率(AFR)計算から除外し、「Hot Drives」と呼ばれる別のドライブコホートを作成して追跡します。これにより、Backblazeはメーカーの仕様範囲内で動作する他のドライブと故障率を比較できるようになります。
現在、Hot Drives コホートに含まれるドライブの数は限られているが、高温にさらされるとドライブが故障しやすくなるかどうかについて、ある程度の洞察が得られる可能性があると Backblaze は述べている。
今四半期(Q3)では、Backblazeが公開するドライブ統計データに3つの新しいデータフィールドが追加されました。1つはドライブが設置されているBackblazeデータセンター、もう1つはドライブが属するストレージサーバーグループのクラスタID、そして3つ目はドライブが取り付けられているストレージサーバー内の物理的な位置(スロット)です。
これらのデータセンターは、サクラメント (カリフォルニア州)、フェニックス (アリゾナ州)、レストン (バージニア州)、アムステルダム (オランダ) にあり、ams5、iad1、phx1、sac0、sac2 という値で識別されます。
クリックして拡大
Backblazeによると、sac0は全データセンターの中で最もAFRが高いものの、最も古いドライブを搭載しており、平均するとsac2の次点の2倍近くも古いドライブを搭載しています。また、sac0には最も古いストレージポッドがいくつか搭載されており、その中には45ドライブユニットもいくつか含まれており、Backblazeは現在これらのユニットの交換を進めているとのことで、これも要因の一つと考えられます。
Backblazeは、このデータは第3四半期のみを対象としており、モデルごとに60台未満のドライブで構成されるものも含め、すべてのデータドライブが含まれていることを警告しています。同社は、今後このデータを追跡することで、データセンターごとにドライブの故障率が本当に異なるのか、また異なる場合はその理由について、何らかの知見を得たいと述べています。
レポートの残りの部分については、2023年第3四半期末に追跡されていたBackblazeのストレージインフラストラクチャのデータドライブが対象となっています。合計263,992台のドライブを監視しており、そのうち4,459台はブートドライブとして使用され、さらに449台はさまざまな理由で除外されているため、32種類のモデルで構成される259,084台のハードドライブが残ります。
Backblaze 社によると、今四半期の全ドライブの AFR は 1.47% で、前四半期の 2.2%、1 年前の 1.65% から低下したという。
- GoogleとOracleのデータセンターの熱中症から学ぶべき教訓
- Google:ロンドンの熱波からデータセンターを守るため、閉鎖せざるを得なかった
- 欧州は、より多くの都市でデータセンターの廃熱を利用することを望んでいます。現状はどうですか?
- クラウドの新興企業は、エッジサーバーをホストする場合、無料のヒートマップを提供する
- SSDの故障はバスタブ曲線に従うのか?Backblazeに聞く
Backblaze社は、第2四半期の2.2%の減少は、ドライブ群全体の老朽化、特に8TB、10TB、12TBドライブの一部モデルが数値を押し上げたためだと説明しました。同社は現在、第2四半期は異常な現象であったと考えています。なぜなら、問題となっている8TB、10TB、12TBドライブモデルを含む、大半のドライブモデルでAFRが低下したからです。
第 3 四半期には、6 つの異なるドライブ モデルでドライブ障害がゼロになりましたが、そのうち 6TB Seagate ドライブ (ST6000DX000) のみが、平均 101 か月の動作期間で 50,000 日を超えるドライブ動作を記録しました。
データには、Western Digital 22TB ドライブ (WUH722222ALE6L4) の結果も含まれていますが、これらは 9 月にインストールされた 1,200 台のドライブの Backblaze Vault 内にあるため、このレポートでは各ドライブの稼働日が 1 日のみで、障害は 0 件です。
これまで通り、Backblaze はデータセットを自社の Web サイトで公開しており、Backblaze をソースとして引用し、データを販売しないことを条件に、無料でダウンロードして分析することができます。®