クラウドベースのストレージおよびバックアップ プロバイダーである Backblaze は、ソリッド ステート ドライブ (SSD) から収集された使用状況データに関する最新のレポートを公開し、SSD がハード ドライブと同じ障害パターンを示すかどうかを尋ねています。
Backblaze は、クラウド ストレージ プラットフォームのサーバー インフラストラクチャで SSD をブート ドライブとして使用し、データの保存と提供には通常、大容量の回転ドライブが使用されます。
しかし、ブートドライブはストレージサーバーを起動するだけでなく、各サーバーが生成するログファイルや一時ファイルも保持します。そのため、ブートドライブが読み書きするデータの量は、ストレージサーバー自体の動作に依存します。
同社は以前、自社の SSD は少なくともハードドライブと同程度の信頼性があるようだと報告していたが、SSD のデータはハードドライブほど長期間収集されておらず、さらにデータが蓄積されれば統計が変わる可能性があるため、この状況が変わる可能性があると警告していた。
Backblazeは、2022年第4四半期末までの前回のSSDレポート以降、インフラストラクチャに238台のSSDを追加したと述べています。これらには、Crucialドライブ(モデル:CT250MX500SSD1)が110台、WDCドライブ(WD Blue SA510 2.5)が62台、Seagateドライブ(ZA250NM1000)が44台含まれています。
Backblaze は、2023 年第 1 四半期および第 2 四半期の数字を見ると、一部のドライブの年間故障率が非常に高いようだと指摘しています。たとえば、Seagate モデル SSDSCKKB240GZR の年間故障率 (AFR) は 800% を超えています。
これは、ドライブ数が少ないため、統計上の偶然の一致です。第1四半期にはこのモデルが2台しかなく、そのうち1台は設置後すぐに故障しました。第2四半期には残りのドライブに故障は発生しなかったため、この期間のAFRはゼロでした。
これらの数字は、Backblazeが計算されたAFRが合理的であるとみなされるには、特定のドライブモデルのインスタンスが少なくとも100個あり、特定の四半期に1万日以上のドライブ稼働が必要であるとBackblazeが考える理由を示していると、Backblazeのストレージクラウドエバンジェリスト、アンディ・クライン氏は述べている。
Backblazeは、AFRの推移を見ると、同社のSSD全体のAFRは2023年第1四半期に0.96%、第2四半期に1.05%だったと報告しています。この故障率は前四半期からは上昇していますが、前年同期からはわずかに低下しています。実際、過去3年間の四半期ごとのAFRのグラフを見ると、0.36%から1.72%の間で変動しており、明確なパターンは見られません。
しかし、Backblaze社は、2021年第1四半期のAFRが0.58%だったのが第2四半期には1.51%、第3四半期には1.72%に急上昇した主な原因が特定のドライブモデルであったなどの問題を明らかにできるため、四半期データは依然として重要であると述べています。
「特定のドライブモデルが私たちの環境と互換性がないことは時々あるので、そのドライブがシステム全体に及ぼす影響を軽減したり、場合によっては排除したりする」とクライン氏は語った。
Backblaze は今年初め、ハード ドライブのコレクション全体について故障が発生する平均期間を計算しており、この最新のレポートでは SSD についても計算を繰り返しています。
この調査には、同社がこれまでに故障した63台のSSDドライブのSMARTデータを収集する作業が含まれていましたが、クライン氏が認めているように、統計分析を行うにはデータセットのサイズが大きすぎました。このデータから算出された数値は14か月で、全ハードドライブの2年7か月と比較して大幅に減少しました。
しかし、Backblaze は、同社が運用している全 SSD の平均使用期間はわずか 25 か月であるため、この数字は実際の数字を反映していない可能性が高いと警告しています。
- このBackblazeレポートの作成中に壊れたすべてのドライブに黙祷を捧げます
- データセンターで液体冷却が普及するにつれ、幸運は勇敢な者に味方する
- 新しいSI接頭辞により、クエタバイト規模のストレージが実現
- はい、それは本当です。ハードドライブの故障はディスクの古くなるにつれて増加します。
同社が相当量のデータを保有している 3 つのドライブ モデルを調べたところ、Klein 氏は、稼働中のドライブの平均使用年数が増加するにつれて、故障したドライブの平均使用年数も増加することを発見しました。そのため、SSD 故障の平均使用年数も時間の経過とともに増加すると予想するのは妥当です。
Backblaze は、同社の全 SSD の生涯年間故障率について、2018 年第 4 四半期から 2023 年第 2 四半期末までの期間で 0.9% という数値を報告している。この数値は、2022 年第 4 四半期末の 0.89% からはわずかに増加しているが、1 年前の同じ四半期の 1.08% からは減少している。
ただし、計算の信頼性を高めるのに十分なデータがないため、明らかな故障率が高いドライブも含まれます。
計算を、稼働ユニットが 100 台あり、運転日数が 10,000 日を超え、最低値と最高値の間の信頼区間が 1 パーセント以下であるドライブ モデルのみに限定すると、データは 3 つのドライブと 0.6 パーセントの AFR に削減されます。
一方、Backblaze は、ハード ドライブの比較グラフと同様に、信頼性エンジニアリングで使用される従来のバスタブ曲線とデータがどの程度一致するかを確認するために、SSD 障害の経時的なグラフも作成しました。
Klein 氏によると、四半期ごとの SSD 障害を示す実際の曲線 (青い線) は少し「凹凸」があるものの、トレンド ライン (赤) は「明確なバスタブ曲線の外観」を呈しているとのこと。
傾向線は実際のデータと約 70 パーセント一致しているため、Backblaze では現時点では完全に確信することはできないと述べていますが、入手可能なデータの量が限られていることから、SSD 障害の発生は実証済みのバスタブ曲線に従う傾向にあると思われます。
これまでと同様に、Backblaze はレポートで使用した生データを Drive Stats Data ページで公開しており、誰でもダウンロードして分析することができます。ただし、データを使用する場合は、ソースとして Backblaze を明記し、データを販売しないことが条件となります。®