どのデータ センター トポロジが優れているかは、難解で、悩ましい、そして重要な問題です。結局のところ、クラウド ユーザーがテーブルやモニター、キーボードなどを叩きながら知っているように、停止が些細なことと見なされる時代はとうに過ぎ去っています。
フランスとブラジルの研究者は、スイッチかデータリンクのどちらで障害が発生すると予想されるかが重要な問題だと考えている。
Arxiv のこの論文では、リオデジャネイロ連邦大学の Rodrigo de Souza Couto 率いる研究者らが、従来の 3 層、Fat-Tree、DCell、BCube アーキテクチャが問題発生時にどのように動作するか (従来の 3 層エッジ/集約/コア モデルと比較) を比較しました。
この論文では、これら 3 つのトポロジが選択された理由は、モジュール式インフラストラクチャと低コストの機器を組み合わせた最新のデータ センター設計向けに設計されているという共通点があるためだと説明されています。
彼らの結論は、リンクに障害が発生した場合、BCube の方が回復が早いが、スイッチ全体が停止した場合は DCell の方が回復が早いというものです。
リンク障害の場合、BCube は「リンクの 40 % がダウンした場合でも、少なくとも 84 % のサーバーを維持します。DCell では 74 % です。これは、サーバー中心のネットワークである BCube が冗長サーバー インターフェイスを採用しているためです。」
一方、「DCell はスイッチ障害時で最高のパフォーマンスを発揮し、Bcube よりも最大 12 倍高い MTTF を達成できます」。これは、到達可能性を制御するのがスイッチではなくサーバーであるためです。
DCellアーキテクチャ: スイッチが故障しても問題なし
3 層モデルと Fat-Tree モデルは、サーバーからエッジへのパスが 1 つしか提供されないため、採用されませんでした。リンクまたはスイッチのいずれかに障害が発生すると、サーバーにアクセスできなくなります。
BCube モデルは最も耐久性が高いが、配線とスイッチが最も多く必要だと著者らは書いている。
多数のリンクにより、1 つのリンクが故障しても BCube は動作し続けます
失敗の種類 | 基準 | 3層 | ファットツリー | Bキューブ | DCell |
---|---|---|---|---|---|
リンク | 到達可能性 | 悪い | 貧しい | 良い | 公平 |
パス品質 | 素晴らしい | 素晴らしい | 良い | 公平 | |
スイッチ | 到達可能性 | 悪い | 貧しい | 良い | 素晴らしい |
パス品質 | 素晴らしい | 素晴らしい | 素晴らしい | 良い | |
サーバ | 到達可能性 | 素晴らしい | 素晴らしい | 素晴らしい | 素晴らしい |
パス品質 | 素晴らしい | 素晴らしい | 素晴らしい | 良い |
論文全文はこちらをご覧ください。®