Google は 2015 年以降、ネットワーク容量を 1 ペタビット/秒超から 6 ペタビット/秒超に拡大しており、この成長の一部は、トラフィックをリダイレクトするためにミラーのアレイから光信号を反射するスイッチによるものです。
私たちの姉妹サイトであるThe Next Platformが 2015 年に報告したように、Google は自社のデータセンター ネットワーキング技術を Jupiter と呼んでいます。これは、市販のシリコンとカスタム コードを組み合わせて、検索、YouTube、Gmail、G クラウドなど、さまざまな機能を実行するキットを接続します。
火曜日、この広告大手は木星に関する過去10年ほどの研究を説明する論文と概要を発表した。
両文書の主な数字には、速度と容量が 5 倍向上し、設備投資が 30 パーセント削減され、消費電力が 41 パーセント削減されていることが記されています。
これらの改善の多くは、マイクロ電気機械システム (MEMS) に搭載されたミラーを使用して光ファイバーの入力ポートを出力ポートに動的にマッピングする光回路スイッチ (OCS) の結果です。
MEMSベース、あるいは非MEMSベースの光ミラースイッチングがコンピュータネットワークに長年利用されてきたことは周知の事実です。ここで注目すべきは、Googleが自社の地球規模の用途向けに開発し、その密度とスループットを文書化したことです。
まあ、とにかく、興味深いと思いました。
Googleのミラー搭載光スイッチがトラフィックを転送する仕組み…出典:Google。クリックして拡大
Googleのスイッチでは、信号は136本の物理I/Oパス(個々のファイバー)を備えた「ファイバーコリメータアレイ」に到達します。入力信号はこれらのファイバーの1本から出力され、スプリッターで反射した後、136個のマイクロミラーを備えたMEMSデバイスに到達します。MEMSデバイスは2次元的に移動して、出力コリメータアレイ内の136本のファイバーの1本に信号を反射します。
この技術が必要だったのは、Google が自社のネットワークを「『成長に合わせた支払い』モデルで異機種ネットワーク要素をサポートし、必要な場合にのみネットワーク要素を追加し、最新世代の技術を段階的にサポートする」ことを望んでいたためだ。
これは、「以前に導入されたものとは異なるテクノロジーであっても、ネットワーク容量を段階的に追加できるようにすることで、デバイスの全体にわたって比例した容量の増加とネイティブの相互運用性を実現できる」ことを意味します。
このビジョンを実現するのは簡単ではない。なぜなら、Google のデータセンター ネットワークは「建物全体の規模、おそらく 40MW 以上のインフラストラクチャ」で展開する必要があるからだ。
さらに、建物内に設置されたサーバーやストレージデバイスは常に進化しており、例えば40Gビット/秒から100Gビット/秒、そして200Gビット/秒、そして今日では400Gビット/秒のネイティブネットワーク相互接続へと移行しています。そのため、データセンターネットワークは、接続される新しい要素に対応するために、動的に進化する必要があります。
Google は、自社のネットワークが単一のエンティティではないことも認識しています。
- テンセント、ブロードコムのパッケージ型光スイッチの導入を準備
- フラッシュメモリベンダーがPCIe 5.0 SSDとCXL相互接続技術の最新仕様を発表
- データセンターネットワーク:最終的にはクラウドから管理することになるだろうとシスコは主張
「データセンターネットワークは本質的にマルチテナントであり、メンテナンスや局所的な障害が常に発生します」と、Googleのインフラストラクチャ担当副社長アミン・ヴァダット氏は説明している。「単一のデータセンターネットワークは、帯域幅やレイテンシの変動に対する優先度や感度が異なる数百もの個別のサービスをホストしています。」
「例えば、Web検索結果をリアルタイムで提供するには、リアルタイムのレイテンシ保証と帯域幅割り当てが必要となる一方、数時間かかるバッチ分析ジョブでは、短時間であればより柔軟な帯域幅が必要になる場合があります」とヴァダット氏は述べた。「こうした状況を踏まえ、データセンターネットワークは、リアルタイムの通信パターンとアプリケーションを考慮したネットワークの最適化に基づいて、サービスに必要な帯域幅とパスを割り当てる必要があります。」
こうした動的な再構成は回復力にも役立ちます。
「理想的には、アップグレードのためにネットワーク容量の 10 パーセントを一時的に停止する必要がある場合、その 10 パーセントをすべてのテナントに均等に分配するのではなく、個々のアプリケーションの要件と優先度に基づいて割り当てる必要があります」と Vahdat 氏は説明します。
しかし、ネットワークは特定の処理をうまく実行するようにハードワイヤードされており、Google のソフトウェア定義ネットワークでさえ、新しい要件に適応するためにネットワークを再構成することしかできません。
MEMS と OCS を使用すると、データセンターの配線 (またはファイバーの再配線) を変更することなく、ネットワークをアップグレードおよび再構成することもできます。
Vahdat 氏は、同社のネットワークは「当社が知る最良の代替手段に比べてダウンタイムが 50 倍少ない」と結論付けました。
Cisco、Juniper、Arista、そして仲間たちよ、これを受け止めて。そして残りの我々は、Kubernetesやクラウドにインスパイアされた消費ベースのIaaSモデルで起こったように、こうしたものは時間とともに徐々に浸透していくものだと安心してほしい。®