分析過去数年間、Dell、HPE など多くの OEM がオンプレミス データセンターをパブリック クラウドに似た外観にしようとしてきました。
しかし、結局のところ、これらの製品の背後にある実際のハードウェアは、消費ベースのモデルで販売される通常のサーバーとスイッチの集合体であり、最新のクラウドやハイパースケール データセンターで見られるような OCP スタイルのシステムではありません。
しかし、私たちが最近目にしたこの概念に対する奇妙なアプローチの 1 つは、元 Joyent および Sun Microsystems の社員らが設立した新興企業 Oxide Computer によるもので、同社はデータセンターの計算ユニットとしてサーバーではなくラックを再構築しようとしています。
ゼロから始める
Oxideのラックスケールハードウェアを見ると、2Uシステムがぎっしり詰まった、ただのキャビネットだと勘違いしてしまうかもしれません。しかし、ハイパースケールにインスパイアされたコンピューティングスレッドを1つ取り出すと、これが全く異なる存在であることがはっきりと分かります。
重量2,518ポンドのこのシステムは高さ7.8フィート(約2.35メートル)で、負荷時には15kWを消費し、完全にカスタマイズされたソフトウェアスタックを使用して最大32のコンピューティングノードと12.8Tbpsのスイッチング容量を接続します。
他のラックと同じように見えるかもしれませんが、Oxide のラックスケール システムは巨大なブレード サーバーのようなものです... 出典: Oxide Computer
このプラットフォームは多くの点で、「ラックサイズのブレードサーバーを構築したらどうなるだろうか?」という疑問に答えてくれます。奇妙に聞こえるかもしれませんが、これはOxideが実際に実現したこととそれほど変わりません。
Oxide 社によると、多数のサーバー、ネットワーク、ストレージ、およびそれらを使用および管理するために必要なさまざまなソフトウェア プラットフォームをすべて寄せ集めにするのではなく、ラックスケール システムで、一貫したソフトウェア インターフェイスを使用してこれらすべてを処理できるとのことです。
ご想像のとおり、実際にそれを実現するのは思ったほど簡単ではありません。CTOのブライアン・キャントリル氏によると、この目標を達成するには、ハードウェアとソフトウェアスタックの大部分をゼロから構築する必要がありました。
ハイパースケールの利便性を家庭に
フォーム ファクターの点では、これにはいくつかの利点があります。Cantrill 氏によると、Oxide は、エンタープライズ システムでは一般的に見られない、直流 (DC) 電力供給用のブラインド メイト バックプレーンなど、いくつかのハイパースケールの優れた機能を統合することができました。
「大規模に導入している企業はすべて DC バス バーを持っているのに、Dell、HP、Supermicro からは DC バス バー ベースのシステムを購入できないというのは滑稽です。なぜなら、誰も欲しがらないからです」と Cantrill 氏は冗談めかして言った。
ラック自体がシャーシとして機能するため、Oxideはコンピューティングノードに非標準的なフォームファクターを採用することができました。これにより、より大型で静音性に優れ、消費電力の少ないファンを採用することができました。
以前取り上げたように、ファンはサーバーの消費電力の最大20%を占めることがあります。しかし、Oxideのラックでは、通常動作時のその数値は2%程度だとCantrill氏は主張しています。
興味深いのは、Oxideが実際にどのようにコンピューティングハードウェアを管理しているのかという点です。各ラックには最大32台のコンピューティングスレッドを搭載でき、各スレッドには64コアのEpyc 3プロセッサ、512GBまたは1TBのDDR4メモリ、最大10台の2.5インチU.2 NVMeドライブが搭載されます。Oxideは、今年後半に発売されるAMDのTurinプラットフォームに合わせてDDR5にアップグレードする予定で、これらのブレードは既存のラックと下位互換性を持つとのことです。
これらのリソースは、BhyveとIllumos UNIXベースのカスタムハイパーバイザーを使用する仮想マシンなどに分割されています。クラウドプロバイダーで広く使用されているKVMやXenと比較して、これは奇妙な選択に思えるかもしれませんが、Cantrill氏のSun Microsystemsでの経歴を考えると、UNIXベースのハイパーバイザーにこだわることは理にかなっています。
基盤となるハードウェアの完全自動管理を実現するために、Oxide社はさらに一歩進み、自社開発のベースボード管理チップ(BMC)を開発しました。「システムにはASpeed BMCは搭載されていません。それはもうありません」とCantrill氏は語ります。「代わりに、スリム化されたサービスプロセッサを搭載し、独自に設計したHubrisというオペレーティングシステムを動作させています。これはRustで構築されたシステムで、レイテンシが非常に低く、専用のネットワークに接続されています。」
「ラックへのレイテンシが極めて低いため、実際に意味のある電力管理を行うことができます」と彼は付け加え、これは、電力消費などをリアルタイムで追跡しなければ不可能な方法で、Oxide のソフトウェア プラットフォームが AMD のプロセッサに組み込まれている電力管理機能を利用できることを意味すると説明した。
これは、顧客が実際に 15kW ラックを購入し、CPU をより低い電力で動作させることで 8kW エンベロープで動作するように構成できることを意味する、と彼は主張している。
Oxide社によると、電力節約に加え、サービスプロセッサとハイパーバイザーの統合により、ワークロードをプロアクティブに管理できるという。例えば、ノードの1つでエラーが発生し始めた場合(ファンの故障など、単純なエラーの可能性もあると想定される)、そのノードで実行中のワークロードを、障害が発生する前に自動的に別のシステムに移行できる。
この共同設計の精神は、同社のネットワーキングへのアプローチにも及んでいます。
BroadcomやMarvellの標準的なホワイトボックススイッチを想像するかもしれませんが、OxideはIntelのTofino 2 ASICをベースに独自のスイッチを開発し、合計12.8Tbpsのスループットを実現しています。そして、もうお分かりかと思いますが、これもカスタムネットワークオペレーティングシステム(NOS)を搭載しており、皮肉なことにAMDプロセッサ上で動作します。
昨年時点でIntelが事実上Tofinoシリーズを放棄していたことを考えると、OxideがTofinoシリーズを採用するという決定は興味深いものです。しかし、Cantrill氏もCEOのSteve Tuck氏もあまり心配していない様子で、Dell'OroのアナリストSameh Boujelbene氏も以前、12.8Tbpsはラックトップ型スイッチとしては依然として大きな値だと語っていました。
DC電源と同様に、システムのネットワークはバックプレーンに事前に配線されており、各システムに100Gbpsの接続を提供します。「製造段階で正しく配線され、検証・確認されて出荷されれば、システムの配線をやり直す必要はありません」とカントリル氏は説明します。
そうは言っても、何か問題が発生した場合にバックプレーンを分解する責任を負う技術者にはなりたくないでしょう。
選択肢が限られている
明らかに、Oxide のラックスケール プラットフォームにはいくつかの制限があります。つまり、サポートされているハードウェアでしか作業できないということです。
現時点では選択肢はそれほど多くありません。汎用コンピューティングノードと、ストレージ用のオンボードNVMeが搭載されています。基本構成では、ハーフラックサイズのシステムで、最低16ノード、合計1,024コア、8TBのRAMを搭載します。フル構成ではその2倍の容量となります。
ニーズによっては、最小構成でも少々多すぎると感じる人がかなりいるだろうと想像できます。
今のところ、代替ストレージ、コンピューティング、またはネットワークのサポートが必要な場合、Oxideラックにはまだ導入できません。Oxideのネットワークは依然としてイーサネットなので、標準的な19インチシャーシをOxideの隣に設置し、GPUノード、ストレージサーバー、その他必要な標準的なラックマウントコンポーネントを詰め込むことは可能です。
先ほども述べたように、Oxide は今年後半に AMD の Turin プロセッサ ファミリをベースにした新しいコンピューティング ノードをリリースする予定なので、そのときにはコンピューティングとストレージの面でさらに多様性が見られるようになるかもしれません。
- UpstartはNvidia GH200サーバーを47,500ユーロのワークステーションに改造した
- バックブレイズの老朽化したハードドライブは2023年にさらに寿命を迎えた
- サム・アルトマンの半導体への野望は、懸念されていたよりも突飛かもしれない
- IBM、中小企業向けに13万5千ドルの小型LinuxONEボックスを発売
すべてCPUでGPUなし?AIはどうなってるの?
AIをめぐる騒動が盛んに起こる中、アクセラレーテッドコンピューティングの重要性は、キャントリル氏とタック氏にとっても無視できないものとなっています。しかし、Oxide社はGPUのサポートを検討しているものの、実際にはAMDが新たに発売したMI300AのようなAPUにもっと関心があるとキャントリル氏は指摘します。
12月に詳しく紹介したこのAPUは、24個のZen 4コア、6個のCDNA 3コア、そして128GBのHBM3メモリを1つのソケットに統合しています。「私にとってAPUは、この高速化されたコンピューターを主流化するもの。もはや、高速化の島々のようなものを存在させる必要がなくなるのです」とカントリル氏は述べています。
つまり、CPUとGPUがメモリを共有することで、データ移動を大幅に削減し、APUの効率を高めることができます。Oxideが取り組んでいるような、スペースと熱に制約のあるフォームファクターにおいて、APUがマルチソケットシステムのサポートの複雑さを軽減することも、おそらくプラスに働くでしょう。
ハードウェアはOxide独自のものですが、少なくともソフトウェアスタックはGitHubで公開開発されています。そのため、Oxideを購入して会社が倒産したり買収されたりした場合でも、少なくとも、本来は優れたハードウェアが高価なレンガと化してしまうのを防ぐために必要なソフトウェアは入手できるはずです。®
編集者注:混乱されている方のためにご説明いたします。当初、Oxideシステムの高さは9フィート(約2.7メートル)、重量は3,000ポンド(約1350キログラム)と報じていました。これらの数値は、スタートアップ企業とのやり取りから得たもので、現在では設置時の寸法ではなく、出荷時の寸法であることが分かっています。お客様が実際に導入されているサイズに合わせて、高さ7.8フィート(約2.7メートル)、重量2,518ポンド(約1140キログラム)に調整しました。