Akamai Edge Worldコンテンツ配信ネットワーク Akamai は、25万台のサーバーからなる分散コンピューティングプラットフォームを運用しています。この規模では、あらゆるIOビットや消費電力が重要になります。そのため、Akamai は既製のハードウェアを購入するのではなく、自社で設計しています。
「普通のメーカーに行って価格表を見て、何かを買うかどうか決めることができれば便利なのですが、そうはいきません。結局のところ、私たちのワークロードは、一部のニッチなものを除けば、非常に特殊なものなのです」と、アカマイのネットワーク担当シニアバイスプレジデント兼チーフネットワークアーキテクトのノアム・フリードマン氏は、ラスベガスで開催された同社の年次総会でエル・レグ紙に語った。
フリードマン氏は1999年からAkamaiに勤務し、物理インフラのあらゆる側面を担当しています。また、Akamaiのカスタムボックスを提供するISPやコロケーションプロバイダーとの関係も管理しています。
Akamaiは、ウェブサイトやファイルのコピーを保管する世界中に広がるサーバーネットワークを基盤として事業を展開しています。これらのサーバーは、遠方のデータセンターではなく、エンドユーザーに近い場所から配信されます。これにより、ユーザーのレイテンシーとサービスプロバイダーの帯域幅コストが同時に削減されます。このインフラストラクチャを活用し、Akamaiはサイバーセキュリティ、特にDDoS攻撃対策分野へと事業を拡大しました。
「一般的な市場には、非常に高いコンピューティング性能向けに作られたハードウェアと、ストレージ向けに作られたハードウェアがあります。私たちのワークロード、つまりCDNとセキュリティを組み合わせたワークロードでは、それほど高いコンピューティング性能は必要ありません」とフリードマン氏は説明した。「また、他社がストレージを必要とする場合、通常は高いIO性能は必要としません。たとえ回転式ディスクを使用できるとしても、ドライブ数や構成、コントローラーのスループットといった条件を考えると、現在利用可能なハードウェアは十分に機能しないのです。」
同社は、実行可能な代替手段が見つからなかったため独自のハードウェアの構築を開始し、AWS、Google、Facebook と同じようにすぐに規模の経済性を発見しました。
当然のことながら、実際に導入すると、電力効率と経済的なメリットに重点を置き始めます。マザーボードを見れば、ここに1ワット、あそこに5ワットといった電力消費量を特定し、削減できる範囲を把握できます。サーバーが1,000台ある場合、こうした最適化を行う価値はありません。数十万台ある場合、膨大な電力を無駄にしていることになります。
サーバーの実験後、アカマイはスイッチの設計を開始した。フリードマン氏によると、現在同社のスイッチの約90%は自社開発のソフトウェアを実行する「ホワイトボックス」デバイスだという。
同社は、クラウドベンダーにハードウェアを供給する契約メーカーと直接提携し、冗長性を確保するために常に複数のメーカーと連携してハードウェアを製造している。アカマイは通常、異なるタスク向けに最適化された2~3種類のSKU(在庫管理単位)を保有しているが、ハードウェアは頻繁に変更される。平均ライフサイクルが5年であることを考えると、常時約15種類のハードウェアが流通していることになる。これほど多様なハードウェアの管理は「常に頭を悩ませている」という。
Facebook のオープン ハードウェア: 計算できますか?
続きを読む
ライフサイクルの長ささえも一定ではありません。フリードマン氏によると、東京ではデータセンターのスペースと電力が高価で、新しいサーバーは同じリソースを使いながらもはるかに多くの容量を提供できるため、ハードウェアを数年ごとに更新するのが理にかなっているかもしれません。一方、小規模なISPでホスティングされている古いサーバーは、何年も隅に静かに放置される可能性があります。
Akamai のサーバーには一部ディスクが搭載されていますが、パフォーマンス重視の企業であるため、ドライブのほとんどはソリッドステートドライブです。特定の場所におけるストレージメディアの最適な組み合わせは、人ではなく、ワークロードの種類とトラフィックを予測する複雑なモデルによって決定されます。また、サーバーの追加が必要な場所を特定するソフトウェアも提供されています。
しかし、どれも正確な科学ではありません。「購入の決定を下す際、私たちは現在の事業状況と今後の方向性について私たちが知っていることすべてを踏まえ、今、どのような組み合わせで購入するのが適切かを考えます。そして、私が唯一確信しているのは、それが決して正しいとは限らないということです。私たちは常に、予測できないような形で、どこかで失敗してしまうのです」とフリードマン氏は述べました。
では、アカマイはどのようにしてサーバーの設置場所を決めるのでしょうか?それはトラフィック量によって決まります。「私たちは、世界中のあらゆるユーザーにできるだけ近い場所にサーバーを設置したいと考えています」と氏は言います。「私たちは、インターネット上のあらゆるIPアドレスにどれだけのトラフィックを配信しているかというデータを収集することから着目しています。」
Akamai の DIY 機器は、世界中の 2,600 を超えるデータセンターに導入されています。そのほとんどは地元の ISP によって運営されていますが、キャリア中立型のコロケーション施設も最大 100 か所あります。
同社は、データセンターの築年数や特徴を気にしません。実際、これらの関係の一部は完全に仮想的なものであり、すべての交渉はオンラインで行われ、Akamai は配送サービスを使用してハードウェアを発送し、地元の人々が目で確認せずに設置するだけです。
交通の流れを追うということは、時には他社が進出しない地域、例えばロシアや中国などにも進出しなければならないことを意味します。「私たちは、お客様が最も進出を望まない地域こそ、お客様に最大の価値を提供しています」とフリードマン氏は笑いながら語ります。「お客様が苦労している地域こそ、私たちが注力している地域なのです。」
彼は今、アカマイの最新鋭システムの導入に胸を躍らせています。「今、私たちの焦点となっているのは、まさに今まさに最初の1,000台の出荷を開始したばかりのこの新しいシステムです。これは、これまで導入してきたサーバーの3倍の性能を誇ります。」®