Epycセンター:AMDのZenサーバーCPUのスペックと価格がさらに明らかに

Table of Contents

Epycセンター:AMDのZenサーバーCPUのスペックと価格がさらに明らかに

更新されました。これが AMD の Epyc プロセッサの公式ラインナップです。これは、データ センターの世界を席巻している Intel の Xeon と互角に渡り合うことになります。

Epyc。これはタイプミスではありません。AMDのデスクトップおよびラップトップ向けチップはRyzen、サーバークラスのファミリーはEpycと呼ばれています。新しいAyyyyyyyMDへようこそ。RyzenとEpycはどちらもAMDのx86 Zenマイクロアーキテクチャを採用しています。

これはAMDの大きな復活なのか?独占企業Intelに対抗できるのか?などなど、いろいろありますが、これらについては後ほど詳しく見ていきましょう。今は意見は置いておいて、スペックについてお話しましょう。Epycの各パーツは、Global Foundries社が製造する14nmプロセス技術のシステムオンチップ(SoC)プロセッサです。各パッケージには、1メガダイではなく4つのシリコンダイが搭載されており、より安価で製造が容易です。ダイ1つあたり最大8コア、つまりプロセッサパッケージ1つあたり最大32コアを搭載でき、各コアは1つまたは2つのハードウェアスレッドを実行できます。

ダイはすべて、AMDのInfinity Fabric(HyperTransportの拡張版)を使用して内部接続されています。Infinityは、デュアルソケットEpyc CPU同士の接続にも使用されます。各プロセッサパッケージは、8チャネルで最大2TBのDDR4 RAMをサポートし、128のPCIeレーンを備えています。デュアルソケットシステムで2つのEpyc SoCを組み合わせると、それぞれがInfinityプロトコルを使用して相互通信するために64のPCIeレーンを消費します。つまり、シングルソケットEpycでは128のPCIeレーンが利用可能であり、デュアルソケットEpycシステムでは、各プロセッサがソケット間相互接続用に64レーンを消費するため、256レーンではなく128レーンが利用可能となります。

ちなみに、AMD は、必要に応じてデュアル ソケット機能も備えた優れたシングル ソケット チップとして Epyc を積極的に推進しています。

Die for me ... AMD Epyc チップ内部 (小さなループは Infinity ファブリックを表します)

Epycファミリーは、AMDの暗号化メモリ機能[ホワイトペーパー、マニュアル]をサポートしています。この機能は3つのモードのいずれかで動作します。1つは透過モードで、RAMへのすべての読み取りと書き込みは、メモリコントローラに保持されたキーによって復号化および暗号化されます。このキーは電源投入時にBIOSによって生成され、コントローラから外部に送信されることはありません。つまり、いかなるソフトウェアからも読み取ることができません。この暗号化は、実行中のオペレーティングシステム、アプリケーション、ハイパーバイザー、および仮想マシンに対して透過的に実行されます。

2つ目のモードはSEM(Secure Encrypted Memory)です。このモードでは、メモリの選択されたページが基盤となるオペレーティングシステムによって暗号化または非暗号化としてマークされ、コントローラが自身のみが認識するキー(起動時に再生成)を使用して再度暗号化処理を行います。暗号化を有効にするには、特定のページの物理アドレスマッピングのビット47を設定するだけです。

これら2つのモードは、コンピュータの動作中に物理的にアクセスできる悪意のある人物がバスからRAMの内容を盗聴したり、盗難犯が不揮発性RAM DIMMを奪ってそこに保存されている機密情報を読み取ったりするのを防ぐために設計されています。これは、誰かが文字通り自分のマシンに侵入するのではないかと不安を感じている人向けのものです。

もう1つのモードは、めちゃくちゃクレイジーです。SEV(Secure Encrypted Virtualization)です。これは、ハイパーバイザー、基盤となるオペレーティングシステム、他の仮想マシン、そしてマシン上の他のコードから保護された暗号化された仮想マシンを提供するという、AMDの勇気ある試みです。

各VMには、通常通りハイパーバイザーによってアドレス空間ID(ASID)が割り当てられ、このIDはコントローラーに保持されている暗号化キーと紐付けられています。CPUコアタイムが仮想マシンに割り当てられると、コントローラーはVMのASIDを取得し、秘密キーを検索し、それを用いてすべてのメモリアクセスをオンザフライで暗号化および復号化します。ハイパーバイザーは独自のASID(ゼロ)を持ち、キーを見ることはできません。そのため、不正なハイパーバイザーや乗っ取られたハイパーバイザーでさえ、仮想マシンの内容を解読することはできません。ましてや、他のVMで実行されているソフトウェアは、すべてのデータが暗号化されているように見えるため、解読できません。ハイパーバイザーとホストオペレーティングシステムには、これらのキーがないのです。

ここからが奇妙です。SEVは、仮想マシンをホストしている会社を信用できない、偏執的な人向けに設計されています。この技術は、仮想マシンが期待通りに起動し、起動前または起動中に改ざんされていないこと、そして暗号化システムが正しく動作していることを検証します。これには、AMDが各プラットフォームの署名鍵のデータベースを保有していることが関係しています。ええと…これについては後ほど詳しく説明します。

すべての暗号化(AES-128)は、データがSoCから送信される前にオンザフライで実行されるため、アクセスごとに約7ナノ秒のレイテンシが追加されます。これは、有効にすると1.5%のパフォーマンス低下につながるとのことです。複数のコアにまたがって動作し、場合によってはDMAも使用できます。これらはすべて、Epyc SoCに搭載されたARM CortexコプロセッサとAMDのカスタムファームウェアによって駆動されており、すべては隠された小さなコードにバグがないことにかかっています。コプロセッサはセキュアブートなどのサービスも提供し、必要に応じて暗号的に署名されたオペレーティングシステムのみが起動するようにします。

仕様

以下は、本日発表された新しい Epyc パーツと、AMD が各コンポーネントの競合相手として売り込んでいる Intel CPU の公式統計です。

例えば、AMDが月曜日にテキサス州オースティンのオフィスでアナリストやジャーナリスト向けに行ったプレゼンテーションによると、Epyc 7601はIntel Xeon E5-2699A v4と比較されました。AMDが実施したSPECint_rate_base2006整数ベースベンチマークでは、7601はIntel製プロセッサよりも47%高速だったと伝えられています。

このベンチマークは、ピーク時の出力ではなく、標準的な日常的なパフォーマンスをテストします。私たちは通常、ベンダー発行のベンチマークには非常に敏感ですが、AMDがデータセンター市場においてどのようなポジションを目指しているのか、そしてどのようなコンポーネントを狙っているのかをご理解いただくために、このベンチマークを公開します。これは、実際の、あるいは複雑なワークロード(例えば、複数のコアにまたがる仮想マシンなど)の実行と比較するものではないため、真のパフォーマンスを示すものではありません。これは、コア間接続など、チップの他の部分に負荷をかけることになります。

ちなみに、7501 に対抗する候補は提案されていないため、面白半分で Xeon E5-4669 v4 と比較してみました。

見出しについてですが、「コア」はシステムオンチップパッケージあたりのCPUコア数、スレッドはハードウェアスレッド数、ベースとターボは通常とピークのCPUクロック周波数、L3は最終レベルキャッシュサイズ、TDPは最大消費電力、SPECintは前述のAMD独自のベンチマークにおけるAMD製品がIntelの競合製品に対して示した増加率、そして価格は推奨小売価格です。TDPが2つある場合、その製品はどちらのモードでも動作するように設定できます。つまり、高電力・高パフォーマンスモードと、低電力・低パフォーマンスモードです。

AMDはEpyc SKUをデュアルソケットクラスとシングルソケットクラスに分割しています。PコードSKUでない限り、どちらの構成でも使用できます。また、一部のSKUは両方のクラスにまたがるため、重複して表示されます。例えば、AMDはデュアルソケットシステムでは7301を800ドル以上のIntel Xeon E5-2640 v4の2基の代わりに使用することを推奨しています。また、シングルソケットサーバーでは7551PをXeon E5-2650 v4の2基の代わりに使用することを推奨しています。確かに、AMDはシングルソケットクラスのSKUを特定のデュアルソケットIntelチップに対抗させ、それらよりも優れた性能を発揮できると主張しています。

デュアルソケットクラス

CPU SKU コア/スレッド ベース/ターボ GHz L3(MB) TDP スペクイント 価格
エピック 7601 32 / 64 2.2 / 3.2 64 180W +47% 4000ドル
Xeon E5-2699A v4 22 / 48 2.4 / 3.6 55 145W - 4938ドル
エピック 7551 32 / 64 2/3 64 180W +44% 3200ドル
Xeon E5-2698 v4 20/40 2.2 / 3.6 50 135W - 3226ドル
エピック 7501 32 / 64 2/3 64 155/170W 該当なし 未知
Xeon E5-4669 v4 22 / 44 2.2 / 3 55 135W - 7007ドル
エピック 7451 24 / 48 2.3 / 3.2 48 180W +47% 2400ドル
Xeon E5-2695 v4 18 / 36 2.1 / 3.3 45 120W - 2428ドル
エピック 7401 24 / 48 2/3 48 155/170W +53% 1700ドル
Xeon E5-2680 v4 14 / 28 2.4 / 3.3 35 120W - 1745ドル
エピック 7351 16 / 32 2.4 / 2.9 32 155/170W +63% 1100ドル
Xeon E5-2650 v4 12月24日 2.2 / 2.9 30 105W - 1171ドル
エピック 7301 16 / 32 2.2 / 2.7 32 155/170W +70% 800ドル
Xeon E5-2640 v4 10 / 20 2.4 / 3.4 25 90W - 939ドル
エピック 7281 16 / 32 2.1 / 2.7 32 155/170W +60% 600ドル
Xeon E5-2630 v4 10 / 20 2.2 / 3.1 25 85W - 671ドル
エピック 7251 8月16日 2.1 / 2.9 16 120W +23% 400ドル
Xeon E5-2620 v4 8月16日 2.1 / 3 20 85W - 422ドル

シングルソケットクラス

CPU SKU コア/スレッド ベース/ターボ GHz L3(MB) TDP スペクイント 価格
エピック 7551P 32 / 64 2/3 64 180W +21% 2000ドル
Xeon E5-2650 v4 2基 12月24日 2.2 / 2.9 30 105W - 1171ドル
エピック 7401P 24 / 48 2/3 48 155/170W +22% 1000ドル
Xeon E5-2630 v4 2基 10 / 20 2.2 / 3.1 25 85W - 671ドル
エピック 7351P 16 / 32 2.4 / 2.9 32 155/170W +21% 700ドル
Xeon E5-2620 v4 2基 8月16日 2.1 / 3 20 85W - 422ドル
エピック 7281 16 / 32 2.1 / 2.7 32 155/170W +63% 600ドル
Xeon E5-2609 v4 2 基 8/8 1.7 / 1.7 20 85W - 310ドル
エピック 7251 8月16日 2.1 / 2.9 16 120W +38% 400ドル
Xeon E5-2603 v4 2基 6/6 1.7 / 1.7 15 85W - 213ドル

(上記の価格は、当社の姉妹サイト The Next Platform に掲載されている定価です。AMD は公式に、7601、7551、7501 の価格は 3,400 ドルから、7451 と 7401 は 1,850 ドルから、7351、7301、7281 は 650 ドルから、7251 は 475 ドルからと発表しています。1 ソケットの 7551P の価格は 2,100 ドル、7401P は 1,075 ドル、7351P は 750 ドルです。)

ということで、上記についていくつか初期的な考察を述べさせていただきます。消費電力の数値は驚かれるかもしれません。また、上記のXeonはすべて、2016年に発表された14nmスケールアウトのBroadwell E5-26xx製品であり、強力なスケールアップのE7やフルスペックのBroadwell E5-46xxファミリーではありません。さらに、Intelは今年SkylakeベースのXeonを発売する予定であることもお忘れなく。つまり、まだ登場したばかりのEpycが、Chipzillaの次期サーバープロセッサにどう対抗できるかはまだ分かりません。

現時点でAMDは、自社のEpyc製品を、現在購入・出荷されているサーバープロセッサの大部分、つまり世界中のデータセンターを席巻しているスケールアウト型の主力製品Broadwellと比較している。重要なのは、すべては価格に帰着するということ。つまり、特定のXeonよりも安価に代替品を購入できるという議論になるだろう。最終的にAMDは、1ワットあたり1ドルあたりの性能という重要な指標で好成績を収めなければならない。GoogleやFacebookのような大手チップ購入者は、長年Intelチップに法外な価格を支払ってきたため、この点だけを気にしているのだ。Chipzillaが業界に課す課税に対抗するには、何か新しいものが登場する必要がある。

電力に関して、AMDはEpycプロセッサはシステムオンチップ(SoC)であると説明しています。つまり、ノースブリッジとサウスブリッジが別々のコントローラーではなくパッケージに内蔵されているため、RAMを追加するだけで済みます。さらに、ストレージ、ネットワーク、GPUなども追加できます。つまり、チップセットの電力の一部はEpyc SoCに吸収されるということです。

ちなみに、上記のBroadwell E5-26xx v4はそれぞれ40本のPCIeレーンを備え、ソケットあたり最大1.54TBのRAMをサポートします。各EpycのL1命令キャッシュとL1データキャッシュはそれぞれ64KBと32KBで、BroadwellファミリーのEpycはどちらも32KBです。また、L2キャッシュは256KBに対して512KBです。AMDによると、EpycのL2およびL2 TLBレイテンシはBroadwellと同等で、L3レイテンシはIntelの同等製品と比べて約半分です。

Epycチップは本日から入手可能となり、7月から出荷開始となる予定です。現在ハードウェアをテストしている関係者によると、来月あたりにシステムファームウェアのアップデートが行われ、発売時のシリコンに残るパフォーマンス問題が解決されることを期待しているとのことです。

基本的な本能

最後に、AMDはAIソフトウェアの高速化に向けたRadeonグラフィックプロセッサにも力を入れています。トレーニング用にはRadeon Instinct MI25(Vegaアーキテクチャ、16GB HBM2 RAM、300W、デュアルPCIeスロット)、トレーニングと推論用にはMI6(Polarisアーキテクチャ、16GB DDR5 RAM、150W、シングルスロット)、推論用にはMI8(Fijiアーキテクチャ、4GB HBM1 RAM、175W、デュアルスロット)がおすすめです。

MI25は、32ビット浮動小数点演算で12.3TFLOPS、16ビット浮動小数点演算で24.6TFLOPSの性能を発揮し、メモリ帯域幅は484GB/秒です。MI16は、16ビットまたは32ビット浮動小数点演算で最大5.7TFLOPSの性能を発揮し、メモリ帯域幅は224GB/秒です。MI8は、16ビットまたは32ビット浮動小数点演算で最大8.2TFLOPSの性能を発揮し、メモリ帯域幅は512GB/秒です。これらはすべて、今年の第3四半期に「テクノロジーパートナー」への出荷が開始される予定です。

今週後半に、蒸し暑いテキサスの気候から抜け出したら、AMD の最新のデスクトップ、サーバー、GPU アクセラレータ製品のまとめとともに、Epyc と Zen のアーキテクチャを詳しく調べてください。®

Discover More