電気電子学会誌「Transactions on Cloud Computing」に今週掲載された研究によると、2021年に開発され、Alibaba Cloudが導入した自社製のYitian 710 CPUは、データベース関連のタスクを処理する際にハイパースケールクラウドでレンタルできるArmサーバープロセッサの中で最速だという。
「Arm クラウド サーバーはデータベース ワークロードに対応できるか? 実験的研究」と題された論文では、Arm CPU を搭載したクラウド サーバーは驚くほどの速度で動作し、いくつかのタスクでは Intel Xeon を凌駕することから、肯定的な結果が得られています。
シンガポール国立大学コンピューター学部研究助教授のドゥミトレル・ロギン氏によるこの調査では、クラウドで利用可能な 5 つの Arm 搭載サーバー CPU と、8 つのクラウドにわたる Intel Xeon Platinum 8488C (2023 年第 1 四半期に発売された Sapphire Rapids シリコン) が検討されています。
以下は、Loghin がテストした CPU のリストと、それらを実行した場所の情報です。
CPU | グラビトン2 | グラビトン3 | イーティアン 710 | クンペン920 | アルトラ(3GHz) | Xeon 8488C |
---|---|---|---|---|---|---|
テスト済み | AWS | AWS | アリババクラウド | ファーウェイクラウド | Azure、Google | AWS |
インスタンステスト済み | c6g | c7g | c8y | k1c | Azure D32pls v5、Google T2A | c7i |
ISA | ARMv8.2 | ARMv8.4 | ARMv9 | ARMv8.2 | ARMv8.2 | x86-64 |
最大コア数 | 64 | 64 | 64 | 60 | 80 | 32 |
頻度 | 2.5GHz | 2.6GHz | 3.2GHz | 2.4GHz | 1~3GHz | 3.2GHz |
L1データキャッシュ(コア) | 64KB | 64KB | 64KB | 64KB | 64KB | 48KB |
L2キャッシュ(コア) | 1MB | 1MB | 1MB | 512KB | 1MB | 2MB |
L3キャッシュ(共有) | 32MB | 32MB | 64MB | 32MB | 32MB | 105MB |
RAMタイプ | DDR4 | DDR5 | DDR5 | DDR4 | DDR4 | DDR5 |
Loghin は上記のサーバーをレンタルし、それらを使用して 8 つのテストを実施しました。具体的には、Dhrystone および Whetstone ベンチマーク、カーネル システム コールの数とexecl
各システムによるコール、ファイルのコピー速度、全体的な UnixBench スコア、RSA 2048 署名、および RSA 2048 検証です。
これらすべてのテストにおいて、AlibabaのCPUは他のArmプロセッサを上回りました。Whetstoneでは、Altraのプロセッサと同様にXeon Platinumを上回りました。
- 循環依存関係により緊急API修正が遅れたため、Tencent Cloudは設計を再検討する
- アリババクラウド、エンジニアの必要数を86%削減するネットワークテレメトリツールを発表
- AWS、AI向けにコア満載のGraviton4とより強力なTrainiumアクセラレーターを発表
- 米国政府は中国のRISC-V利用を阻止することを検討していると報じられている
しかし、Loghin氏は、Yitianには固有の利点があると指摘する。Yitianは、新しいバージョンのArm ISAと、一部の競合CPUが利用できない高速DDR5 RAMを使用している。また、テストされた他のシリコンにも独自の機能がある。Huaweiクラウドのkc1.15xlarge.2 VMタイプでは、他のクラウドArmサーバーでは実現できないNUMAトポロジを使用して、Kunpeng 920 CPUを2つ組み合わせて動作させることができる。
Graviton 3 は Redis の実行時には Yitian に勝ったが、memcached のスループットの測定では中国製チップが勝利し、RocksDB スループットのテストに使用された 3 つのワークロードのうち 2 つでも勝利した。
クラウドにおける Arm サーバー CPU ベンチマーク – クリックして拡大
この論文では、Armサーバーのコスト効率をIntelベースの同世代製品と比較しています。Arm CPUはXeon CPUに比べてシステムコールを2倍多く実行するという非効率性があるにもかかわらず、特定の状況やワークロードにおいては、GravitonとYitianの方が優れた価値を提供します。
こうした要因があるため、Loghin 氏は「パフォーマンスが重要でない場合は、Arm サーバーが理想的な選択肢になる可能性がある」と主張しています。
同氏は、Arm サーバーは 3 つの対策によってさらに改善できると考えています。その 1 つはクロック速度のわずかな向上で、これにより「わずかなコストの増加でパフォーマンスが向上する」と Loghin 氏は考えています。
また彼は、Linux カーネル開発者に、Arm ベースのシステムでは x86-64 のシステムに比べて約半分の速度であるシステム コールのパフォーマンスを分析し、改善するよう求めています。
研究者の最後の願いは、ソフトウェア開発者が Scalable Vector Extensions などの Arm の機能を活用して、アプリケーションのパフォーマンスを向上させることです。
これら 3 つの提案を採用すれば、クラウド対応 Arm サーバーは Xeon に対するさらに強力な対抗馬になる可能性があると Loghin 氏は感じています。
あるいは、すでにそうなっているのかもしれない。ロギン氏は、2023年12月にリリースされるAWSのGraviton 4は、理論上は高速で強力に見えると認めている。しかし、現在はプレビュー顧客にのみ提供されているため、一般のユーザーが実際に試用するには待たなければならない。®