ARMの新型Cortex-A35:格安スマホでWebブラウジングを快適にするCPUのチューニング方法

Table of Contents

ARMの新型Cortex-A35:格安スマホでWebブラウジングを快適にするCPUのチューニング方法

スマートフォンの頭脳を設計するARMは本日、モバイルウェブブラウザや類似のアプリをより高速に実行できるように微妙に調整されたプロセッサコア、Cortex-A35を発表する。

CPUは、一見すると非常に特殊な用途向けにどのようにチューニングできるのでしょうか?その答えは、A35の命令プリフェッチキューにあります。ARMは、メモリアクセス帯域幅と処理速度のバランスを取るために、このキューの長さを半分に短縮しました。これはコンピュータサイエンスにおける大きな進歩ではありませんが、それでも興味深い変化です。

現代のプロセッサには、CPUが実行するためのプログラムコードが常に供給される命令パイプラインが備わっています。パイプラインが長いほど、コアが同時に実行できる命令の数が増えます。

このすっきりとした設計には、小さな問題が一つあります。プロセッサがパイプラインを消費する速度が、RAMが命令を送出する速度よりも速い場合があるのです。つまり、CPUの要求を満たすには、大量のコードが蓄積されている必要があるのです。

この頭痛の種に対する答えは、プリフェッチ命令キューです。これは、アイドル時にコアのプリフェッチ ユニットによって自動的に埋められるプログラム コードのバッファーであり、実行パイプラインが取り込むための命令を提供します。

Cortex CPUはメモリ内のデータにアクセスするか、プリフェッチバッファにデータを格納するかのどちらかであり、両方を同時に行うことはできません。そのため、新しいA35では、ARMが他のCortexプロセッサよりもキューの長さを短縮し、プロセッサがメモリ内のデータへのアクセスに多くの時間を費やせるようにしたと理解されています。キューの長さは、Cortex-A7とA5の半分であると理解しています。

設計図に戻る…ARMがCortex-A35に再設計した命令フェッチユニット(クリックして拡大)

この帯域幅のバランス調整は、Webブラウザなどのアプリのソフトウェアに適しているようです。これらのアプリは、画像やHTMLなど、RAMに保存された大量のデータを常に処理します。また、分岐予測機構(曲がりくねったプログラムコードの迷路をプロセッサが実行する際に、次の命令を常に供給し続けるための機構)も改良され、実行パイプライン内のストールが削減されました。これはアプリにとってもう一つのメリットになるとされています。

より高速なサーフィン...ARMは、命令キュー設計の変更により、A35はウェブブラウザアプリの実行時にA7のほぼ2倍の速度になると主張している。

命令フェッチユニットの再設計は、ARMの設計図のライセンスを取得し、毎年何億台もの携帯電話やタブレットの頭脳を製造しているスマートフォン用プロセッサチップメーカーから要請されたものである。

カリフォルニアで開催されるARM TechConカンファレンスで本日発表されるA35は、2011年に初登場した32ビットARMv7-A Cortex-A7の後継となる64ビットARMv8-Aプロセッサです。控えめながらも高性能なA7は、スマートフォン向けQualcomm Snapdragon 200および400ファミリのチップや、Raspberry Pi 2などに採用されています。A7と同様に、A35はインオーダー8段パイプラインを備え、デュアル発行機能は限定的です。

基本的にはエントリーレベルからミッドレンジのハンドヘルド機器、そしてもう少しパワーが必要な組み込み機器向けに設計されています。64ビットモードに対応したA7コアを搭載し、いわば「パワーアップ」と言えるでしょう。真のパワーを求めるスマートフォンチップメーカーであれば、強力なCortex-A53、A57、またはA72コアを搭載した製品を選ぶことになるでしょう。

A35は、マルチストリームデータプリフェッチやロード・アクイア・ストア・リリース命令など、A50シリーズからいくつかの機能を借用しています。また、A7に比べて電力制御も改善されており、ARMはA35が前世代機よりも小型でエネルギー効率が高いと主張しています。

最もシンプルな構成である8KB L1キャッシュを搭載したA35コア1基は、28nmプロセスを採用したシリコンダイ上で0.4mm²未満しか占有しませんすべての機能を有効にした状態で1GHzで動作するコア1基の消費電力は約90mW、100MHzで動作する最小コアの消費電力は約6mWとされています。

ARM のライセンシーは、次世代の安価なハンドヘルド向けに、64 ビット モードとその他の A50 グレードの機能、さらにブラウザーのようなアプリに適した命令キューを備えた A7 の後継機を英国のチップ設計者に要求したと理解しています。

「これは、シリコンパートナーやメーカーと協力して、パフォーマンスと効率とコアのダイ面積のバランスをとることの成果です」とARMのモバイルソリューション担当ディレクター、ジェームズ・ブルース氏はThe Registerに語った。

通常、モバイルワークロード、ブラウジング、ゲームはメモリを大量に消費します。プロセッサはRAMから大量のデータを取得する必要があります。A7はパフォーマンスとパワーのバランスにおいて非常に優れた性能を発揮し、A35ではモバイルワークロードの改善に重点を置くことにしました。

「いつものように、ゲート予算はあります。与えられたゲートで最大の効果を発揮しなければなりません。」

さらなる改良点…A35はCortexのL1およびL2キャッシュ機能を借用し、A7より優位に立つ

これがARMのビジネスモデルの魅力的な点です。ケンブリッジシャーに拠点を置く同社は、顧客と常に協議を重ね、顧客のニーズに合わせてコアを微調整・改良し、その結果をライセンス供与しています。Googleがモバイルハードウェア向けにチップ設計の経験を持つ人材を採用しているという噂も、驚くには当たりません。このウェブの巨人にとって、小切手を用意し、コア設計(例えばARMのもの)のライセンスを取得し、カスタマイズし、巨人の要件を満たすチップを製造してもらうのは、わずかな出費で済むのです。

モードオペランド ... 32 ビット AArch32 または 64 ビット AArch64 モードの A35 の機能

詳細については、本日中に arm.com にアクセスしてください。®

Discover More