インテルは、コアを1つ選択するだけで、ハイブリッドSoCまたはアクセラレータのコアに適切なワークロードを魔法のように配置できると述べている。

Table of Contents

インテルは、コアを1つ選択するだけで、ハイブリッドSoCまたはアクセラレータのコアに適切なワークロードを魔法のように配置できると述べている。

インテルは、今後のチップ設計に関する詳細を明らかにし、これが同社製品にとってここ数年で最大かつ最も重要な変更であると主張している。

これには、新しい CPU や、システム オン チップ パッケージ内にさまざまなタイプのコアを並べて配置する Alder Lake ファミリが含まれます。

このチップ大手は、ここでは Arm の世界のやり方を参考にしているようだ。

Arm対応のスマートフォン、タブレット、PCは通常、複数のCPUコアタイプを混在させています。バッテリー消費を抑え、バックグラウンドタスクや負荷の低いアプリの実行に特化した軽量コアもあれば、消費電力が高く、アプリケーションが処理性能の急上昇を必要とする場合にのみ使用されるコアもあります。オペレーティングシステムは、アプリを適切なコアに割り当てることで、バッテリーを過度に消耗させることなく、ソフトウェアが適切なレベルのパフォーマンスを発揮できるようにします。

インテルも同じような道を進もうとしている。同社の新しい CPU コアのタイプの 1 つは Efficient Core (別名 Gracemont) と呼ばれ、2015 年頃の Skylake アーキテクチャと比較すると、「同じ電力で 40 パーセント高いパフォーマンスを達成するか、または 40 パーセント未満の電力消費で同じパフォーマンスを提供する」とインテルは述べている。

名前が示すように、Intel はこの E コアを主に薄型軽量のラップトップなどのデバイスで使用することを意図しています。

注目すべき機能としては、Eコアは64KBのL1命令キャッシュ、32KBのL1データキャッシュ、そして4コアで共有される最大4MBのL2キャッシュを備えています。Spectreをものともせず、Intelはソフトウェアの高速化のために投機的実行に力を入れています。これは、分岐予測とプリフェッチャー、そして3幅のデュアルx86命令デコーダーの改良を意味し、1サイクルあたり最大6つの命令をキューイングできるということです。パイプラインは256エントリのアウトオブオーダーウィンドウと、整数ALU、多数の浮動小数点およびベクトル演算ユニット、そしてメモリアクセスユニットへの17個の実行ポートを備えています。

E コアは、整数ベースの機械学習計算を高速化するための拡張機能を備えた AVX ベクトル演算をサポートします。

インテルのEfficient Coreの概要

Intel の Efficient Core の概要 ... クリックして拡大

Eコアを補完するのが、以前Golden Coveという名称で紹介したIntel Performance Coreです。Pコアには、AIワークロードを高速化するために設計されたアクセラレーションエンジンであるAdvanced Matrix Extensionsが搭載されています。このコアも、ノートパソコンやデスクトップPCからサーバーまで、幅広い用途に対応できるとされています。

Intelによると、Eコアと同様に、Pコアはあらゆる新技術と投機的実行を用いて処理要件を予測し、効率的に処理を実行するとのことです。Pコアには、6つの命令デコーダ、より大きく広いマイクロオペレーションキャッシュ、12個の実行ポート、より大きなレジスタファイル、改良された分岐予測とプリフェッチ、512エントリのリオーダバッファ、高速演算、より大容量の命令TLBを備えた32KBのL1命令キャッシュ、48KBのL1データキャッシュ、最大2MBのL2キャッシュなどが搭載されています。興味深いことに、パイプラインのリネームおよび割り当てステージでも、より多くの命令が実行されます。

Intel Pコアの概要

そしてPコア…クリックして拡大

どれも素晴らしいことだと思いますが、Intelの次世代アーキテクチャは、こうした点を典型的に改善しています。詳細を知りたい方は、Intelの新アーキテクチャに関するプレゼンテーション、スライド、マーケティング資料などをこちらでご覧いただけます。

重要なのは、今回IntelがEコアとPコアを同じシステムオンチップ(SoC)に搭載し、オペレーティングシステムがどのコアとどのタイプのコアを使用するかを選択できるようにすることです。これは、EコアとPコアを混在させた、今後発売予定の10nm Alder Lake SoCと、Intelの新しい技術「Thread Director」で可能になります。

Intelによると、Thread Directorはゲームの起動時など負荷の高いワークロードを検知し、Pコアに時間を割り当てます。バックグラウンドでメールの同期処理が行われている場合には、Eコアに割り当てます。Thread Directorは両方のコアにスケジューリングを行うことができ、Pコアでアイドル状態のワークロードを検知すると、チップのより高性能な部分の使用が正当化されるまで、Eコアに切り替えます。

インテルは、これをハイブリッドチップの新たな幕開けとして宣伝しながらも、前述の通り、他のチップ設計者が既に同様の状況に陥っていることを認めています。Chipzillaの差別化ポイントは、競合他社が消費電力を抑えるためにコアを組み合わせているのに対し、自社のハイブリッドチップはパフォーマンス重視であるという信念です。

Windows 11はThread Directorを標準搭載しています。Linux OS開発者はThread Directorの登場を予期しています。Alder LakeのThread DirectorがLinuxやその他のサーバー向けOSにとって重要かどうかは議論の余地があります。IntelはPコアを「コードフットプリントの大きいアプリケーション」に最適なものとして位置付けていますが、Alder Lakeはクライアントレベルのアーキテクチャであり、PCやラップトップ向けです。

インテルがLakefieldを廃止したことを指摘しておく価値がある。Lakefieldは、パーソナルデバイス向けシステムオンチップに複数のCPUコアを搭載するという初期の試みだった。Sunny Cove高性能コア1基と、Tremont Atomベースの省電力コア4基を搭載したこのチップファミリーは失敗に終わり、インテルはAlder LakeとそのEコアおよびPコアの開発を進めている。

サーバーもPを取る

幸いなことに、Intel は新しいサーバー シリコン (コード名 Sapphire Rapids) でも P コアを使用しており、これは Xeon スケーラブル プロセッサという名前で販売される予定です。

Sapphire Rapidsは、Intelの「タイル」技術を採用しています。タイルは本質的には個々のプロセッサですが、Intelは複数のタイルを単一のパッケージに収める「組み込みマルチダイインターコネクトブリッジ」パッケージング技術を開発し、すべてのタイルを単一の論理プロセッサとして提示しています。

これはむしろ、複数の物理プロセッサダイが1つの論理パッケージに組み込まれたAMDのチップレットを彷彿とさせます。姉妹サイトThe Next Platformでは、Intelのタイルアプローチについてさらに詳しく解説しています。

Sapphire Rapids Xeon を構成するタイルの Intel 配布資料

Sapphire Rapids パッケージを構成するタイルのインテルによる図解 ... クリックして拡大

タイルは、Intelがクラウドや、AIやマイクロサービスといったスケールを必要とするワークロードに対応するために計画している方式です。したがって、Sapphire Rapidsは、OracleやAWSなどが現在、1コア1コンテナの世界におけるマイクロサービスに最適な選択肢として推進している、マルチコアArm搭載プロセッサへの反撃となるでしょう。

今後登場する Sapphire Rapids Xeon には、サーバーの高速化を目的として設計された以下の機能が搭載される予定です。

アクセラレータ インターフェイス アーキテクチャ (AIA) は、ストレージ I/O の処理や仮想スイッチの実行などのハウスキーピング ワークロードを、現在ではインフラストラクチャ プロセッシング ユニット (IPU、別名 DPU) と呼ぶことにしているものに Intel がオフロードする方法であるため、最も重要なものになる可能性があります。

The Register紙が今週初めに出席した2時間半のメディアブリーフィング(アーキテクチャー・デーと名付けられました)で、Intel幹部はAIAがIPUをどのように活用するかについては慎重な姿勢を示し、MicrosoftやVMwareとの協業に言及しました。彼らは命令サイクルの再利用については楽観的な見通しを示し、Facebookの一部のマイクロサービスがサーバー電力の31~83%をオーバーヘッドに費やしていると指摘しました。このオーバーヘッド処理をIPUに移行できれば、CPUコアは他の処理に使えるようになると伝えられています。

AIA によって実現できる可能性の 1 つはディスクレス サーバーです。アクセラレータ アーキテクチャを使用する IPU は、外部ストレージ (ブート ドライブとしても) を使用する仮想 NVMe デバイスを提供できるようです。

インテルは、IPU と AIA がクラウドや通信サービス プロバイダーの間で大きな存在になるとし、まだ明らかにされていない提携により、IPU が主流のデータ センター ユーザーにとっても重要なものになると示唆しました。

  • インテルはAWSが顧客になったと発表、クアルコムは同社の将来技術を高く評価し、ビジネスに復帰した証拠としてそれを主張
  • インテルのFoveros技術は、Lakefieldが発売から1年後に中止となり、スピードバンプに直面
  • インテルがさらに2つの第11世代Coreチップを発見、そのうち1つはノートパソコンで5.0GHzを実現
  • ダウン・ザ・スワニー:インテルCEOは利益が30%急落したことを受け、「2020年は私のキャリアの中で最も困難な年だった」と語る

また、IntelがIPUの販売を開始したことも、意外ではない。半導体大手のIntelは、同社初の専用IPU ASIC「Mount Evans」と、FPGAベースのIPUリファレンスプラットフォーム「Oak Springs Canyon」を発表した。興味深いことに、Mount Evansには16個のArm Neoverse N1 CPUコアに加え、IOインターフェース、キャッシュ、パケット処理パイプラインが搭載されている。

インテルがIPU対応のサーバープロセッサを準備しているという事実自体が重要です。なぜなら、これらのデバイスと、それによって実現される新しいデータセンターアーキテクチャに関する期待は長年高まってきたものの、それがどのように実現されるのかはほとんど示唆されていないからです。AIAは、IPU/SmartNIC/DPUが実用化に向けて着実に進んでいることを示しています。

もっと速く、チッピーキャット!ドリル、ドリル!

Sapphire Rapidsのもう一つの重要なアクセラレータは、Advanced Matrix Extensions(AMX)です。これはテンソル処理、ひいてはディープラーニングアルゴリズムに特化したシリコンです。AMXは、Sapphire Rapids Pコアが他の処理を実行している間も動作可能です。そのため、AMXは独自の命令セットを備えています。

The Next Platformによる AMX の詳細な分析は、こちらをご覧ください。

Sapphire Rapidsのもう一つのアクセラレータは、データ転送を処理するデータストリーミングアクセラレータ(DSA)です。これは、CPUコア、メモリ、キャッシュ、接続ストレージ、ネットワークストレージデバイス間のデータフローを、CPUを待機させることなく確実に行うことを目的とした、ボトルネック解消のためのもう一つの機能です。

さらにパワーが必要な場合は、Intel が販売している Ponte Vecchio GPU がおすすめです。

Ponte Vecchio は、高性能コンピューティング向けのカスタマイズが満載で、いつ登場しても米国のトップクラスのスーパーコンピューターに搭載される予定だが、タイル実装と TSMC とのコラボレーションでも同様に注目に値する。

このGPUは5つのタイルで構成されており、それぞれが異なる処理に特化しており、それぞれ異なる製造プロセスで製造されています。コンピューティングタイルはIntelの台湾のライバル企業TSMCによって製造されており、ChipzillaはPonte Vecchioが、自社で製造したものだけを使うのではなく、それぞれの用途に最適なファウンドリと連携して作業を進めるという、同社の新しいIDM 2.0戦略を体現していると主張しています。

インテル ポンテ ヴェッキオ

ヴェッキオ橋、クリックして拡大

Intel には新しい GPU と、主にゲーマーやコンテンツ クリエイターを対象とした新しいブランド「Arc」もあります。

まだ小切手帳を取り出さないでください

上記のすべては、遊んでいて楽しそうです。

読者の皆さん、興奮を抑えてください。Intel は、それらの多くがいつリリースされるかを正確には言えないからです。

Ponte Vecchioは2022年中にリリースされる予定です。Alder Lakeは「今年後半」にリリースされる予定ですが、Windows 11が「2021年後半」にリリースされる際に、Ponte Vecchioを搭載したPCがWindows 11でThread Directorを利用できるように間に合うかどうかは不明です。

インテルCEOのパット・ゲルシンガー氏は、アーキテクチャー・デーのプレゼンテーションの最後に登場しただけで、チップに対する考え方を変える新しい技術について言及した以外、ほとんど何も語らなかった。ゲルシンガー氏は、かつては新しいプロセスがシリコン技術の重要な進歩を決定づけたと述べた。そして、シリコンをハイブリッドマシンにパッケージングすることが、今日の主流だと指摘した。

ゲルシンガー氏が、上記のすべての技術発表の最後に花を添えるというのは、まったく奇妙なことではないようだ。なぜなら、それらの発表が決定され、開発されたときには、ゲルシンガー氏は会社にいなかったからだ。

しかし、Arm がインテルの領域にさらに深く進出し、Qualcomm があらゆる場所で実行できるようにするという野望を推進し、AWS が Xeon よりも先に自社のシリコンを推進し、AMD が攻撃の斬新な方法を見つけ、Nvidia がほぼすべてのコンピューティングのニッチに力を入れようとしているにもかかわらず、インテルは市場を作るイノベーションだと考えるものを販売しなければならない今、ゲルシンガー氏が重要な立場にいる。®

インテルといえば...今週、CEOのゲルシンガー氏は全社員に送ったメールで、従業員にCOVID-19コロナウイルスのワクチン接種を義務付けるつもりはないが、年末までにワクチン接種を受けた従業員には1人あたり250ドル、時間給労働者には100ドル分の食事券を提供すると述べた。

Discover More