Intel、Lunar Lake PCチップが120 TOPSを実現する仕組みを詳細に説明

Table of Contents

Intel、Lunar Lake PCチップが120 TOPSを実現する仕組みを詳細に説明

Computex AI PC の台頭により、最終的にはすべてが TOPS に集約されます。つまり、ニューラル プロセッシング ユニット (NPU)、GPU、CPU が何兆バイト規模の演算を処理できるかということです。

マイクロソフトは市場を定義するため、Windowsに組み込まれているAI機能(物議を醸したRecall機能など)を活用できる「Copilot+ PC」の称号を得るための基準を40 TOPSに設定しました。これまでに、QualcommとAMDがこの基準を満たすプロセッサを発表しています。

火曜日のComputexで、Intelは、Copilot+クラブに参加するためにNPUを強化する方法など、今後発売予定のLunar Lakeモバイルプロセッサに関する一連の情報を公開しました。

Intelは、2023年12月にMeteor Lakeプロセッサを発売し、モバイルプロセッサにNPUを統合し始めました。IntelはMeteor LakeシリコンのNPUを「NPU 3」と呼んでおり、約11.5 TOPSの処理能力がありましたが、これはMicrosoftの目標を大きく下回っています。

Intelは、Lunar LakeのNPU(「NPU 4」と呼ばれる)がINT8で48TOPSの演算能力を発揮し、FP16もサポートすると主張しています。x86の巨人であるIntelは、いくつかの変更を実装することでこれを実現しました。最も注目すべきは、NPU専用のダイ面積を拡大したことです。Meteor LakeではNPUの演算タイルが2つでしたが、Lunar Lakeでは6つになります。

Intel によれば、NPU ブロックの大型化とともにデジタル信号プロセッサもアップグレードされ、ベクトル計算が 4 倍に向上したという。これは、全体的なベクトル パフォーマンスが 12 倍向上することを意味する。

Intel はまた、AI を使用して周波数と電圧曲線を最適化し、エネルギー消費を削減するとともに、大規模な言語モデルなどの負荷の高いワークロードを実行する際のボトルネックを軽減するために、ダイレクト メモリ アクセス (DMA) を 2 倍にすることにも取り組みました。

「パイプラインはより高い周波数に最適化されており、NPU 4は、ML/AI技術を使用してプロセスを超えて最大20パーセントの電力削減を実現した業界初のテープアウトの1つでもある」とIntelは主張している。

しかし、NPUは方程式の一部に過ぎません。Intelはまた、CPUとGPUにいくつかのアーキテクチャ上の改良を加えたことで、少なくとも最高スペックのモデルでは、チップのAI性能が合計120TOPSに達すると発表しました。

今年後半に発売される Intel の Lunar Lake モバイル チップに何が期待できるかについての概要を以下に示します。

今年後半に発売されるインテルのLunar Lakeモバイルチップに何が期待できるかの概要は次のとおりです。クリックして拡大します。

Lunar Lake には、Meteor Lake より 2 つ少ない 2 つのダイが搭載され、Intel の Foveros パッケージング テクノロジを使用して接合されます。

これらのダイのうち、どれが自社製造されるのか、またどれだけが自社製造されるのかは不明です。このチップはIntelの20Aプロセス技術を採用すると予想されていましたが、以前の報道によると、Intelは社内ノードの生産能力増強に取り組む間、少なくとも一部のコンピューティングタイルにTSMCの3nmプロセス技術を採用するとの噂があります。

Intelによると、このチップに搭載される新しいLion Cove pコアは、前世代と比べてクロックあたりの命令実行能力が14%向上し、新しいSkymount eコアはAIワークロードのスループットを2倍に向上させるとのことだ。今回のチップのコア数はpコア4基とeコア4基と大幅に減少することを考えると、パフォーマンスの向上は好ましいと言えるだろう。

合計すると、CPU は必要に応じて 5 TOPS の AI パフォーマンスを提供できます。

  • ArmのCEOは5年以内にWindows世界の半分を制覇することを目指す
  • クアルコムは、Copilot+ PC を動かす SoC で「すべてのフォームファクター」をターゲットにしたいと考えている
  • AI PC向けCPUでRyzenのリーダーに:AMD
  • NvidiaはArmとBlackwellコアを搭載したAI PCチップを準備中と報道

一方、GPUは依然としてTOPSパフォーマンスに最も大きく貢献しています。Lunar Lakeシリコンに搭載された8つのグラフィックコアは、Meteor Lakeのユニットよりも約50%高速で、67TOPSを実現します。また、AIではなくGPUでゲームを実行したい場合、少なくともIntelの社内ベンチマークによると、このチップは最大80%高速です。

2 番目のダイはプラットフォーム コントローラー タイルと呼ばれ、Wi-Fi、Bluetooth、PCIe、Thunderbolt などの I/O 機能と一部のセキュリティ機能を処理します。

最後に、Lunar LakeはAppleのMシリーズ製品における数世代にわたる取り組みと同様に、オンパッケージLPDDR5メモリを採用します。これにより、RAMの総容量は32GBに制限されるようですが、これは用途によっては大きな問題になる場合もあれば、そうでない場合もあります。

エネルギー効率が高く評価されているApple Siliconとの類似点はこれだけではありません。Intelは、この新しいアーキテクチャは電力を大量に消費するのではなく、消費を抑えることを重視すると示唆しています。チップメーカーによると、新たに統合された電源コントローラー、ソフトウェアの最適化、そして改良されたe-Coreクラスターにより、バッテリー駆動時間が最大60%向上するとのこと。

もちろん、AI搭載PCの競争相手はIntelだけではありません。Qualcommは最近、45TOPSのNPUを搭載したXシリーズチップを発表しました。これらのチップにより、Qualcommはx86チップメーカーのライバルに対して優位に立っており、MicrosoftはQualcommのチップをAI推進の中核に据え、圧倒的なリードを築いています。

負けず劣らず、AMD は今週の Computex 基調講演で、FP16 で 50 NPU TOPS を実現し、10 または 12 のコアを誇り、Radeon 800M グラフィックスを搭載した Ryzen AI 300 シリーズ モバイル プロセッサを披露しました。

そしてもちろん、Appleの新しいM4は38TOPS(おそらくINT8)を誇ります。これはMicrosoftのCopilot機能の基準を満たすには不十分ですが、そもそもAppleがそれらの機能を使う予定はなかったようです。

つまり、TOPS を目指す競争はまだ始まったばかりのようです。®

Discover More