Nvidia、Grace-Blackwellスーパーチップを小型化し、3,000ドルのミニPCに搭載

Table of Contents

Nvidia、Grace-Blackwellスーパーチップを小型化し、3,000ドルのミニPCに搭載

CES Nvidia は、新しい GB10 Grace-Blackwell スーパーチップを搭載し、128GB のメモリを備えたデスクトップ コンピューターを発表しました。このコンピューターは、AI 開発者、研究者、学生に、デスクトップ上で大規模なモデルを実行するために必要なツールを提供します。

「Project Digits」というコードネームで呼ばれ、本日ラスベガスで開催されたCESのスーパーイベントで発表されたこの3,000ドルのシステムは、MediaTekとの共同開発で、ArmベースのGrace CPUとBlackwell GPUを搭載しています。NVIDIAが公開したレンダリング画像によると、これらは単一のSoCに搭載されているようです。このボックスには、ハードウェアを最大限に活用できるよう事前設定されたUbuntu Linuxが同梱されます。

Project Digitsは、サイズ的にはIntel NUCのミニPCに似ています。NVIDIAはGB10の詳細なスペックを明らかにしていませんが、搭載マシンはペタフロップスのAI性能を発揮すると発表しています。しかし、小型デスクトップがNVIDIAのA100 Tensor Core GPUを上回るという期待に期待しすぎる前に、このマシンのパフォーマンスはスパースな4ビット浮動小数点ワークロードで測定されたことを知っておいてください。

私たちが確認した仕様によれば、GB10 には 20 コアの Grace CPU と、Nvidia の GB200 AI サーバーで使用されているツイン Blackwell GPU の 40 分の 1 のパフォーマンスを実現する GPU が搭載されているようです。

Nvidia の 3,000 ドルの Project Digits は、コーヒー マグよりも小さい小さなミニ PC に 1PF の FP4 コンピューティングを詰め込むことを約束しています。

Nvidiaの3,000ドルのProject Digitsは、コーヒーカップよりも小さい小型PCに1PFのFP4コンピューティングを詰め込むことを約束しています…クリックして拡大。出典:Nvidia

このマシンは、Intel、AMD、Qualcommのプロセッサを搭載したAI PCよりもかなり高性能ですが、NVIDIAの現在の主力ワークステーションカードであるRTX 6000 Adaを搭載したワークステーションとの競争には苦戦するでしょう。このアクセラレータは、スパースFP/INT8演算で1.45ペタFLOPSを誇り、Project Digitsがこの精度で実現すると予想される性能(500テラFLOPS)の約3倍に相当します。

これらのフロップス処理には128GBのLPDDR5xメモリが使用されています。NVIDIAのエンタープライズプラットフォーム担当プロダクトマーケティングディレクター、アレン・ブルゴイン氏によると、システムにこれほどのメモリを搭載するという決定は、大規模なAIモデルをより扱いやすくするためだったとのことです。

Nvidiaは、Project Digitsは最大2000億パラメータのモデルをサポートできると主張しています。しかし、このようなモデルをマシンに収めるには、4ビットに圧縮する必要があります。この概念については、当社のハンズオンガイドで詳しく説明しています。

NVIDIAによると、オンボードのConnectXネットワークにより、より大規模なモデルの実行が可能になります。これにより、これらのコンピューターを2台接続して、最大4050億個のパラメータを持つモデルを実行できるようになります。これにより、MetaのLlama 3.1 405Bが、再び4ビットで動作することになります。

参考までに、同じモデルを既存のワークステーション ハードウェアで 4 ビットで実行する場合、少なくとも 5 つの 48 GB GPU が必要になります。

本稿執筆時点では、大規模言語モデルの推論パフォーマンスの重要な指標であるメモリ帯域幅をNvidiaが公表していなかったため、Project Digitsがそのようなモデルを実行するときにどのようなパフォーマンスを発揮するかは不明だ。

Nvidiaが発表した月曜夜のCES基調講演に先立ち、報道陣に公開されたレンダリング画像によると、このシステムは6基のLPDDR5xモジュールを搭載しているようです。メモリ速度を8,800 MT/sと仮定すると、帯域幅は約825GB/sとなり、RTX 6000 Adaの960GB/sとそれほど変わりません。2,000億パラメータモデルでは、約8トークン/秒に相当します。繰り返しますが、これはあくまで推測に過ぎません。システムの完全なスペックシートは、CEOのJensen Huang氏のCES基調講演前には公開されていませんでした。

Nvidia は、AI 推論に加えて、Project Digits がモデル実験、微調整、データ サイエンス、その他のエッジ アプリケーションにも適していると予想しています。

Project Digits には、十分なメモリ供給に加えて、4TB の NVMe ストレージが搭載されます。これは、ほとんどのオープン モデル、特に 4 ビットに量子化されたモデルには十分な容量です。

顧客は5月からテーブルトップ スーパーチップを入手できるようになると予想されますが、前述のとおり、システムの価格は3,000ドルからと安くはありません。

  • MediaTekはチップセットの脆弱性のパレードで新年を迎えた
  • マイクロソフトが2025年までに800億ドルを投じ、AIへの支出は続く
  • AIの台頭でチップ市場が活性化、AMD InstinctやCloudy SiliconがNvidiaのシェアを争う
  • Nvidia、ホリデーシーズンに向けて小型Jetson Orin Nano開発キットをアップグレード

PCプレイヤーのNvidia?いや、違う

Project Digitsは、NVIDIAにとってデスクトップ分野への最初の進出ではありません。GPU大手のNVIDIAは長年にわたりJetson開発キットを提供しており、2024年12月には新モデル「Orin Nano Super」を発表しました。

この新しいマシンは本質的には、はるかに高い計算能力を備えた、単なる成長した Jetson です。

Nvidia は、GB10 を他の PC メーカーに提供するかどうかについては言及していないが、これは市場を揺るがす魅力的な展望である。

現状では、このマシンは、以前取り上げた GB200 や GB200 NVL4 のような、Nvidia のより強力な Grace-Blackwell スーパーチップにユーザーが慣れ親しむことを目的としているように見えます。

その理由は簡単です。これまで Nvidia の Grace CPU で使用されてきた Arm Neoverse V2 コアは 2 年以上前に発表されており、データセンターのワークロードを念頭に置いて設計されていたからです。

NVIDIAがTegraシリーズのSoCで既に行っているように、GB10をゲームやグラフィックス中心の製品向けにいつか販売しないというわけではありません。GB10がオリジナルのGrace CPUよりも新しいCPUコアを搭載しているのであれば、それは決してあり得ない話ではありません。®

Discover More