イマジネーション社は本日、最新のグラフィック プロセッサ コア製品ラインを発表する予定だが、その中にはクラウド ハードウェア向けとされるものも含まれている。
Bシリーズと呼ばれるこの新シリーズは、12月に発売されたAシリーズに続くものです。名前に惑わされないでください。AとBの合体チームのようなものだと考える人もいるかもしれませんが、BシリーズはAシリーズの代替ではなく、上位機種として位置づけられています。
イマジネーションズの拡張PowerVRファミリーに新たに加わったのは、トップエンドのBXT、ミッドレンジのBXM、エントリーレベルのBXE、そして安全性を考慮したBXSです。これらのコアは、モバイルエンドで1~1.1GHz、クラウドサーバーエンドで1.5GHzのクロックで動作するように設計されており、TSMCとの提携により、7nm、5nm、3nmプロセスノードを念頭に置いて設計されています。
コアは、単一のプロセッサパッケージ内で複数のチップレットに分割できます。例えば、BXTコアの集合を1つのチップレットダイに搭載し、さらに2つのダイを1つのパッケージに搭載することで、すべてのコアが同一のシリコン上に搭載されているかのように連携して動作します。チップレット方式はAMD、そして最近ではIntelも採用しており、その利点の一つは、個々のダイの複雑さとサイズを削減することで製造歩留まりを向上できることです。すべてのコアを1つのシリコン上に搭載した巨大なダイを製造するのは困難であり、故障などの不具合が発生しやすくなります。
英国に拠点を置き、中国資本のImaginationは、ファブレス半導体企業として、他社がライセンスを取得し、必要に応じてチップに組み込めるよう設計図を作成しています。つまり、これらのBシリーズGPUコアは、オンラインで簡単に注文できる部品ではありません。Android搭載ハンドヘルドやスマートテレビなど、次世代のガジェットを動かす可能性のある技術なのです。それでは、これらの新しい設計を一つずつ見ていきましょう。
BXT
前回イマジネーション社にAシリーズGPUについて話を聞いた際、同社は自動車業界に注力しており、ダッシュボードやインフォテインメントユニットなど向けの技術を提供していると説明されました。ところがその後、どこからともなく、イノシリコン社がBシリーズのBXT設計のライセンスを取得し、サーバーに搭載可能なGPU搭載PCIe 4カードとして取得したと伝えられています。イノシリコン社は火曜日の声明で、このキットは「5Gクラウドゲームやデータセンターアプリケーションを支える」と述べています。つまり、イノシリコン社はBXT GPUコアを搭載したシステムオンチップ(SoC)を搭載した拡張カードを製造すると推測されます。これらのカードは、AIワークロードなどのソフトウェアにおける演算処理の高速化や、クラウドゲーム、そして携帯電話インターネット経由でスマートフォンへの動画ストリーミング配信などに利用されることが期待されます。
これらの 4K および 8K 対応カードはデスクトップ マシン用としても宣伝される可能性があります。Innosilicon のエンジニアリング担当副社長 Roger Mao 氏によると、少なくともサーバー向けの機器は「間もなく市場に登場する予定です」とのことです。
BXTは4つのクラスタまで拡張可能で、各クラスタには4つのGPUコアが搭載されており、モバイルからクラウドサーバーまであらゆるデバイスを対象としています。Imagination社によると、クアッドクラスタ(クラスタあたり4つのGPUコア)のBXT 32-1024 MC4は、FP32で最大6TFLOPS(1秒あたり6兆回の32ビット浮動小数点演算)、INT8で最大24TOPS(1秒あたり24兆回の8ビット演算)の処理能力を持ち、1秒あたり192ギガピクセルの出力が可能です。
BXTは4クラスタ、クラスタあたり4コアの設計です。USCは統合シェーダコア、TPUはテクスチャ処理ユニット、FWはファームウェアプロセッサです。すべての図はImagination社のものです。クリックして拡大
昨年の最上位シングルクラスター、4コアのAXT 64-2048は、FP32で2TFLOPS、INT8で8TOPS、64ギガピクセル/秒のレンダリング性能を実現したとされていました。Imaginationは、コア数を4倍にし、クロック周波数を昨年の1GHzから引き上げることで、AXT 64-2048からBXT 32-1024 MC4へと最上位GPUの性能を3倍に向上させたようです。
AXTの64-2048という仕様は、4コアクラスターが64テクセル、クロックサイクルあたり2,048 FP32 FLOPsを実行できることを意味します。一方、BXTの32-1024という仕様は、4コアクラスターのクロックサイクルあたりのパフォーマンスがAXTの半分であることを示しています。しかし、クラスターを4つにし、クロック速度を上げることで、3倍のパフォーマンスが得られます。AシリーズとBシリーズの発売からわずか1年しか経っていないことを考えると、このレベルの進歩はそれほど驚くべきことではありません。
イマジネーション社では、B シリーズのコアは A シリーズよりもダイ スペースと電力消費が少なく、顧客はアプリケーションに適したクラスタリング アプローチを選択できると考えている点を指摘しておく価値があります。すべての人が速度を必要としているわけではなく、電力とダイ サイズは、A シリーズと同じくらい、あるいはそれ以上に重要になる場合があります。
BXT クラスターはクラスター間の軽量インターフェースを備えていると言われており、作業の完了を通知するための割り込み ラインのみが必要です。各クラスターにレンダリングする画面の特定の領域を割り当てることができ、各クラスターは独立して並行して画面を埋めます。
各クラスタには、イマジネーション社によってプログラムされたファームウェアプロセッサ(イマジネーション社ではFW)が搭載されており、レンダリングパイプライン、電力消費、タイミングなどを調整します。BXTは、FWに自社製のカスタムCPUアーキテクチャを採用しています。
BXE
BXEは、IoT(モノのインターネット)、8Kディスプレイ、スマートテレビ、産業機器など、組み込み機器やエントリーレベルのデバイスにグラフィカルユーザーインターフェースを提供することを目的としています。このBXEも最大4つのクラスターに配置可能で、FW CPUは合計1つです。イマジネーションはかつてこのアーキテクチャを所有していましたが、売却したため、現在もこのMIPS実装にアクセスできます。4クラスター構成でクラスターあたり1GPUコアのBXE 4-32は、最大128GFLOPS、16ギガピクセル/秒の処理能力を持つと言われています。
4つのクラスタ、クラスタあたり1つのコアのBXE配置
BXE は、他の B シリーズ コアと同様に、Imagination のロスレスおよびロッシー画像圧縮形式 IMGIC をサポートしています。これは、GPU コアの出力とディスプレイ ドライバー ハードウェアの間で使用され、フレームを画面に送信するために必要な帯域幅を削減します。
BXM
BXMはミッドレンジ製品で、モバイルゲームなど、より高度なユーザーインターフェースを必要とする用途を対象としています。4クラスター構成で、クラスターあたり1コアのBXM 4-64 MC4は、最大256GFLOPS、16ギガピクセル/秒の性能を実現できるとのことです。
4つのクラスタ、クラスタあたり1つのコアのBXM構成
BXS
最後に、BXSは安全性が重視される自動車などのシステムを対象としています。イマジネーション社によると、BXSはISO 26262に準拠しており、マルチコア構成では、1つのクラスターが別のクラスターの出力をチェックして期待通りかどうかを確認し、ハードウェア障害による逸脱があれば対応することができます。BXSは自社設計のRISC-V CPUコアをFWとして採用しており、イマジネーション社は将来のGPUクラスターにおいて、より多くのRISC-V互換CPUコアを採用することを検討しているとのことです。
4 クラスター、クラスターごとに 1 コアの BXS 配置
最後に、BXSはタイル領域保護と呼ばれる機能を提供します。これは、ダッシュボードのスピードメーターなど、ディスプレイ上の特定の安全上重要な領域をレンダリングする際に、追加の整合性チェックを実施することで、破損やグラフィックの破損がないことを確認するものです。例えば、GPUシステムを通過する重要なデータに対してCRCコードを生成し、ハードウェア障害によって転送中に情報が破損していないか確認することができます。
保護されたタイルのデザインを示すイマジネーションのイラスト...ハイライトされた四角形は、画面に表示されるデータが破損していないことを確認するために追加の整合性チェックを受けるディスプレイの重要な領域です。
単一クラスター BXS 4-64 は、64 GFLOPS および 1 秒あたり 4 ギガピクセルを達成できると言われています。
これを読んでいただく頃には、さらに詳しい情報がこちらでオンラインになっているはずです。®