GTC今年もこの時期がやってきた。NvidiaのCEO、ジェンスン・フアン氏は月曜日、シリコンバレーで開催された同社の年次GPUテクノロジーカンファレンス(GTC)で、近日発売予定のクレジットカードサイズのAIコンピューターボードやCUDAプラットフォームのソフトウェアアップデートなど、GPUマニア向けの様々な製品を発表した。
残念ながら、特に驚くようなことはありません。実際、その多くは既に発表済みのもので、インテルが予想通り自社製のGPUとCPUを使ってアメリカ初のエクサスケール・スーパーコンピュータを構築するという発表によって、その注目度は下がってしまいました。アメリカが現在最も高速なスーパーコンピュータ2台は、NVIDIAのアクセラレータとIBM Powerプロセッサを搭載しています。
NVIDIA の新しくエキサイティングなアーキテクチャで、強力なニューラルネットワークをますます高速に学習させたいなら、もう少し待つ必要があります。しかし、ミニ AI キットをいじってみたいなら、この記事を読み進めてください。
月曜日の午後に行われた大物による基調講演で発表された新情報のハイライトは次のとおりです。
- ジェットソンナノ:
- これは、Raspberry Pi シングルボードコンピュータのような、AI に重点を置いたミニ開発キットで、独自の小規模な機械学習の実験やプロジェクトに取り組む愛好家を対象としています。
このボードには、ニューラルネットワークアルゴリズムなどの数学演算を高速化する128コア921MHzのNvidia Maxwell GPUと、アプリケーションコード実行用のクアッドコア1.4GHz ARM Cortex-A57 CPUクラスターが搭載されています。ピークパフォーマンスは472GFLOPSで、消費電力は約5W~10Wです。また、メモリ帯域幅25.6GB/sの64ビットLPDDR4 RAM 4GB、ギガビットイーサネット、USBおよび各種IOインターフェース、HDMI出力、ストレージ用のmicroSDスロットも搭載しています。Linux4Tegraが動作可能です。
99 ドル (75 ポンド) の Jetson Nano ボードは基本的に愛好家向けで、現在注文可能であり、Nvidia はビルダー コミュニティで大ヒットになることを期待しています。
一方、やや高価な129ドル(97ポンド)のNanoオプションは、エッジシステムに取り組む商用開発者向けと言われており、16GBのeMMCストレージを搭載し、1,000台以上の数量で入手可能で、6月に発売される予定です。どちらも、今月初めにようやく発売されたGoogleのAI重視の150ドル(113ポンド)のTPUベース開発ボードや、類似のキットと競合する予定です。
- CUDA-X:
- データサイエンス、ハイパフォーマンスコンピューティング、機械学習など、NVIDIAが提供する様々なCUDAソフトウェアライブラリが、CUDA-Xという単一のプラットフォームに統合されました。すべてのソフトウェアパッケージは、Voltaや最新のTitan VシリーズなどのTensor Core GPU向けに最適化されています。Amazon Web Services、Microsoft Azure、Google Cloudにも対応しており、これらのクラウドでライブラリを使用してGPUハードウェアを活用できます。
最近、自社のシリコン工場がNVIDIAに69億ドルという巨額で買収されたメラノックスのCEO、エヤル・ウォルドマン氏は、フアン氏の3時間にわたる基調講演に出席し、新たな支配者への支持を表明した。ウォルドマン氏は、NVIDIAが世界中のチップメーカーに自社のチップを投入するために懸命に取り組んでいると語った。
「プログラム中心のデータセンターはデータ中心のデータセンターに変わりつつあります。つまり、プログラムがデータを作成するのではなく、データが流れてプログラムを作成するということです」と彼は熱く語った。
私をかなり裕福にしてくれてありがとう...ウォルドマン氏(左)が黄氏と握手する
- AmazonがT4シリーズを予告:
- NVIDIAのTesla T4 GPUは昨年発表され、推論ワークロード向けに最適化されており、今後数週間以内にAmazon Web Services(AWS)でプレビュー版が公開される予定です。Turing Tensor Coreを搭載したTesla T4カードは、16GBのGDDR6 RAMと320GB/秒の帯域幅を備えています。TensorFlow、PyTorch、MXNetなど、様々なフレームワークで幅広い精度をサポートします。設計者によると、32ビット単精度演算では最大8.1TFLOPS、FP16とFP32の混合精度演算では65TFLOPS、INT8では130TFLOPS、INT4では260TFLOPSという高速演算性能を実現します。
AWSのG4仮想マシンは、1~8基のT4 GPU、最大384GBのRAM、最大1.8TBのローカルNVMeストレージ、そして最大100Gbpsのネットワークを搭載できます。AWSと言えば、AmazonのIoT Greengrassサービスを利用して、クラウドでトレーニングしたニューラルネットワークをネットワークエッジにあるNvidia Jetsonベースのハードウェアにデプロイすることもできるそうです。
- アイザック SDK:
- ロボット工学者向けの情報です。Isaac SDKは、商品の配送などの単純な作業を行う小型ロボットを開発するためのツールキットです。昨年初めて発表されましたが、今回はなんと、金属でできたロボットです。
ロボットエンジンとシミュレーターを搭載しており、ロボットを仮想世界で運用前に訓練できるほか、認識およびナビゲーションアルゴリズムも搭載されています。Kaya、Carter、Linkの3種類のロボット設計に対応しています。KayaはNVIDIAのJetson Nanoを搭載可能です。CarterとLinkは大型の配送・物流ロボットで、Jetson AGX Xavierハードウェア向けに最適化されています。
- 安全力場:
- Nvidia の Drive の研究者たちは、Safety Force Field と呼ばれる一連のポリシーと数学を考案しました。これは、自動運転車が使用して衝突や負傷を回避できる可能性があります。
- Microsoft とのパートナーシップ:
- レドモンドのAzure Nvidia GPUクラウドインスタンスは、NvのCUDA-XベースのRAPIDSライブラリを活用する機械学習コードを高速化します。Windowsの巨人とチップ設計会社は、ビデオ分析機能の強化でも提携しています。
今週は GTC の講演や発表をもっと取り上げる予定ですので、どうぞお楽しみに。®