コラム つい最近まで、パーソナルコンピュータのハードウェアは、ソフトウェアが課しうるあらゆる要求をはるかに超えているように見えました。従来、ユーザーのパフォーマンスに対する要求の最先端であったハイエンドゲームでさえ、当時入手可能な圧倒的に高性能な最先端チップにほとんど負担をかけませんでした。そこにAIアートが登場したのです。
AppleのM1 Ultraマイクロプロセッサは、トランジスタ数が1000億個を超えています。Nvidiaは先日、フラッグシップGPUのRTX 4090をリリースしました。トランジスタ数は760億個と前世代の3倍に増加し、最新のプロセスノードを採用し、消費電力を徹底的に抑えています。TDPは500W近く?この冬は、思いっきりパワーアップして、家を暖めましょう。
でも、一体何のために?300fpsのフォートナイトのバトルロイヤル?4月に「これらのモンスターは飼い慣らし、訓練し、働かせる必要がある」と書きました。テクノロジーは空白を嫌う。40年もこの分野に携わってきた経験から、私はそのことを学んだ。能力があれば、それを活用する何かが必ず現れる。
もう一方の問題は、9 月の初めに Stability.ai が Stable Diffusion をリリースしたときに発生しました。
DALL•EやMidjourneyといったシステムと同様に、Stable Diffusionは数十億もの画像を吸い上げ、象徴的に重み付けされたトークンへと縮小します。これらのトークンは、適切に作成されたテキストプロンプトによって再び可視化されます。全体としては魔法の域に達していますが、驚くほどうまく機能します。
DALL•EやMidjourneyとは異なり、Stable Diffusionは完全に自己完結型(十分な性能を持つマシンであればどれでも動作可能)であり、純粋なフリーソフトウェアです。そのため、最初のリリースではNvidiaの最高級GPUが必要でしたが、プロジェクトの貢献者は1週間以内にコードを簡素化し、ハードウェア要件を削減しました。現在のバージョンは、6年前に新しく生まれ変わった仮想現実の世界を探索するために購入した高性能PCだけでなく、ほぼすべてのM1ベースのMacでも快適に動作します。多くのゲーミングPCやラップトップでもStable Diffusionは問題なく動作し、プロジェクトベースのクリエイティブなニーズや、単に趣味として使うのに十分です。
その後、ある研究者グループがDreamfusionと呼ばれる技術に関する論文を発表しました。これは、テキストプロンプトから完全な3Dモデルを無限に生成できるというものです。「」と入力するとpineapple
、コンピューターが考え、そのモデルの最適な近似値を生成します。このグループはまだコードを公開していませんが、この論文は野心的なプログラマーがStable Diffusionのコードベースを改変してStable Dreamfusionを作成するのに十分な青写真を提供しました。ただし、これもかなり強力なハードウェアを必要とします。
「トレッドミルで走りながら絵を描くロボット」というテキストプロンプトから Stable Diffusion によって生成された画像... クリックして拡大
負けず劣らず、テルアビブ大学の別のグループが「人間動作拡散モデル」で世界を驚かせました。この論文では、拡散ベースのAI技術を用いて「the person walks forward two steps and does a cartwheel
」などのプロンプトを人間のようなアニメーションに変換する方法を示しました。1週間後、研究者たちは自らコードをオープンソースとして公開しました。
AI機能の急速な成長はまだ始まったばかりで、それがどこへ向かうのかはまだ分かりません。CanvaとMicrosoftは既に、プロンプトベースの画像ジェネレーターをクリエイティブツールに統合しています。Meta、Googleなどの企業は、プロンプトから動画を生成する独自のジェネレーターを既に発表しています。現在の傾向からすると、オープンソースの同等のジェネレーターが登場するまで、そう長く待つ必要はないでしょう。
- 地球の宝を守るには、デジタルの沈黙が重要だ
- アマゾンは監視資本主義をリアリティ番組として再パッケージ化した
- テクノロジー業界で40年働いてきて、私はあらゆるイノベーションには暗い裏返しがあることに気づきました
- 貴重なデータを保存しておかなければ、ランサムウェアは無力になる
視覚芸術には、Google や OpenAI のような大企業だけのものではない強力な新しいツールがあります。OpenAI は基盤の段階で AI を民主化すると約束した企業ですが、皮肉なことに、Microsoft を非公式の所有者として独自の独占帝国を築くことに重点を置いているようです。
The Register紙に寄稿した最初のコラムの一つで、PCの終わりのないアップグレードサイクルの終焉を指摘しました。もはやトレッドミルのような時代は終わり、摩耗したら買い替えるだけで済む時代が来るでしょう。パンデミックによるビデオ会議への対応のための急激なアップグレードを除けば、この予測は正しかったことが証明されました。
しかし、パーソナルコンピュータは皮を脱ぎ捨て、クリエイティブ・スーパーコンピュータとしての洗練された新境地を現しました。拡散力によって駆動され、従来のPCでは到底及ばないほどの創造性を発揮します。新しいスタイラスや絵筆を提供するのではなく、これらの質的に異なるツールは、新たな種類のクリエイティブなパートナーシップを築くのです。
6月にハイスペックなノートパソコンを購入したのですが、すぐに罪悪感を感じました。一度も使ったことがないと思ったからです。今では、日常的な作業も、驚くべきことも、どちらもこなせるこのマシンをフル活用しています。今にして思えば、あの購入は賢い買い物だったと思います。生まれ変わったPCが活躍する今、真のルネサンスの兆しと言えるでしょう。®