Computexテキストから画像へのモデル Stable Diffusion の第 3 バージョンが 6 月 12 日にパブリック プレビューとしてリリースされます。
この日付は今日台湾で行われたComputexカンファレンスで発表され、Stability AIのCTO兼共同暫定CEOのクリスチャン・ラフォルテ氏がAMDのCEOリサ・スー氏とともにステージ上でこのニュースを明らかにした。
ラフォルテ氏はイベントで「これには多くの検討が費やされた」と語り、特にAIの安全性について考慮したため、同社は改訂モデルをより広範なテストに使用できると感じているという。
同氏はこのリリースを、AI モデルの開発方法の変化だと位置づけた。
「かつては、研究の最先端がこうしたモデルを生み出していました」と彼は指摘する。「今では、自然な進化のように思えます。モデルをオープンに公開することで、人々は新たなユースケースを開拓できるのです。」
ラフォルテ氏は、Stable Diffusion 3 (SD3) の技術的な詳細は明らかにしなかったが、装飾的なアコースティックギターの弦の上に人間の手が浮かんでいる白黒画像を使用して、このエディションの進歩を示した。1つは2023年に SD XL 1.0 で作成され、もう1つは SD3 で作成された。
「手や繰り返しのパターンが関係するものは本当に難しい」と彼は説明し、SD3 で作成された画像は「ギターや手の形など、よりリアルなディテール」を提供していると称賛した。
- Hugging Face、1000万ドル相当の古いNvidia GPUをAI開発者に無料で提供
- CEO退任からわずか数週間で、スタビリティAIがスタッフを大量解雇
- Stability AIはレンタルクラウドGPUの料金を支払うための資金が不足したと報じられている。
- モデル崩壊とは何か、そしてそれを避ける方法
レジスター紙は、ラフォルテ氏が示した画像を簡単に撮影することができた。
Stable Diffusion XL 1.0 vs SD3 デモ – クリックして拡大
共同 CEO は、上記の点について「あちこちに多少の不完全さはある」と評価したが、プロンプトをより良く理解できるマルチモーダル拡散トランスフォーマーによって「大きな変化」が可能になったと述べた。
ラフォルテ氏はまた、プロンプトを入力するよりも短い時間で SD3 によって生成されたと説明した画像も披露しました。
同氏は、このモデルの性能向上は、より高帯域幅のメモリを搭載したハードウェアのおかげだと述べた。「92ギガバイトのHBMはまさにゲームチェンジャーだ」と喜びを語り、さらに強力なハードウェアへの渇望を表明した。
「メモリとコンピューティング能力がもっと必要だ」と彼は断言した。これに対し、AMDのリサ・スー氏は「GPUも必要だと思う」とコメントした。スー氏は、同じ基調講演で発表されたRyzen 300 AI CPUではSD3が問題なく動作するというラフォルテ氏のニュースを心から承認した。
Stability AIは、ユーザー候補向けに「ウェイトリスト」を作成しました。興味深いことに、サインアップフォームにはDiscord IDを入力するフィールドが含まれています。これは、ゲーム開発者の間でStability AIが人気であることを反映したものかもしれません。®