Google、新しい画像AIでPhotoshopを凌駕する

Table of Contents

Google、新しい画像AIでPhotoshopを凌駕する

Google は、コード名 Nano Bananas でリリースされて話題を呼んだビルドで Gemini AI 画像生成ツールを更新しました。

正式には「Gemini 2.5 Flash Image」と呼ばれるこのアップグレードにより、ユーザーは音声やテキストによる指示で画像を生成できるようになり、写真の人物を入れ替えたり、服装を変えたり、実写画像の人物と新しい背景を合成したりすることが可能になる。Googleは火曜日に正式にリリースしたが、Geminiモバイルアプリのみで利用可能で、ウェブ版ではまだすべての新機能が利用可能ではない。

新しいエンジンをテストしていますが、結果は素晴らしいものでした。例えば、Reg USの編集者であるAvram Piltch氏は、自分の胴体だけの写真と、椅子2脚の写真を撮影しました。両方の写真をスマートフォンのGeminiにアップロードすると、赤い椅子に座っている自分の姿をエンジンに描画するように指示しました。

ジェミニはピルチを赤い椅子に座らせただけでなく、元の胴体写真にはなかった腕と脚まで描きました。さらに、元の画像では半分しか見えなかったTシャツのロゴまでも完成させました。合成写真で唯一不正確な点は、実物は青いジーンズを履いているのに、ズボンが黒くなっている点です。彼はジェミニにズボンをライトブルーのジーンズに変更するよう依頼したところ、ジェミニは問題なくそれを実行しました。

ジェミニはこの画像を2枚の別々の写真から作成しました。腕と脚はどちらの写真にも写っていませんでした。

ジェミニはこの画像を2枚の別々の写真から作成しました。腕と脚はどちらの写真にも写っていませんでした。 - クリックして拡大

「ジェミニに加工したい写真を与え、自分だけのタッチを加えるために何を変更したいかを伝えるだけです。ジェミニでは、写真を組み合わせてペットと一緒に写真に写る自分を配置したり、部屋の背景を変えて新しい壁紙をプレビューしたり、想像できる世界のどこにでも自分を配置したりできます。しかも、すべてあなたらしさを保ちながら」とチョコレートファクトリーは述べている。

「完了したら、編集した画像を Gemini にアップロードし直して、新しい写真を楽しいビデオにすることもできます。」

他の実験では、ピルチは娘の写真を撮り、隣にあった2体の像をどかすように指示しました。すると、近くの木の影が像があった場所まで伸び、像は消えてしまいました。次に、ピルチは娘にピラミッドの前に現れるように指示しました。するとジェミニは娘の指示に従い、姿勢を正してまっすぐに立つようになりました。

ユーザーがすぐに気付く大きな改善点の一つは、その速さです。テストでは、すべての処理がクラウド上で行われ、画像が数秒で完成しました。(確かに、当時は古いPixelを使っていましたが。)この作品のバナナの表紙アートもGeminiを使って作成しました。

Adobeを不安にさせるような動きを見せたGeminiは、画像編集者がAIを活用して、グラフィックデザイナーが数時間、あるいは少なくとも数分かかっていたであろう作業を数秒で置き換えるという、真の実力を見せつけました。かつてはPhotoshopで誰かの画像を合成する必要がありましたが、今ではツールに頼むだけで済むのです。

  • ハニー、画像を縮小したら、もう負けちゃったよ
  • RAMに関する小さなLLM:GoogleのGemma 270Mが登場
  • Googleは数字を操作してAIの渇望度を低く見せようとしている
  • OpenAIのGPT-5はAIの進化というよりコスト削減に見える

Google は、AI が生成した画像を識別できるように SynthID 透かしを追加しました。これは、スパム、扇動、その他の目的で使用される偽の画像を削減するのに大いに役立つはずです。

これでは、間もなく受信トレイに届くであろうAI生成スパムの波を止めることはできませんが、少なくともある程度の安全対策は講じられます。Gemini 2.5 Flash Imageにも、多少制限はあるものの、依然としていくつかのガードレールが存在します。例えば、ヒトラーの画像を生成するのは難しいですが、不可能ではありません。ただし、テイラー・スウィフトやドナルド・トランプのような有名人の画像を生成する場合は、問題ありません。ありがたいことに、少なくともポルノ的な画像を生成することに対する安全策は講じられています。

全体的に、一部の画像は完璧とは言えないものの、それでも OpenAI や xAI の Grok などの他の LLM 画像デザイナーに匹敵するものです。

Google は、Gemini API、開発者向け Google AI Studio、Vertex AI 向けに新しいシステムを展開しており、コストは出力トークン 100 万個あたり 30 ドル、画像 1 枚あたり 1,290 出力トークン (1 枚あたり 0.039 ドル) となる。

Googleによると、これはあくまで暫定的な開発段階であり、今後さらに改良を重ねていく予定だ。また、OpenRouter.aiおよびfal.aiと提携し、この技術をより利用しやすくしている。今後は、Googleの非常に魅力的な新機能に匹敵する機能を開発するのは、他のAI企業にかかっている。®

Discover More