Google は水曜日に規模を縮小して開催した開発者会議で、現在および計画中の Pixel ハードウェア (その中には折りたたみ式の Pixel も含まれる) と、昨年の初期の Pathways Language Model (PaLM) の後継であり、現在ではさまざまな Google 製品に採用されている大規模な言語モデル PaLM 2 を披露した。
1日でさらに多くのことが詰め込まれました。2008年に初開催されて以来、2020年を除いて、2日間または3日間で開催されなかったのは初めてのことでした。偶然にも、このテクノロジー大手の従業員数は今年1万2000人減少しましたが、それでもまだ十分な人員が残っています。
プレショーはもっと短くてもよかったかもしれない。DJは、洗練されていないグラフィックをバックに、耳障りなボコーダーの歌詞で覆い隠された不快なエレクトロニックミュージックを観客に聞かせていた。それでも、肌寒い野外スタジアムで人々は拍手喝采を送った。
アルファベットCEOのサンダー・ピチャイ氏がシリコンバレーのショアライン・アンフィシアターに登壇し、Googleは検索を含むすべての主要製品を、生成型AIの進歩を活用するために再構築すると述べた。これが、この日の朝の雰囲気を決定づけたと言えるだろう。
下の動画で3時間半に及ぶPR攻勢をじっくりとご覧いただくか、こちらの概要をご覧ください。あるいは両方ご覧いただくこともできます。あるいは、どちらでもないかもしれません。私たちは警官ではありませんから。
YouTubeビデオ
Googleは長年にわたり人工知能システムの研究開発に取り組んでおり、今日話題となっているチャットボットを支えるトランスフォーマーアーキテクチャを開発し、この技術を自社の製品、サービス、そして社内パイプラインに組み込んできました。しかし今、少なくとも世間の認識という点では、Googleは追い上げに追われている状況にあります。
ライバルの OpenAI は現在、主に Microsoft と結びついており、過去 1 年間で自社の機械学習モデル GPT-3、ChatGPT、GPT-4、および DALL-E を一般公開して話題を呼んでいます。また、Microsoft はこれらの確率的オウムを GitHub Copilot、Bing、365 クラウドなどの製品に組み込んでいます。
同時に、8月のStable Diffusionや3月に登場したFacebookのLLaMAの複製などのオープンソースプロジェクトが、Google社員の間で取り残されるのではないかという懸念を引き起こしている。
Google IO: 詳細を掘り下げる
開発者向け
Googleの即座の回答はPaLM 2だ。これは、LLM(法学修士)に期待されるような、時折必要となる能力を備えたライティング、コーディング、そして計算を処理できるとピチャイ氏は述べた。この基礎モデルは、100以上の言語、科学データセット、そしてコードで学習済みだ。PaLM 2には、Gecko、Otter、Bison、Unicornという4つのサイズが用意されている。
PaLM 2には、Med-PaLM 2とsec-PaLMと呼ばれる医療向けとセキュリティ向けのフレーバーがあります。MetaのImageBindと同様に、マルチモーダルなGeminiと呼ばれる後継モデルも開発中です。
ピチャイ氏は、Google が PaLM 2 をベースにした 25 の製品と機能を導入すると述べた。これらのまだ完成していない機能のいくつかは、一般公開前に Search Labs を通じて試すことができる。
名前を変えても吟遊詩人
AIチャットボット「Bard」は現在、PaLM 2上で稼働しており、開発者のコーディング支援などに活用されています。以前は待機リストに掲載されていたこのサービスは、現在一般公開されており、180カ国が対象となっています。ただし、プライバシー関連の法律により、EUとカナダは対象外となっているようです。
Google Assistantの副社長兼ゼネラルマネージャーであるシシー・シャオ氏は、Bardは現在20のプログラミング言語を認識しており、来週にはこのAIサービスが提案のソースを引用する機能を獲得する予定であると述べた。
Bardは、Adobe Firefly、Instacartなどの様々なGoogleアプリやサードパーティサービスに接続されています。Hsiao氏は、Bardにアニメーションプログラムのある大学のリストを返して地図上に表示し、リストを表に変換して列を追加し、データをGoogleスプレッドシートに移動するよう指示することで、そのデモを行いました。
- Googleはクラウドセキュリティを強化するためにここにいます。そして魔法の要素は?もちろんAIです
- Google Pixelの所有者は、Pixiesが朝のアラームをオフにし続けると語る
- 脳をオフにしても安全:Google CEOがバードに父親の80歳の誕生日の計画を依頼
- GoogleはChatGPTへの回答をGmail、ドキュメント、API経由のアプリなどに押し込む予定
エンジニアリング担当副社長のキャシー・エドワーズ氏は、生成AIがGoogle検索インターフェースにいかに組み込まれているかを披露した。「3歳未満の子供と犬がいる家族にとって、ブライスキャニオンとアーチーズのどちらが良いですか?」という質問(以前はキーワードを複数入力する形で実行されていた可能性が高い)を提示したところ、Google検索は、より馴染みのあるスポンサーリンクと検索結果リンクの上に、AIが生成したテキストを返したとエドワーズ氏は指摘した。
AIの支援により、複数のクエリを一度に処理し、単一の推奨回答を提示することが可能です。画面上に一貫性を持って表示できる情報量には限りがあるため、この結果を提示するには更なるデザインの調整が必要になる場合があります。進化する検索エクスペリエンスは、Search Labsにご登録いただいた方にご利用いただけます。
「AIは市場を活性化させるだけでなく、プラットフォームを大きく変えるものでもある」とピチャイ氏は語った。
Googleはまた、今後数ヶ月以内に画像検索システムに機能を追加し、写真が最初にどこに表示されたか、いつインデックス化されたか、そして他にどこで見つけられるかを把握できるようにすると伝えられています。この情報に加え、AI生成画像のファイル内メタデータラベルのサポートにより、ネットユーザーは本物の写真と機械で作成された写真や偽造された写真を見分けやすくなると期待されています。
クラウドでのデュエット
今年後半には、開発中のPaLMベースの様々なAI機能が「Duet AI for Workspace」という単一のスイートに統合される予定です。Googleスライドでは、短い単語を入力するだけでスライド画像を生成できるようになります。Googleスプレッドシートでは、行と列をオンデマンドで整理できるようになります。Google Meetでは、ユニークな背景を生成できるようになります。そして、Googleドキュメントでは、AIによる文章作成支援も受けられるようになります。
Google Cloudのお客様は、コードアシスタンス、チャットアシスタンス、そしてノーコードでビジネスアプリを開発できるAppSheet向けのDuet AIなどの機能を備えたGoogle Cloud向けDuet AIをご利用いただけるようになります。これらの機能は、GoogleのTrusted Testerプログラムに参加しているお客様に提供されます。
Codey と呼ばれるこのコード アシスタント ツールは、Microsoft の GitHub Copilot のライバルとして売り出されています。
Google Cloudの責任者であるトーマス・クリアン氏は、「GoogleはAIの力を活用して、働き方を変革しています」と付け加えた。
Google Cloud の顧客は、8 つの H100 Nvidia GPU、3.6 TB/秒の帯域幅を持つ Nvidia の NVSwitch と NVLink 4.0、第 4 世代 Intel Xeon スケーラブル プロセッサ、4800 MHz DDR5 DIMM として 2 TB のメモリ、以前のものより 10 倍大きいネットワーク帯域幅を含む A3 GPU VM の待機リストに登録できるようになりました。
GCPは、この一連のテクノロジーを機械学習モデルのトレーニング、テスト、実行用に設計されたA3スーパーコンピュータと名付けています。The Next Platformの仲間たちが、こちらで詳細を説明しています。
そしてピクセルもある
Googleの上級副社長リック・オスターロー氏は、6.1インチのPixel 7aを高く評価した。同製品は少なくとも米国では499ドルで販売されており、前モデルより72%大きいカメラセンサーと昨年のモデルと同じチップセットを搭載している。
「Pixelは最初からAIファーストのモバイルコンピュータとして構想されていた」と同氏は述べ、同携帯電話のAI計算用Tensor G2チップを指摘した。
この端末には、AI を活用した通話アシスト機能も搭載されており、Direct My Call、Call Screen、Hold for Me、Clear Calling (ノイズ低減)、Wait Times (保留時間の推定) などの機能があります。
折りたためるスマホ…Pixel Foldです
しかし、Google は高価な携帯電話も製造しており、待望の折りたたみ式バージョンの Pixel Fold が来月出荷されることがそれを証明している。
価格は1,799ドルから。折りたたむと7.6インチのタブレットになり、異なる方向を向いたパネルで2言語間のライブ翻訳などの機能も利用できます。予約注文にはPixel Watchも付属します。
Pixel Foldは、Googleのユニバーサル・トランスレーター・プロジェクトのデモンストレーションに一役買いました。デバイスの両側にスクリーンが搭載されているため、リアルタイムの会話で音声をテキストに翻訳するのに理想的な方法のように見えます。とはいえ、Googleはこのコンセプトを何年も前から推進しているので、以前から耳にしていたものです。
そして最後に、近日発売予定のPixelタブレット。Googleのホームオートメーションシステムに統合できる11インチのタブレットです。価格は499ドルで、Googleは来月出荷時に無料で付属する充電ドックとスピーカードックを大々的に宣伝しています。これは、本体価格を高く設定し、さらにアクセサリー価格を値上げする企業への皮肉な皮肉なのかもしれません。®
Google IO からは他に何が発表されるのでしょうか...
- 1 月に初めて登場した MusicLM にサインアップすると、音楽のテキスト説明をオーディオに変換できます。
- あなたの車が Android を搭載していれば、今後数週間のうちに YouTube、Waze、Zoom、Microsoft Teams、Cisco Webex などを車内で利用できるようになるかもしれません。
- 少し前にGoogleは、斬新な3Dビデオ会議システムと称されるProject Starlineについて発表しました。まだプロトタイプ段階で、テレビサイズのデバイスに縮小されています。
- Google は、Google ドライブから情報を取得したり、考えを整理したり、ソースを引用したりするためのクエリを実行できるチャットボットを含むノートブック アプリ、Project Tailwind の順番待ちリストを公開しました。
- Androidに「Magic Compose」と呼ばれる機能が追加されます。これは、生成AIを活用して受信したテキストメッセージへの返信を提案する機能です。この技術は、Pixelスマートフォンの壁紙も生成できます。
- Gmail では、ダーク ウェブにあなたのメール アドレスが表示された場合に警告が表示されるようになりました。これは、あなたの情報が盗まれたか、悪意のある人物に狙われている可能性があることを示している可能性があります。
- Google フォトには、写真に複雑な変更を加えるためのマジック エディターが搭載されます。