Google I/O 広告業界の年次開発者会議であるGoogle I/Oが、水曜日に3年ぶりにカリフォルニア州マウンテンビューのショアライン・アンフィシアターで開催されました。COVID-19の影響が長引いているため、イベントはほぼリモート形式で行われましたが、Google社員、パートナー企業、そして様々なソフトウェア開発者が会場を埋め尽くし、重要なポイントでは拍手喝采を浴びました。
Googleの親会社AlphabetのCEO、サンダー・ピチャイ氏は、お馴染みのテーマを口にしながら基調講演を開始した。「私たちはお手伝いするためにここにいます」という暗黙の感情を強調したが、同社が直面している多くの論争を考えると、この主張はますます疑わしいものとなっている。
同氏は、グーグルが「情報に対する理解を深めてそれを知識に変えること、そしてコンピューティングの状態を進歩させて、誰がどこにいても知識に簡単にアクセスできるようにする」という2つの方法でその使命を推進していることを説明したいと述べた。
オープニングビデオでは、より簡潔なメッセージが伝えられた。「テクノロジーは、すべての人の生活を良くする力を持っています。それを構築する必要があるだけです。」というのがテーマだった。
Googleは、良くも悪くも、常に新しいものを作り続けてきました。ピチャイ氏はGoogle翻訳が24言語に対応したことを発表しましたが、これは機械学習の進歩によって、これまであまり翻訳されていなかった言語のロングテールにも対応できるようになったためだと述べました。
「機械学習の進歩により、私たちは単一言語アプローチを開発しました。このアプローチでは、モデルは新しい言語の直接翻訳を見ることなく、その言語の翻訳を学習します」と彼は述べた。「ネイティブスピーカーや機関と協力することで、これらの翻訳は十分に質の高いものであり、有用であることがわかりました。」
- グーグルのFLoCは約束されたプライバシーを提供できなかったため失敗したと科学者らは主張している
- マイクロソフト、アップル、グーグルがパスワード廃止への取り組みを加速
- Google、ロシアのPlayストアから有料アプリをブロック
- Google Docs に「そして。そして。そして。そして。そして。」と入力するとクラッシュしました。
ピチャイ氏は話をGoogleマップに移し、同社がコンピュータービジョンを使って衛星画像から建物のモデルを生成する方法について説明した。
「3Dマッピング機械学習の進歩を活用し、数十億枚もの航空写真と街並みの画像を融合させ、場所の新たな高忠実度表現を作成しています」と彼は説明した。「これらの画期的な技術が融合することで、『没入型ビュー』と呼ばれる地図の新しい体験が実現します。これにより、これまでにない方法で場所を探索できるようになります。」
基調講演中のビデオデモでは、レストランの店内をフライスルーする映像が披露されました。このシーンの注目すべき点は、ドローンで撮影されたものではなく、静止画を解析するニューラルネットワークレンダリングソフトウェアによって生成されたことです。没入型ビューはモバイルデバイスでも利用可能で、今年後半にはロサンゼルス、ロンドン、ニューヨーク、サンフランシスコ、東京で、さらに後日、他の都市でも利用可能になる予定です。
Googleは、Geospatial APIを通じて、Live Viewのシーンラベル付け技術をARCore開発者に無償で提供します。また、マップの環境に優しいルート検索機能も拡張します。
「エコフレンドリールートは既に米国とカナダで展開されており、人々はこれを利用して860億マイル(約1300億キロメートル)を移動しました。これにより、推定50万トンの二酸化炭素排出量が削減されました。これは10万台の自動車を道路からなくすことに相当します」とピチャイ氏は述べた。「今年後半には、ヨーロッパを含むさらに多くの地域にこの機能を拡大することをお知らせできることを嬉しく思います。」
AIがビデオスターを支援
YouTubeでは、動画の自動生成チャプターが現在の800万から、今後1年間で8000万に拡大すると予想されています。また、音声認識技術を用いて動画のトランスクリプトを作成し、AndroidとiOSのユーザーが利用できるようになりました。
自動翻訳字幕も同様です。ピチャイ氏は、ロシア・ウクライナ戦争に関する正確な情報へのアクセスを増やすための大規模な取り組みの一環として、来月YouTubeのウクライナ語コンテンツに自動翻訳字幕を適用すると述べました。
GoogleのAIは最近、自動要約機能を通じてGoogleドキュメントに搭載されました。「これは自然言語処理にとって大きな飛躍です」とピチャイ氏は述べています。「長い文章の理解、情報の圧縮、そして言語生成は、これまで最高の機械学習モデルでさえ実現不可能だったものです。ドキュメントは、その始まりに過ぎません。」
この tl;dr 機能は、Spaces で利用できるようになりました。
チョコレートファクトリーの AI への関心は、Google Meet などのアプリケーションのユーザーが室内の照明の存在をシミュレートできる「ポートレート ライト」や、ビデオの画質を自動的に向上させる「ポートレート リストア」などの Workspace の機能強化にも表れています。
Google は、画像内の多様な肌の色合いの表現を改善するために、ハーバード大学教授で社会学者のエリス・モンク博士と共同で開発された、より正確な色表現のためのフレームワークである Monk Skin Tone (MST) スケールをオープンソース化しました。
Googleのシニアバイスプレジデント、プラバカール・ラガヴァン氏が壇上に上がり、様々な検索機能の改善について説明しました。最近導入されたマルチ検索機能(ユーザーが画像を撮影し、テキストを追加することで、その画像に写っているものに関する詳細情報を検索できる機能)は、「near me(近くの場所)」パラメータに対応し、地域に即した検索結果を表示できるよう調整されています。この機能は、今年後半に英語版でも利用可能になる予定です。
Google IO での Prabhakar Raghavan 氏 ... クリックして拡大
もう一つの近い将来のイノベーションは「シーン探索」です。これにより、探索者はモバイル デバイスのカメラでシーンを表示し、シーン内の各チョコレート バーに含まれるココアの割合など、シーン内の各アイテムに関する特定の情報を取得できるようになります。
Googleアシスタントは、「OK、Google」の起動フレーズなしでも応答するように学習されています。米国で販売されているNest Hub Maxは、本日より、オプトインして顔と声の両方のマッチングチェックに合格したユーザーであれば、視線や話しかけられただけで応答します。また、「OK、Google」を使わなくても、「タイマーを5分に設定して」などの限られた数のクイックフレーズにも応答します。
Android 13ベータ版が登場しました。現在はバージョン2です。より詳細なメディア権限や通知権限を設定できる新しい写真ピッカーが搭載され、今年後半にはセキュリティとプライバシーの設定ページが統合される予定です。また、タブレットとパーソナライゼーションの改善も行われています。
Googleのプロダクトマネジメント担当バイスプレジデント、サミール・サマット氏は、Android 13がRCS(リッチコミュニケーションサービス)をサポートしたことを強調した。RCSはSMSメッセージングのアップグレードで、エンドツーエンドの暗号化が含まれる。「すべてのモバイルOSがこのメッセージを理解し、RCSにアップグレードすることを願っています」とサマット氏は述べた。「そうすれば、どのデバイスを使っていても、メッセージのプライバシーは確保されます。」
便利、少なくともセキュリティ上、耳と手首に装着可能
ハードウェア面では、GoogleのPixel 6aが7月21日より449ドルで予約注文受付を開始し、7月28日に発売予定です。カラーはChalk、Charcoal、Sageの3色で、Pixel 6および6 Proと同じハードウェアが採用されています。5年間のセキュリティアップデートが提供されますが、3.5mmポートは搭載されていません。
製品管理担当副社長のブライアン・ラクウォスキー氏は、今年後半に発売予定の Pixel 7 および 7 Pro のプレビューを発表しました。
「Pixelのデザイン言語を進化させるため、カメラバー全体にアルミニウム仕上げを施しました」と彼は述べた。「筐体とカメラバーは100%再生アルミニウムの一枚板で作られており、美しいPixel 7 Proとそのトリプルカメラシステムは、写真、性能、そしてデザインにおいて全く新しい基準を打ち立てています。」
同氏によると、Pixel 7は次世代のGoogle Tensor SoCを採用し、Android 13を搭載して出荷される予定だという。
テンソルといえば、オクラホマのデータセンターにある Google の TPUv4 AI アクセラレータのポッド 8 つが言及されました。このアクセラレータは、Google Cloud の顧客に約 9 エクサフロップスの総計算能力を提供し、研究者や企業は Google が社内の AI 作業に使用しているのと同じ種類の計算を利用できるようになります。
Pixel Buds Pro、Google Walletの機能強化、Google Pixel Watchのプレビューについても話されました。
セキュリティとプライバシーにも注目が集まり、インターフェースの改善として、Google アカウントのアカウント安全性ステータス メッセージの表示、Gmail から Google ドキュメント、スプレッドシート、スライドへのフィッシングとマルウェアの検出の拡張、2 段階認証プロセス (2SV) の自動登録、Android と Chrome 向けの仮想支払いカードの提供など、今年の夏に予定されている機能が強化されました。
ピチャイ氏は基調講演の最後に、現実世界を強化する方法として、Google レンズ、マルチ検索、シーン探索、没入型ビューなどの拡張現実アプリケーションに言及したが、これは、Meta CEO のマーク・ザッカーバーグ氏がゴーグルで覗き込むような仮想現実に賭けた数十億ドルの投資を否定したようにも読める。
「ARの最大の魅力は、まさにその可能性にあります。現実世界、つまり私たちの生活の中で大切なことに集中して時間を費やせるということです」とピチャイ氏は述べた。「ご存知の通り、現実世界は本当に素晴らしいのです。」®