Google IO Google は本日、毎年恒例の I/O 開発者向けイベントを開催し、オンラインとオフラインのあらゆる活動に機械学習ソフトウェアを導入する計画の詳細を発表しました。これはまさに、あらゆる活動を意味します。
CEOのサンダー・ピチャイ氏はシリコンバレーで登壇し、同社の製品を使い続ける限り、人工知能がいかに人々の生活をより便利で、より安全に、そしてより楽しくしてくれるかを説明した。これらのAIシステムは私たちの生活を簡素化するだけでなく、テクノロジーをより良く使いこなすための訓練もしてくれるだろう。
基調講演では、あまり詳しい話はなかった。むしろ、Google が世界に発表しようとしている、あるいは発表する予定のものを一気に紹介する内容だった。
「テクノロジーはプラスの力となり得ますが、その影響を軽視することはできません」と彼は聴衆に語りかけた。「深刻な疑問が提起されており、今後の道筋を慎重に検討する必要があります。私たちの核となる使命は、情報をより利用しやすく、社会にとって有益なものにすることです。」
これを示すため、彼は今後数ヶ月でGoogleアシスタントに導入される拡張機能の一部を紹介しました。特に注目すべきは、音声機能です。年末までに、Googleのデジタルパーソナルアシスタントと会話する際に、歌手ジョン・レジェンドの音声を含む6種類の音声から選択できるようになります。
ピチャイ氏は、AIの活用によって声優がスタジオで過ごす時間が大幅に短縮されたと述べた。この広告大手のコードは、彼らの発話から十分な学習をし、幅広い語彙を使って話者になりすますことができた。もしかしたら、いつかあなたの声になりすます日が来るかもしれない。
デュプレックス – 何が現実で何が非現実か
Googleはまもなく、アシスタントに「Duplex」と呼ばれる機能を追加します。これは自然言語処理能力を新たなレベルに引き上げ、アシスタントがボットであることを明かすことなく、ユーザーに代わって人間と会話することを可能にします。このソフトウェアは、電話越しにあなたのふりをしたり、あなたの代わりに行動したりして、自動的に食べ物を注文したり、予約を取ったりします。
電話を取り、誰かに電話をかけ、面倒で退屈なやり取りをする代わりに、Googleに頼んでみましょう。そして、Googleのデジタルアシスタントに頼んでみましょう。しかも、ひどいやり方で。
ピチャイ氏が挙げた例は、ネットユーザーがアシスタントにヘアカットやレストランの予約を依頼するというものだった。すると、ソフトウェアは予約のために自ら会場に電話をかけ、さらに「えー」や「んー」といった言葉のアクセントも加えることで、よりリアルな音声を実現している。以下で実際に動作している音声を聴くことができる。
Googleアシスタントが電話をかけている。こんなにスムーズに通話できるようになるまで、一体何回電話をかけたんだろう #IO18 pic.twitter.com/aNCTJzeGKr
— イアン・トムソン(@iainthomson)2018年5月8日
Googleがこれを素晴らしいと考えているのは当然ですが、イベント参加者の中にはDuplexシステムに少し不安を感じたり、不安を感じたりする人もいました。ロボコールや詐欺師などがこれをどう利用するのかは想像に難くありません。
この技術はまだ一般公開されていません。こちらに技術的な詳細があります。ボットが会話に支障をきたした場合、人間のハンドラーにフォールバックして通話を引き継ぐ可能性があることにご注意ください。例えば、このボットは拒否をうまく受け入れないようです。例えば、午後12時に空き時間がなく、次の予約可能な時間が午後1時だとソフトウェアに伝えると、アシスタントは午前10時から午後12時までで大丈夫かどうか尋ねます。
繰り返しになりますが、この技術はまだ開発中であり、現時点では広く使用されていません。
Googleアシスタントが実際に電話をかけ、人間と会話しながら美容室の予約を取る様子をご覧ください。まだ利用できませんが、テスト中です。#io18 pic.twitter.com/kPhDSCCYdP
— ダニー・サリバン (@dannysullivan) 2018年5月8日
ソフトウェアは将来的には、「OK Google」と話しかけなくても、話しかけるだけで反応するようになります。アシスタントは話しかけられたことを認識し、それに応じて反応できるようになります。
Google社員の中には、アシスタントに話しかける子供たちが失礼でしつこい小悪魔に育てられてしまうのではないかと懸念する人もいました。そこで、数ヶ月以内に「Pretty Please」というオプトインシステムを導入する予定です。この機能を有効にすると、アシスタントに何かを尋ねる際に「please」という言葉を使うと、その丁寧さを褒め称えてくれます。
ニュースへの入り口としてのGoogle
ピチャイ氏はまた、Googleのニュースアグリゲーターに人工知能(AI)が搭載されると述べた。搭載される予測システムは、ユーザーが個人的に見たいニュースの種類を自動的に判断し、適切な「信頼できる」タイトルや記事を提案する。ロボットの支配者たちが、エル・レグのしゃれ、皮肉、そして企業権力への不遜さを高く評価してくれることを切に願う。
「Full Coverage」と呼ばれる新機能は、特定のトピックに関するすべてのニュース記事を表示し、誰もが同じ情報を見ることができるとされています。しかし、より全体的な概要を知りたい場合は、ニュースアプリが過去の閲覧習慣に基づいて、信頼できる1,000のニュース記事から記事を提案してくれます。これらのニュース記事がどのように信頼できるのか、そしてどの記事が除外されるのかは説明されていません。
チョコレートファクトリーは、有料コンテンツについては出版社と契約を結び、ユーザーが Google アカウントを使って購読し、料金を支払ってストーリーを読めるようにしている。
Android Pがさらに賢くなる
Google のモバイル オペレーティング システムの次期ビルドである Android P は、秋にリリースされる予定であると伝えられています。
Android P…今年後半に登場
Androidのエンジニアリング担当副社長であるデイブ・バーク氏は、Pビルドはユーザーの使用状況を把握し、それに応じて消費電力を調整するため、従来の「Droid」エディションよりもバッテリー寿命が長くなると約束した。OSはどのアプリがいつ使用されたかを記録し、使用頻度の低いアプリのリソースを削減する。バーク氏によると、これによりバッテリーを大量に消費するCPUの起動回数が30%削減されるという。
「スマートフォンはユーザーと融合し、ユーザーに適応するべきだと私たちは考えています」と彼は語った。
新しいOSには、1日中のすべてのアクティビティを表示するダッシュボードも搭載されます。これにより、スマートフォンはユーザーの作業内容や作業内容を把握できるだけでなく、ユーザーの行動を予測し、先回りして予測しようとします。
Androidのメインアプリ画面には、既に最もよく使われるアプリが並んでいますが、Pビルドでは過去の履歴に基づいてアクションを提案してくれるようになりました。バーク氏は自分の携帯電話を見せながら、普段は妻に電話したり、ランニングに出かけたりしていると語り、これらのアクションを提案してくれました。また、ヘッドホンを接続している場合は、音楽も提案してくれます。
開発者にとって、これらの機能はActions.xmlファイルを使用するだけでアプリケーションソフトウェアでサポートできます。Googleは機械学習開発キットもリリースしており、これにより画像認識やテキスト認識といった基本的なAI機能が誰でも利用できるようになります。
さあテクノロジーを捨てて
Android Pにはアプリタイマーも搭載されます。特定のアプリの使用時間が長すぎる場合に警告を発し、スマートフォンを置いて他の作業をするように促すリマインダーを表示するように設定できます。
バーク氏によると、よくある不満は、人々が携帯電話に夢中になりすぎて、通知が届いた瞬間に確認しなければならないというものだ。そこで、新OSには「Do Not Disturb(おやすみモード)」機能が搭載され、携帯電話の音だけでなく、視覚的な通知もすべてオフにすることができる。このモードは、携帯電話を画面を下にして置くと自動的に有効になる。
もちろん例外もあります。ユーザーはスター付きの連絡先リストを作成できます。スター付きの連絡先とは、いつでも着信拒否設定を回避できる人です。配偶者や子供の学校などが最適な候補として提案されました。
もう一つの問題は、スマートフォンをベッドに持ち込み、夜中まで使ってしまうことです。そこでGoogleは、この問題に対処するために「Wind Down」モードを追加しました。
寝る予定時間をスマートフォンに伝えると、内部のカウンターが作動します。就寝時間になると、すべての色が消され、おやすみモードになり、スマートフォンを置いて寝るようにというリマインダーが鳴ります。
今日はどこに行きたいですか?
Googleマップにも、Googleレンズの画像処理システムのおかげで、重要な機能が追加されました。マップは、ユーザーの過去の行動履歴に基づいて、周辺の店舗やサービスを提案するようになりました。過去に高い評価を付けた場所があれば、その情報がおすすめに反映され、アプリが特定の場所を提案した理由も教えてくれます。
グループ機能もあり、友達と集まるときに、全員がおすすめのレストランを入力すると、Google が最も適した選択肢を選ぶのに役立ちます。
Googleマップのルート案内にも拡張現実(AR)機能が追加されます。どの方向に歩くべきかを推測するのではなく、スマートフォンがユーザーの方角を確認し、ストリートビューのデータと位置情報を比較して、画面上で左右の方向を指示します。Googleはまた、画面上にキツネが現れて目的地を案内する機能も公開しました。
猟犬を放て
ARは、看板やメニューの翻訳にも役立ちます。例えば、カメラでメニューをスキャンすると、小さなボタンが表示され、特定の料理の詳細が表示されます。
忘れる前に、Gmailにいわゆるスマートコンポジション機能が追加されます。返信を入力すると、バックエンド側がメッセージに含めるべき単語やフレーズを提案してくれるようになります。
ビッグデータとビッグアイアン
この AI には、大量のデータと大量の処理能力という 2 つの要素が必要です。
データ収集は難しくありません。Googleはウェブ検索とオンライン広告市場の大部分を支配しているため、ユーザーが何に興味を持っているか、そして世界で最も利用されているモバイルOSを熟知しています。ユーザーがスマートフォン、アプリケーション、ブラウザに生活のあらゆる側面について語らせることを許せば、AIのあらゆる機能にアクセスし、より適切な提案を受けることができるのです。
プライバシーを重視する人は、これらの新しいAI機能をあまり活用しないかもしれません。このような場合、ソフトウェアが全く機能しないか、あるいは誤った推奨を大量に行うかのどちらかになるか、どうなるか興味深いところです。
しかし、経験から判断すると、ほとんどのネットユーザーはデフォルト設定で推奨されているデータをそのまま渡すだけでしょう。そして、それは処理を必要とする情報の津波を生み出すことになります。
これを実現するために、ピカイ氏はGoogleの高度な演算処理チップの最新版であるTensor Processor Unit 3.0を公開した。ピカイ氏によると、TPU v3チップのポッドは前世代のポッドと比べて最大8倍の性能を備えており、その性能の高さから、Googleはデータセンターの過負荷を防ぐために液体冷却システムを導入せざるを得なかったという。
本日、第3世代のTPUを発表します。最新の液冷式TPUポッドは、昨年の製品と比べて8倍以上の性能向上を実現し、100ペタフロップスを超える機械学習ハードウェアアクセラレーションを実現します。#io18 pic.twitter.com/m8OH5vFw4g
— Google (@Google) 2018年5月8日
その結果、Googleは現在、100ペタフロップスのTPUポッドを保有し、膨大なデータを処理し、新たな活用方法を見つける準備が整っています。もちろん、人々がデータを引き渡すことを選択すればの話ですが。®