Googleは、音声アシスタントプラットフォーム上のアプリに「連続マッチモード」を導入しました。このモードでは、アシスタントは途切れることなくすべての会話を聞き取ります。同時に、関連する開発者ツール、新機能、そしてAMPコンポーネントフレームワークを使用してスマートディスプレイハードウェアにウェブコンテンツを表示する機能も発表しました。
チョコレートファクトリーは音声アシスタントに大きな計画を描いています。「音声は私たちにとって最大のパラダイムシフトだと考えています」と、新機能が発表されたVoice Globalサミットで、製品ディレクターのバリス・グルテキン氏は述べました。
目標は「アンビエントコンピューティング」です。いつでもどこでも、意識することなくビッグGとインタラクションできる環境です。音声インタラクションは、キーボードのタップやディスプレイへのタッチが不可能な状況でも検索やアプリケーションの実行を可能にするため、この実現において重要な要素となります。
Googleアシスタントは、スマートフォンやスマートウォッチ、テレビ、PCなど、様々な形で提供されています。音声のみのGoogle HomeやGoogle Home Miniといった専用ハードウェア、Google Nest Hubの「スマートディスプレイ」画面、LenovoやHarmanのデバイスなどにも搭載されています。アシスタントデバイスは人気ですが、Androidスマートフォン(アシスタントの設定を促してくる)が最大のユーザー層を占めていると考えられます。Googleは、すべてのデバイスタイプで5億人以上のアクティブユーザーがいると主張しています。
進化を続けるプラットフォームには、開発者サポートが不可欠です。Voice Globalイベントで、同社は新しいツールを発表しました。中でも最大の目玉は、アシスタント用のアプリケーションとも言える「アクション」の構成要素を追加・組み立てることができるWebベースのツール「Actions Builder」です。Actions Builderは、自然言語理解(Natural Language Understanding)と統合された使いやすいツールで、ユーザー入力をアクションに適したものに解析し、インテントとレスポンスのフローを作成し、完全なアクションを構築できます。
Google Assistant のシニアプロダクトディレクターである Payam Shodjai 氏は、サミットで、Builder は、開発者が Actions Console と DialogFlow エディタを切り替えていた従来のアプローチがあまりにもばらばらであるという苦情に応えたものであると説明しました。
Shodjai 氏は、「Actions Builder は、アシスタントのアクションを開発するための推奨方法として DialogFlow に取って代わる」と述べた。
Google の新しいアクション ビルダーの活用
新しいアクションビルダーを試してみたところ、Googleがユーザーの行動を記録できるようにする「ウェブとアプリのアクティビティ」権限が無効になっていると、開発中のアクションを実行できないことがわかりました。権限を有効にするよう促すダイアログが表示されます。これは、Googleアシスタントが、パーソナライズされたエクスペリエンスと引き換えにユーザーがGoogleにデータを提供するという概念といかに密接に結びついているかを改めて示しています。
開発者の中には、ビジュアルビルダーではなくテキストベースのコードで作業することを好む人もいます。Googleはこうしたニーズに応え、好みのIDEやプログラマーエディタで作業できるActions SDKをアップデートしました。これにより、アクションプロジェクトでソース管理ツールや継続的インテグレーションツールを使いやすくなりました。
アシスタントプラットフォームにも新機能が追加されました。ホームストレージは、GoogleのスマートホームAPIの一部であるホームグラフで定義されているように、単一の家庭内の複数のセッションにわたって値を保存する方法です。これは、マルチユーザーアプリケーションを可能にする点で重要です。デモでは、ワードパズルなどのゲームが紹介されました。
警告しなかったとは言わないで
しかし、文書には赤い文字で強い警告が記載されている。「重要:個人データを保存するためにホームストレージを使用しないでください。ホームストレージのデータは、同じアクションを実行する同一世帯の複数の個人に適用されます。」
こうした警告に留意するのは開発者の責任となる。
Google アシスタントの Media API が更新され、デバイス間での再生と再開、および最初からではなく特定のポイントから再生を開始する一般的な機能が処理されるようになりました。
スマートディスプレイ搭載デバイスは、AMPコンポーネントフレームワークを使用して配信されるウェブコンテンツを表示できるようになります。最初のサポートはニュースサイトから始まり、今夏後半に提供開始予定ですが、今後さらに多くのカテゴリーに対応していく予定です。
最も興味深い新機能は「Continuous Match Mode(継続マッチモード)」と呼ばれるものです。これは、アシスタントデバイスが特に指示されなくてもどの程度会話を聞き取るかという、議論の的となっている領域に関わっています。現在、アシスタントのアクションを開始するにはウェイクワードを使用する必要がありますが、ウェイクワード(「Hey Google」または「OK Google」)を認識するためには、デバイスはある程度常時聞き取っている必要があります。ウェイクワードに続いて、サードパーティのアクションをカスタムで呼び出すことも可能です。
会話が始まると(アプリケーションの実行に相当)、システムはユーザーの言葉を会話の文脈において意味のあるインテントへと解析し、それに基づいたフローを実行します。アクションはフローが完了するまで継続されますが、アクションがユーザーのインテントを解析できない場合、あるいは「キャンセル」などのシステムコマンドの後には終了します。開発者は最初の終了コマンドを、最後の続行要求で上書きできますが、2番目の終了コマンドは上書きできません。
「マイクの状態が変わるのを待たずに、マイクをオープンのままにして、ユーザーがアクションでより自然に話せるようなエクスペリエンスを構築したい場合があります」とショジャイ氏はサミットと開発者向け投稿で述べた。
本日、Continuous Match Modeの早期アクセスプログラムを発表します。このモードでは、アシスタントがユーザーの発話に即座に応答し、より自然でスムーズな体験を実現します。これは透過的に行われ、マイクがオンになる前にアシスタントが「マイクは一時的にオンのままになります」とアナウンスするため、ユーザーは追加のプロンプトを待たずに自由に話すことができるようになります。
このモードについてはまだ公式ドキュメントが公開されていません。デモでは、楽しい漫画風の絵柄のゲームが使用されていましたが、この設定では、モードが有効な間、アクションがすべての情報をリッスンし続けることになるため、プライバシーに影響が出る可能性があります。
Shodjai氏は、ユーザーがContinuous Match Modeセッションをどのように終了するかについては説明していませんが、おそらく開発者が定義した終了インテント、または既存のアクションと同様にシステムインテントのいずれかによって終了すると思われます。それまでは、アクションは実行を継続できます。
追跡やデータ収集によるパーソナライゼーションと同様に、プライバシーとパーベイシブ コンピューティングは両立しません。新しい継続的一致モードでは、プライバシーがさらに損なわれます。®