コメントサムスンの人工知能戦略担当副社長、謎めいたチ・スイ氏が昨日、同社のGalaxyイベントでBixby 2.0のデモンストレーションを行った際、聴衆に拍手を促す必要に迫られた。新機能に驚きの静寂が訪れた後、彼は「拍手してください」と促した。
これはツイッター上で即座に嘲笑されたが、正直に言うと、2018年に実用的なAI搭載パーソナルアシスタントで人々を驚かせるのはそう簡単なことではない。サミュエル・ジョンソンの言葉を言い換えれば、良い部分は面白くなく、面白い部分は良くないということだ。
サムスンは「AI軍拡競争」で負けつつあると言われており、Bixby 2.0はそれに追いつこうとする試みです。Google(とFacebook)は膨大な個人データを蓄積し、他の場所から有用なコンテキスト情報を大量に収集しているため、彼らのパーソナルアシスタントAIは常に他の誰よりも賢くなるだろうというのが通説です。
これは、もう一つの極めて疑わしい通説と結びついています。それは、音声がアプリケーションやサービスとのやり取りの主流になるというものです*。この二つの「深遠な思考」を組み合わせれば、GoogleがAIを、そしてそれを通じて家電業界を掌握するという結論に至ります。SamsungはスマートフォンなどのIT機器に加え、白物家電や高級AV機器も幅広く展開しているため、当然ながらこの脅威を痛感しています。
プレゼンターが聴衆に拍手を促す必要があるときに、これはいつも素晴らしいサインです。これがBixbyの力です。#Unpacked #youcanclap
— マイケル・フィッシャー(@theMrMobile)2018年8月9日
しかし、もし通説が間違っていたらどうなるでしょうか?データの量よりも質が重要だとしたら?サムスンはBixby 2.0でまさにその可能性に賭けているようです。学業成績は控えめながらも、ジ氏はBixby 2.0開発のリーダーに選ばれました。彼らの取り組みを見れば、悪くない賭けに思えます。サムスンが今最も必要としているのは、機械学習の達人ではないのかもしれません。そして、ジ氏は機械学習の達人ではありません。
ギャラクシーイベントの膨大な観客から無関心を招いたのは、ジ氏がレストランを探し、タクシーを手配したことでした。それなら全く問題ないと思うかもしれません。別の例としては、「レイバーデーの週末にブルックリンで開催されるコンサート」を探すというものがあります。これらは標準的な確率分析と少しの位置情報があれば解決できるはずです。AIの魔法は必要ありません。
ジ氏はBixby 2.0の「会話型AI」のデモを行いました。コマンドは「最初の週末はどうですか?」です。
ジ氏は、ユーザーがYelpやTripAdvisorをインストールしなくても、Bixbyがレストランの情報とライブイベントリストガイドを取得できたことを非常に誇りに思っていました。これは、サムスンが水面下でコンテンツのライセンス取得に躍起になっていたことを示唆しています。少し時代遅れの見方をしますが、より良いBixbyを作るために必要なのはそれだけかもしれません。デモはこちらの44:40からご覧いただけます。
現在、消費者向け AI アシスタントを実装しようとしている人が直面している難問があります。それは、ソフトウェアが「スマート」であることを示すということは、根本的に押し付けがましく、迷惑なものにすることを意味するということです。
わあ、わかりました。AIがあるんですね
例えば、Android 9 Pie搭載の私のPixel 2 XLは、数日後には、より優れたAndroid 8 Oreoに面倒な手間をかけて戻される予定です。Pieにはいくつかの不具合がありますが、その代わりに提供されるのはナグウェアだけです。デフォルトでオンになっているのは、「機械学習が実装されています」と見せかけるためのものです。例えば、大切な人からのテキストメッセージへの返信定型文などです。Googleさん、ごめんなさい。あなたは変で、不気味で、邪魔な存在です。
アプリの起動時間を最適化し、バッテリー寿命を延ばす機械学習は個人的には良いのですが、Clippy The Paperclipはダメです。これはオリジナルのClippyよりもひどいです。「手紙を書こうとしている」時だけでなく、起きている間ずっと邪魔をしてくるからです。9Pieでは、この奇妙で邪魔な機能だけが新しい機能です。
おそらくアジア市場ではこうしたサービスが受け入れられるだろうが、人々がプライバシーを非常に厳格に守っているという問題に直面する。例えば、昨年Appleは機械学習(間違いなく)を使って就寝時間をアドバイスする機能を導入した。私は父親として想像できる限りロックンロールとは程遠い生活を送っており、就寝時間もほとんど変わらない。だが、ロボット乳母に就寝時間を指図されるなんて、とんでもない。さっさと出て行け。
何を言うべきかを指示しながらも、画像認識能力を実際に披露する
つまり、AIパーソナルアシスタントが提供できる、実際に役立ち歓迎される「助け」には限界があるということです。今、機械学習を活用したアドバイスを生活に取り入れようとしている人は、サミュエル・ジョンソンの格言「あなたが作り出す面白いものは、何の役にも立たない」に突き当たることになります。
もちろん、ここには大きな皮肉があります。ニューラルネットワークは音声認識を飛躍的に向上させたからです。音声認識は、ニューラルネットワークの概念が実用的に大きな恩恵をもたらしてきた唯一の紛れもない分野です。音声認識は、数年前には想像もできなかったほど優れたものになっています。しかし、それは主に言語モデルが明確に定義された問題空間であるためです。つまり、音素の数とそれらが表現できる単語の数には限りがあるのです(先駆者であるトニー・ロビンソンが、この仕組みについてここで明快に説明しています)。
テクノロジー企業はまさにそこを完璧に実現しなければならない。昨日、ジ氏がBixbyに初めて指示を出したところ、認識されなかった。Bixbyは彼の意図を理解できなかったのだ。テクノロジー企業は、私たちの行動を「スマート」な仕掛けで先回りしようとするのはやめ、基本をきちんと理解すべきだ。
もしかしたら、こんなもので私たちを驚かせるなんて、もう諦めた方がいいかもしれません。あるいは将来的には、観客に専用のテレプロンプター「COOL FEATURE: CLAP」を配布するかもしれません。もう気まずい沈黙は終わりです。®
*ブートノート
いいえ、私もです。些細な命令を声に出して言うのは、オフィスでも騒がしい家庭でも、まだ邪魔すぎるからです。トニー・スタークやラリー・ペイジなら、そうでもないかもしれません。