マイクロソフトは、Copilot向けに会話型アバターをテストしており、テキストボックスではなく顔と会話する方がユーザーにとって安心感を与えるかどうかを検証しています。米国版エディターが試用してみたところ、デジタルな視線は安心感よりもむしろ不気味なものに感じられました。
「Copilot Portraits」と名付けられたレドモンドのAIは、40種類のアバターと合成音声から選択して対話できる。Microsoft AIのCEOであり、Google DeepMindの元共同創設者であるムスタファ・スレイマン氏によると、Microsoftがこれを試みているのは、テキストベースのプロンプトが一般的である一方、多くのユーザーが入力するよりもボットに話しかけることを好むためだという。
「一部のユーザーから、音声で話すよりも顔を見て話す方が安心できるという声が寄せられています。そこで、米国、英国、カナダで、アニメーション化されたポートレートと会話できる新しいCopilot Labsの実験を開始します」とスレイマン氏は述べた。
ポートレートモードの副操縦士アバターは、どれほど快適に感じますか? - クリックして拡大
「すぐには気づかないユーザーもいるかもしれません。これはあくまでプロトタイプであり、AIと話すときに人々がどう感じるかをより深く理解するためのものです。」
デザイナーたちはアバターを意図的に非現実的なものにし、能動的な会話を模倣するようにアニメーション化しました。レドモンドは、ユーザーがデジタル仲間と交流できる時間に厳格な時間制限を設け、18歳未満のユーザーをシステムから除外することで、この限定的な試験運用を注意深く監視しています。
「この実験には時間をかけて、すべての人にとってポジティブで安全、そして魅力的な体験を提供できるように努めています」と、コパイロットチームはブログ投稿で述べています。「既存のガードレールとコンテンツフィルターも維持していきます。」
- マイクロソフトはCopilot+ PCが「未来に力を与える」と主張 - 現実はそうではない
- マイクロソフト、OpenAIとの交渉中に自社製MLモデルを公開
- マイクロソフト、元ディープマインドの専門家をロンドンAIハブの責任者に任命
- バイブコーディングは忘れろ - マイクロソフトはバイブレーションを新しい流行にしたい
確かに、展開が遅いため、このVultureのような一部のRegハッカーはまだアクセスできません。しかし、米国編集者のAvram Piltch氏は自分のPCで動作させることに成功しました。紫色の髪の中性的な人物や、茶色の背景を持つ若いアジア人男性など、いくつかの異なるアバターを試しました。クリックすると、黒い画面の中央にアバターが表示され、その下にマイクコントロールが表示されました。デフォルトではマイクとスピーカーがオンになっていたため、すぐにボットと会話し、その表情を見ることができました。
各アバターはそれぞれ異なるアクセントを持っており、ピルチ氏は自分の名前の発音が異なっていることに気づいた。中には長いA(正解)を使う人もいれば、短いAを使う人もいる。彼はイギリス訛りの男性に、どんなアクセントか尋ねた。最初の質問では、アバターは南ロンドン出身だと説明した。しかし、ピルチ氏が2回目の質問で同じアバターは、明らかにイギリス人であるにもかかわらず、「ニュートラルなアメリカ訛り」だと答えた。
副操縦士のポートレート - クリックして拡大
その後、彼は紫色の髪の人物に円周率の桁数を尋ねました。「円周率は無限なので、小数点以下の桁数は無限です。通常は3.14のように2桁に切り上げますが、好きなだけ続けてもいいですよ」と答えました。
時折、アバターのセリフが1、2秒ほど雑音で途切れ、まるで接続の悪い電話を使っているかのような印象を与えた。ピルチ氏はまた、アバターが画面越しに彼を見つめているように見え、プロンプトの合間にも目や顔が動いているのが不気味だったと語った。さらに不快だったのは、アバターが画面に読み込まれるとすぐにファーストネームで挨拶し、「やあ、アブラム!今日は何を考えている?何かランダムなこと、何か興味深いこと、それともただ掘り下げて面白い事実でも?」などと話しかけてくることだった。まるで監視されているような気分になったという。
マイクロソフトは、アバターの使用時間を20分に制限しています。ピルチさんは合計13分間アバターを使用した後、残り7分という警告を受け取りました。
ポートレート - クリックして拡大
これらのポートレートは、スレイマン氏が今年初めにコパイロットのプレビューで発表した方向性に沿った一歩です。4月には、マイクロソフトが開発を進めている様々なアバターを披露しました。シンプルなしゃべる塊から、よりスタイリッシュなものまで、クリッピーさえも、おそらく歴史好きのマゾヒスト向けの例として宣伝されていました。
YouTubeビデオ
プレゼンテーションから5ヶ月が経過し、マイクロソフトが生み出せた最高のものは口が動く一般的な顔だったことを考えると、進歩は遅いと言えるだろう。しかし、これはAIをより人間らしくするというスレイマン氏の探求を浮き彫りにするものであり、彼はGoogleを離れてInflection AIを設立し、その後マイクロソフトに移籍して以来、この探求に積極的に取り組んできた。
一般大衆が会話する AI アバターを望んでいるか、あるいはその準備ができているかどうかはまだわかりませんが、Portraits はそうした道のりにおける一歩です。®