正直に言うと、昨年の爆発的な盛り上がりにもかかわらず、チャットボットは簡単な質問をしたり答えたりする程度しか進歩していません。それでも、研究者たちは完璧なデジタルアシスタントという夢を諦めていません。
ボットが真に役立つものになるためには、単なる単純なユーザーインターフェース以上のものが必要です。より複雑な会話をこなす必要がありますが、これは容易ではありません。複雑な会話の中でも、あまり注目されていないのが交渉です。開発者たちは現在、飛行機の予約やレストランの予約といった特定のタスクをこなすボットを開発していますが、これらの仕事では、両者の目的は同じです。つまり、誰かを飛行機に乗せたり、テーブルを探したりすることです。
もし彼らが同じものを望んでいなかったらどうなるでしょうか? 実は、交渉術を習得したチャットボットは、自分の望みを叶えるために嘘をつくことがあるようです。人工知能は優しくなければならないなんて誰が言ったのでしょうか?
実験では、Facebook AI Research (FAIR) チームが 2 つのボットに交渉タスクを提示して、互いに交渉する方法を学習させました。
両エージェントには同じ数のオブジェクト(本2冊、帽子1個、ボール3個)が提示され、それらを2人で分け合うことになります。各エージェントは、それぞれのオブジェクトの種類によって獲得できるポイントが異なるため、それぞれ異なるものを欲しがるようにプログラムされています。目標は、両方のボットが妥協し、どちらもそれなりのスコアを獲得することです。
水曜日にオンライン公開された論文で、この交渉を実現するための「対話ロールアウト」と呼ばれるソフトウェアシステムが説明されている。論文の筆頭著者でFAIRの研究者であるマイク・ルイス氏と、共著者でジョージア工科大学の助教授であるドゥルブ・バトラ氏がThe Register紙に説明した。このシステムにより、ボットは事前に計画を立て、推論できるようになるという。
「チェスや囲碁のようなゲームでは、様々な可能性が考えられるため、エージェントはどのような反撃をするかを検討する必要があります。[ダイアログロールアウト]も同様の考え方に基づいています。『私がこう言ったら、あなたは何と返答しますか?』
候補者の応答に基づいて、ボットはさまざまな応答をシミュレートし、どの応答を使用するかを決定します。
ボットは教えられた単語を使ってしか会話できません。学習データは、Amazon Mechanical Turkサービスのために一生懸命働く人間によって生成された、合計約1,000語を含む5,808件の人間の会話から作成されました。ボットは、人間の妥協の仕方を真似て学習し、特定の状況で相手が何を言うかを予測しようとします。
チームは予測フェーズに教師あり学習を、ボットが返答すべき回答を選択できるように強化学習を組み合わせました。ソフトウェアエージェントが交渉から離脱するか、10ラウンドの対話で合意に達しない場合は、どちらも0ポイントしか獲得できないため、取引を仲介することが両者にとって有利になります。
最も興味深い戦術は、嘘をつく能力でした。ボットは、実際には欲しくない物に興味があるふりをし、交渉の過程でそれを手放したふりをすることもありました。
「彼らは、ゲームの報酬を与えられた場合に有効な戦略を発見したため、嘘をつくことを学んだのです。おそらく、トレーニングデータセットで数回発生したのでしょう。Amazon Mechanical Turkでは人間は嘘をつく傾向がないため、これは稀な戦略です」とバトラ氏は述べた。
ここで学んだ交渉プロセスを、ボットを使用して誰かとの会議を予約したり、製品を売買したりするなど、パーソナルアシスタントにとって便利な機能など、他の設定に拡張できることが期待されています。
Facebookのメッセンジャープラットフォーム向けアシスタント「M」は現在開発中のプロジェクトです。リリース時の期待は、ステッカーの推奨、位置情報の共有、UberやLyftの配車依頼など、限られた機能しか実行できないことが明らかになり、期待は裏切られました。
研究者らは、対話のロールアウトをMに適用する計画はすぐにはないと述べた。しかし、交渉コードをGitHubで公開することで開発者に開放した。®