チャットボットやバーチャルアシスタントの対応は非常にイライラするものなので、人間が不機嫌になり始めるのは普通のことです。
機械が皮肉を返してくれれば、このようなやりとりはもう少し面白くなるだろう。しかし残念ながら、コンピューターは皮肉を全く理解できないため、それが実現するまでにはしばらく時間がかかるだろう。そこで、米国オレゴン州立大学の研究者たちは、ニューラルネットワークを用いてソフトウェアに皮肉を返せるように学習させようと試みている。
難しいですね。コンピューターは、誰が何を言っているのか、会話の文脈、そして多くの場合、現実世界の事実に基づいて、文化的な言及を理解する必要があります。機械に単文を入力するだけでは効果がないことが多く、個々の発言が生意気なものであるかどうかを人間が判断するのも難しいのです。
そこで研究者たちは、個々の文だけでなくその前後の文も検査するように設計されたシステムを構築した。このモデルは、複数の双方向長短期記憶ネットワーク(BiLSTM)をつなぎ合わせたもので、皮肉なコメントを約70%の確率で正確に検出した。
「典型的なLSTMは、データ(つまり文)を左から右へ読み取り、エンコードします。BiLSTMは、文を左から右、右から左へと処理します」と、arXivの研究論文の共著者であり、オレゴン州立大学の博士課程学生であるレザ・ガエイニ氏は、今週The Registerに説明した。
各位置におけるBiLSTMの結果は、各位置の前方エンコードと後方エンコードの連結です。したがって、各位置には文全体に関する情報(前に何が見られ、後に何が見られるか)が含まれるようになります。
では、皮肉を学ぶのに最適な場所はどこでしょうか?もちろん、Redditの掲示板です。SARC(分かりますか?)と呼ばれるデータセットには、皮肉なものもそうでないものも含め、数十万ものコメントや返信が含まれています。
「機械にとっても人間にとっても、文脈なしで皮肉を区別するのは非常に難しい」と、SARCの作成に協力したプリンストン大学の大学院生、ミハイル・コダック氏は以前エル・レグ紙に語っている。
「私たちのコーパスの利点の1つは、各発言の前のテキストと発言者を提供していることです。そのため、アルゴリズムは会話の文脈で皮肉なのか、それとも発言者の過去の発言の文脈で皮肉なのかを判断できます。」
厚かましい
まず、トレーニングデータセット内の文がベクトルに変換されます。これらのベクトルは「アテンション関数」に渡されます。アテンション関数とは、ニューラルネットワークがどの単語に注目するかを決定する方法を説明する専門用語です。
「アテンション機能は、コメントやレスポンスから関連情報を抽出するのに役立ちます。人間が一対の文を読むとき、その文に存在する依存関係を自動的に抽出します。ディープラーニングモデルでは、この動作をシミュレートするメカニズムを使用する必要があります。」
専門家がアダム・サンドラーの映画と同じくらい面白い AI ジョークマシンを開発(ひどい)
続きを読む
その後、モデルは以前のエンコードを再読み込みし、皮肉なコメントまたは返答として分類される前に文脈を理解しようとします。その精度は69.45%でした。
ニューラルネットワークはブラックボックスのように動作し、その決定を理解して解釈するのは難しいが、システムは皮肉に関連する特定の単語を拾っているようだとガエイニ氏は語った。
「コメントと返答のペアを表示しました。コメントは『映画館で隠し持っていた武器が暴発し、男性が誤って自分自身を撃った』で、返答は『これは憲法修正第2条に基づく権利を行使した、責任ある銃所有者の一人に過ぎない』です。これは皮肉な返答であり、私たちのモデルもこれを皮肉な返答として認識しました。」
「回答中の『責任がある』という言葉は、皮肉な意図を伝えるキーフレーズのようです。『男性が誤って撃つ』というフレーズと組み合わせると、最も顕著になり、最終的な予測に最も大きな影響を与えることが示唆されます。」
しかし、このモデルが長めの会話における、よりニュアンスのある皮肉なジョークを理解できるとは期待しないでください。1つのコメントにつき最大200語、それに続く返信につき最大100語しか処理できないからです。インターネット上でのシンプルで短いやり取りに対応するように設計されており、Google HomeやAmazon Alexaにはすぐには対応しません。
「人間とコミュニケーションできるAIシステムの開発は、この分野の研究者にとって古くからある興味深い目標です」とガエイニ氏は結論付けた。
近年、対話システムは研究者から多くの注目を集めています。しかしながら、既存のアプローチでは皮肉なユーザーコメントを検出し、適切な応答を提供することがしばしば困難です。よりリアルな対話システムを提供するためには、ユーザーの応答における皮肉な意図を検出できる必要があります。®