米陸軍は、ロボットや戦車などに自然言語音声コマンドAIを開発している。捜索救助用。今のところは

Table of Contents

米陸軍は、ロボットや戦車などに自然言語音声コマンドAIを開発している。捜索救助用。今のところは

米陸軍は、戦場で兵士の口頭命令に従い、自然言語でコミュニケーションする能力を戦車、トラック、ロボットに与えるために使用できる機械学習ソフトウェアの実験を行っている。

陸軍戦闘能力開発司令部(DEVCOM)と南カリフォルニア大学の研究者たちは、JUDI(Joint Understanding and Dialogue Interface)の開発に取り組んでいます。これは、軍用機械向けの対話型AIシステムです。

ご想像のとおり、AppleのSiriやAmazonのAlexaのようなおしゃべりなデジタルアシスタントとは異なり、JUDIは誕生日や天気といった雑談向けには設計されていません。音声による指示に応答し、軍人が遭遇しそうな状況に対処するように訓練されています。

「これは、物理世界に存在するロボットとのタスク指向の対話とリアルタイムの感覚認識に基づく推論を伴う点で、現在のテキストベースのチャットボットやインテリジェントパーソナルアシスタントとは対照的です」と、DEVCOMのコンピューター科学者、フェリックス・ガービッツ氏は火曜日にエル・レグ紙に語った。

「最先端の自然言語理解および対話管理技術を活用した会話型AIを実現するために、統計的分類技術を採用しました。この統計的言語分類器により、自律システムは兵士のコミュニケーションの目的を認識し、その根底にある意図を実現するための行動を実行することで、兵士の意図を解釈できるようになります。」

米陸軍が配布したJUDI会話型ロボットの写真

捜索救助訓練中のAI駆動ロボット… 出典:アンジェロ・メヒア中尉(米陸軍)。クリックして拡大

このシステムは、捜索救助任務中に録音された兵士の会話から音声を認識するように訓練され、同様の演習に配備されたロボットに転送してテストされたと伝えられています。ロボットが自然言語による音声指示を理解し、実行することが期待されています。これを実現するには、分類器が認識した指示を必要な制御信号にマッピングできる必要があります。

たとえば、システムは「45 度回転して写真を送信してください」という文章を理解し、適切に回転して、接続されたカメラで写真を撮影し、送信する必要があります。

「この任務には、都市部の捜索救助や災害救助のシナリオのように、ロボットが都市環境を移動し、遠く離れた場所にいる人間と通信することが含まれていました」とガービッツ氏は述べた。

Microsoft HoloLensを装着した米軍兵士

国防総省の友人であるマイクロソフトが、米陸軍に12万台以上のHoloLensユニットを納入、契約額は「最大220億ドル」

続きを読む

「私たちは、LiDARスキャナーとRGBカメラを搭載した小型の携帯型地上車両プラットフォームを使用しました。この車両は、移動指示の実行、要求に応じた写真の送信、状況の更新、そして不明瞭な指示に対する説明の要求などが可能でした。」

研究チームは、より多くの自然言語コマンドを機械の能力にマッピングし、ソフトウェアがより多くの現実世界の会話例から学習できるようにすることで、JUDIを改良したいと考えています。また、ロボットにジェスチャーや表情を分析させるなど、コンピュータービジョンと自然言語処理を統合したいと考えています。

この技術を採用する将来の機械には、音声を拾うマイク、その情報を処理するコンピューター、そしてディスプレイ画面が搭載される必要がある。目標は、ロボットや車両が迅速かつ直感的にコミュニケーションをとれるようにすることだ。

「現在は捜索救助任務に重点が置かれているが、偵察、輸送、監視といった他の共同遠隔任務も可能である」とガービッツ氏は結論付けた。

研究者たちは、今後の論文で会話型 AI インターフェースについて説明する予定です。®

Discover More