アメリカ政府は、戦場を「制圧」するために、自律型AI搭載ドローンや車両群を完成させていると発表

Table of Contents

アメリカ政府は、戦場を「制圧」するために、自律型AI搭載ドローンや車両群を完成させていると発表

米陸軍研究所は、ドローンや自律走行車の群れを制御し、アメリカの敵を圧倒して支配するための強化学習アルゴリズムの実験を行っていると発表した。

「群がるこれらの車両に対する最適な誘導方針をリアルタイムで見つけることは、戦闘員の戦術的状況認識を向上させ、米軍が競争環境で優位に立つための重要な要件です」と、米陸軍の技術者中枢である米陸軍戦闘能力開発司令部の科学者ジェミン・ジョージ博士は述べた。

ジョージ博士とその同僚は、階層的強化学習(HRL)を用いてエージェントをグループにまとめ、大規模な群を制御する手法を開発しました。ドローンの制御を集中型アプローチから階層型設計に移行することで、ソフトウェアの学習時間が80%短縮されたと報告されています。

重要なのは、訓練された無人機の群れを一連の指示に従って特定のエリアに送り込み、各集団が自動的に隊列を維持し、指示を遂行できるという点です。つまり、人間の操縦士は個々のドローンや車両を気にする必要はなく、グループを地図上の特定の位置に誘導するだけで済みます。機械は自ら位置を把握し、チームとして指示された場所へ向かい、まるで戦闘部隊のように意図された通りに連携して行動することを学習します。

陸軍の研究者たちは、地上車両と航空機の連携のための階層的な制御を構想している。(米陸軍の図)

地上と空中の自律車両連携に対する階層的アプローチを示す米陸軍の図

「私たちの現在のHRLの取り組みにより、無人航空機や地上車両の群れに対する制御ポリシーを開発し、群れを形成するエージェントの個々のダイナミクスが不明であっても、さまざまなミッションセットを最適に達成できるようになります」とジョージ博士は述べています。

研究チームは、自動運転ロボット戦車と飛行ドローンが自律的に連携し、地上と空中を調査する未来を思い描いている。「スウォームは、密集した都市部での継続的な監視・偵察、そして前方展開基地や高価値資産の境界防衛に活用できる」と、同氏は本日The Register紙に語った。

arXivで公開された論文で説明されている強化学習技術は、複数のエージェントを異なる状態で訓練する方法を提供します。「各階層には、それぞれローカル報酬関数とグローバル報酬関数を持つ独自の学習ループがあります」とジョージ博士は述べています。「これらの学習ループを並列に実行することで、学習時間を大幅に短縮することができました。」

このアルゴリズムは主にシミュレーションでテストされています。ジョージ博士はEl Reg誌に対し、数十から数百台の機械が群れを構成していると述べましたが、チームはこれまでのところ、ある部屋の中で4機のクアドローターを用いてこの手法を物理的にテストしただけです。

「アルゴリズムを現実世界に適用する前に、シミュレーションと実際の物理的な資産を使用した実際の作業の両方で、広範なテストと評価が必要です」と彼は結論付けました。®

Discover More