最初はチェス、次に囲碁…そして今や、なんとAIシステムがカーリングで私たちに勝てるようになったのだ

Table of Contents

最初はチェス、次に囲碁…そして今や、なんとAIシステムがカーリングで私たちに勝てるようになったのだ

ビデオマシンは長年チェスで人間のプレイヤーに勝ってきたが、今度はカーリング選手が時々言うところの「氷上のチェス」でその開発者を圧倒した。

カーリングは、磨かれた重いストーンを氷の上で目標地点に向かって滑らせる競技です。ストーンを回転させてカールさせることもあります。様々なブール競技やシャッフルボードに似ていますが、チームメンバーが氷を「スイープ」してストーンの軌道を目標地点に向けるという要素が加わる場合があります。

カーリーと呼ばれるロボットが最近、韓国のトップクラスの女子カーリングチームと韓国の車いすカーリング代表チームと4試合を戦い、スイープ負けはなかった。

カーリーは、目標エリア付近の視覚データを収集する投擲ユニットと外部コンピューターで構成されているため、車椅子スタイルでプレイした。車椅子に乗っている人にとってもロボットにとっても、スイープは複雑な動作だったからだ。そして、カーリーは4試合中3試合に勝利した。

単独操縦士の写真(Shutterstockより)

さようなら、トップガン…AIソフトウェアが仮想ドッグファイト訓練で米軍F-16パイロットを5-0で圧倒

続きを読む

水曜日にサイエンス・ロボティクス誌に掲載された記事(購読が必要)に記されているように、カーリーの開発者たちは、深層強化学習(DRL)アルゴリズムを使用してロボットが変化する環境条件に即座に適応できるように訓練することで、この偉業を成し遂げた。

「カーリーは、ショットごとに継続的に発生する環境変化に対応できる適応行動を実行します」と、論文著者のウォン・ドンオク、クラウス=ロバート・ミュラー、リー・ソンファンは論文の中で説明しています。「これらの変化は、継続的に適切に補正されなければ、パフォーマンスに顕著な影響を与えます。」

Curly を作成するには、システムの設計者が環境要因 (温度、湿度、摩擦など)、内部要因 (ロボットがコマンドを正確に実行する能力)、プレイエリアの変化 (他の石の存在など) をモデル化する必要がありました。

Curly システムには、戦略 (ストーンをどこに狙うか) を計画する AI モデル、環境の変化に適応する適応 DRL モデル、および 2 つのロボット ユニット (スローワー ロボットとスキップ ロボット) が含まれています。

スキップロボット(「ハウス」(ターゲットエリア)に立って投手(スローワー)に指示を出す「スキッパー」)は、氷上のストーンの座標を取得し、AIモデルに送信します。AIモデルは、そのデータをカーリングシミュレーターに渡して最適な投球動作を考案します。投球戦略は、必要に応じて動的調整を行う適応D​​RLモデルに渡されます。その後、選択されたターゲット座標が投手に渡され、投手は理想的には計算された位置にストーンを押し込みます。この様子は、次の画像をご覧ください。

YouTubeビデオ

約1.3メートルの精度を誇るカーリーは、2018年冬季パラリンピックで各国の車いすカーリングチームが出した結果(0.8メートル~1.3メートル)と互角だ。スイープが許可された2018年冬季オリンピックでの0.2メートル~0.8メートルの精度ほど優れているわけではない。

それでも、数字は人間のプレイヤーが勝利するはずだったことを示唆しており、論文の著者らはなぜ勝利しなかったのかについていくつかの仮説を提示している。彼らは、プレイヤーがリラックスしすぎていた(カーリーが彼らに競争心を抱かせなかった)か、緊張しすぎてロボットに有利になったかのいずれかを示唆している。

また、AIは人間とは異なる方法で稀な出来事や不確実性を考慮しているため、AI戦略モジュールは人間のプレイヤーが考え出したものよりも優れたガイダンスを提供した可能性があると推測している。

いずれにせよ、研究者たちは、自分たちの研究が他のロボット設計者がリアルタイムのフィードバックを操作に組み込めるシステムを作るのに役立つことを期待しています。®

Discover More