ドローンに搭載されたビデオカメラは、航空写真撮影をより身近なものにするのに役立っています。また、機械学習ソフトウェアを使用することで、将来的には新進の映画製作者を支援することもできるかもしれません。
米国のカーネギーメロン大学(CMU)と日本のヤマハ発動機の研究チームが、ドローンを単純な映画撮影(または監視)にどのように使用できるかを示す論文を発表しました。
「自律空撮は、人間の介入を必要とせずに美的に美しい動画を自動的に撮影することを可能にし、個人に高級映画スタジオの能力を与える可能性がある」と、彼らは先月末にarXivの論文に記した。
この計画では、長時間にわたって特定の角度からシーンを撮影するために、ドローンを適切な位置に飛行させ続けるための慎重な制御が必要であり、これらすべてを自律的に行う必要がある。
研究者たちは、ドローン撮影に広く利用されている民生用ドローン、DJI M210を訓練し、カメラからの画像を分析することで、自律的にシーンを撮影できるようにした。ドローンは畳み込みニューラルネットワークを用いて、学習済みの物体(今回の場合は人間、車、自転車のみ)を識別し、それらの周囲に境界ボックスを配置する。
地上設置型のギズモは、画像の焦点を維持するためにターゲットからの最適な距離を計算し、バウンディングボックスの中心を画面上の目的の位置に保つためにドローンの軌道を変更し、障害物を回避する方法を学習します。これにより、人、車、自転車を追跡します。
すべてのソフトウェアは、8GBのメモリと59.7GB/秒のメモリ帯域幅を備えたPascal GPUを搭載したポータブルなNvidia Jetson TX2デバイス上で約300ミリ秒で実行されます。ドローンは秒速7.5メートルでゆっくりと移動し、バッテリーが切れるまで約25~30分間撮影できます。
撮影した映像の例を以下に示します。
YouTubeビデオ
まあ、ミッション・インポッシブルとまではいかないでしょう。今のところ、単一の物体にしか焦点を合わせることができず、壮大なカーチェイスを撮影したり、複雑な背景を持つ特にノイズの多いシーンをドローンで撮影できるようになるまでには、まだしばらく時間がかかるでしょう。
チームが取り組んでいるアイデアには、1つのシーンに複数の人物を登場させること、さまざまな種類の芸術的なショット、俳優の動きに焦点を合わせること、さらには複数のドローンを制御することなどが含まれていると、論文の共著者でCMUの博士課程の学生であるロジェリオ・ボナッティ氏はThe Registerに語った。
「(私たちは最近、複数の人物を一つのシーンに登場させ、視覚入力のみを使って俳優の位置を特定する実験を行いました。通常は、ドローンが最初に人物、車、自転車の検出アルゴリズム(想定される俳優の種類によって異なります)を使用し、より高い信頼性で位置を特定できる俳優に焦点を合わせます。」
最初の検出後、ドローンは新しいフレームにわたって画像テンプレートを追跡し、例えば俳優を見失うなど、信頼度が閾値を下回るまで追跡を続けます。この時点で、検出フェーズに戻ります。将来的には、ドローンがシーン内の複数の俳優を考慮して、より複雑な判断を下せるアルゴリズムを研究する予定です。
飛んでスパイする
スリラーや自然ドキュメンタリーのアクション満載のシーンを撮影するためにドローンを使うのは素晴らしいことですが、もっと悪質な目的で使用される可能性もあります。もしドローンが特定の人物を追跡するように訓練されていたらどうなるでしょうか?
科学者たちがAI搭載の自動飛行可能な最小ドローンを開発
続きを読む
「このような技術は、建設的な用途だけでなく、悪意のある用途も数多く考えられる」と、AIの潜在的な危険性を調査した論文の共著者で、CMUとヤマハの研究を最初に紹介したOpenAIの戦略・コミュニケーションディレクター、ジャック・クラーク氏は述べた。
「ここでの主な危険なケースは、監視アプリケーションや、監視プラットフォームを潜在的に兵器化してペイロードの配信も実行できるようにすることだと私は考えています。ただし、これにはさまざまな他の研究が必要です」と彼は私たちに語った。
ボナッティ氏もこれを認め、大学や政府がそのような技術を規制すべきだと述べた。
「他のテクノロジーと同様に、AIは高潔な目的にも邪悪な目的にも使用できるツールだ」と彼は語った。
研究者として、私たちは人々の生活を向上させる技術の側面に焦点を当てています。大学と政府の両方が、技術の利用をある程度規制し、プロジェクトが社会の利益のために開発されていることを確認するべきだと考えています。
「規制をどのように行うべきかは難しい問題です。なぜなら、制限が多すぎると、国におけるイノベーションが阻害される可能性があるからです。」®