暴徒の皆さんへ:スカーフや帽子で顔を隠しても、このAIシステムは騙せません

Table of Contents

暴徒の皆さんへ:スカーフや帽子で顔を隠しても、このAIシステムは騙せません

研究によると、ソフトウェアは略奪者や暴徒、その他スカーフや帽子、眼鏡で顔を隠している人物をかなり正確に識別できるという。

英国ケンブリッジ大学、インド・ワランガル国立工科大学、インド科学研究所の研究者チームによる論文では、いわゆる偽装顔識別(DFI)のために畳み込みニューラルネットワークをどのようにトレーニングできるかが説明されている。

ケンブリッジ大学工学部のアマージョット・シン氏は火曜日、レジスター紙に対し、DFIは「法執行機関にとって非常に興味深い技術であり、犯罪者を特定するために活用できる。これが、私たちがこの問題を解決しようと試みた主な理由だ」と語った。

この研究では、サングラス、ひげ、ヘルメットなど、衣服の一部を使って顔を隠した人々の画像を数百枚提示することで、畳み込みニューラルネットワークを学習させた。各画像には、眉毛と目の部分を記憶するためのマーカーが10個、鼻に1個、唇に3個の計14個のポイントが特定された。

すべての点がつながり、研究者たちが「スターネット構造」と呼ぶものを形成します。ネットワーク上の点間の距離と角度を分析することで、サングラスやバラクラバなどで顔が隠れている場合でも、人の顔の構造を学習します。

ここで理解すべき重要な点は、システムが、隠された顔のピクセルからこれらのマーカーを識別するように訓練されているということです。システムは、マスクされた頭部を撮影し、そこから14個のポイントから、いわば人物の顔の構造を表す指紋を作成するように訓練されます。

これらのポイント、つまり顔の指紋は、より大きなデータベース(DFIの機械学習システムがこれまで見たことのない写真のデータベース、例えば運転免許証の写真や問題を起こした人物の顔写真のライブラリなど)をスキャンし、一致する可能性のあるものを特定するために使用できます。

つまり、暴動の監視カメラ映像から切り取った静止画を見せれば、プログラムは直感的に14個のマーカーを配置する。そして、そのマーカーのパターンを用いて、データベースに登録されている顔と照合する。すると、犯人の正体がばれるのだ。

理論上はそうなるはずです。これはまだ概念実証の段階です。

5人の異なる参加者の画像。上段はクリーンな入力画像。2段目は14点をマッピングしたもの。3段目はスターネット構造を示している…クリックして拡大(写真提供:Singh et al)

さまざまな変装をした人物の画像 1,000 枚がトレーニングに使用され、そのうち 500 枚は検証用に、さらに 500 枚はテスト用に確保されました。トレーニング データセット、検証データセット、テスト データセットの違いについては、こちらで説明されています。

シン氏は、この技術が警察による犯罪者や略奪者の摘発に役立つことを期待しているものの、独裁政権がデジタル技術を用いて無実の人々の身元を暴き、正当な抗議活動家や活動家を犯罪者に仕立て上げるのではないかと懸念する声も上がっている。シン氏は、プライバシーや集会の権利の侵害に関する懸念には同意する一方で、この技術は「多くの犯罪者を街から排除する」ことにも活用できると述べた。

「この技術が悪者の手に渡らないようにするためには、この技術は善のために使用したいと考えている組織にのみ利用可能であることを認識する必要がある」と彼は述べた。

AIは依然として簡単に騙される

このコンピュータービジョンシステムの精度は初期研究では良好ですが、実用レベルではそれほど優れているわけではないことを認識することが重要です。背景に建物や物体が入り込むと、精度は85%から56%に低下します。

顔が隠れているほど、認識は難しくなります。帽子、スカーフ、眼鏡を合わせていると、精度は43%まで低下します。また、すべてのトレーニング画像には、カメラに向かっている人物がはっきりと写っています。これは、防犯カメラのぼやけた静止画ではなかなか見られない光景です。こうした素材の多くは、カメラに対して様々な角度で立っている人物を映しています。さらに、映画『Vフォー・ヴェンデッタ』のような、顔全体を覆い隠すマスクを着用した人物は、常に認識を誤るという事実もあります。

システムの精度率表

参加者に様々なアイテムやポーズを着せ、写真を撮って顔をマッピングしてもらうには費用がかかるため、トレーニングデータセットもかなり限られています。シン氏によると、参加者には30分のセッションで約10ドルが支払われたとのことです。

「現在のデータセットには10​​種類の変装が含まれており、主にインド人と一部の白人で構成されています。DFIシステムの有効性を高めるには、他の民族の変装も含め、より多くの変装を含める必要があります」と彼は付け加えた。つまり、抗議活動に参加する人が白人かインド人でなければ、運が悪いということだ。

今のところ、これは実験段階のシステムです。様々なタイプの人間の顔の特徴を正確に識別し、人物の顔とわずかに似ているだけの物体に惑わされず、誤認識も起こさないよう、さらに何千枚もの画像を学習させる必要があります。

これを大規模に実現するには、より効率的なアルゴリズムとコードが必要になります。しかし、まだそこまでには至っていません。

研究者たちは、今週ジャック・クラークのImport AIニュースレターで発掘された研究成果を、来月イタリアのヴェネツィアで開催されるIEEE国際コンピュータビジョン会議ワークショップで発表する予定です。®

Discover More