AIが生成した、作成者の意図を何でも発言できる「ブラックハット・ディープフェイク」は、その検知がますます困難になっている。しかし、科学者たちは真実の探求に、意外な仲間、ネズミを協力させている。
ラスベガスで開催されたセキュリティカンファレンス「ブラックハット」でのプレゼンテーションで、データサイエンティストらはディープフェイク動画を識別するためのさまざまな方法を検証した。これは2020年の米国選挙が近づくにつれてますます重要になるだろう。
GSIのデータサイエンスディレクター、ジョージ・ウィリアムズ氏は、AIはディープフェイクの見分けが人間よりも得意だと説明した。今年初め、人間と敵対的生成ネットワーク(GAN)がディープフェイクの選別を行うというテストが行われたが、炭素ベースのヒューマノイドは88%のフェイクを見分けるという好成績を収めた。一方、機械は平均92%の見分け率にとどまった。
「かなり良いように思えますが、ソーシャルメディアに投稿できるコンテンツの量を考えると、多くの間違いや誤検知が発生するでしょう」と彼は述べた。「一部のコンテンツは人間と機械の両方をすり抜けてしまうでしょう。」
ブルームバーグLPのデータサイエンスソフトウェアエンジニア、アレクサンダー・カマーフォード氏は、解決策の一つはより大規模で優れたAIシステムを構築することだと述べた。そして、ディープフェイクの氾濫は、当初はそれほど悪くないかもしれない。
「ディープフェイクを作るのは本当に難しい。悪名高いオバマ大統領のディープフェイクは、大統領演説の映像から17時間かけて作られた」とカマーフォード氏は述べた。「著名人でなければ、17時間というデータ量は膨大だ。CPUでの学習には2週間、GPUでは2時間かかり、歯などの最終的な仕上げにどれくらいの時間がかかるのかは不明だ」
ディープフェイクの問題に対処するために、より高度なGANSを開発することは可能ですが、AIシステムは人間の声のピッチやトーンをうまく処理できないため、依然として問題が残ります。音声の周波数は、その解決策の一つとなるかもしれません。例えば、bとvは似た発音ですが、周波数は全く異なります。
Facebookはディープフェイクを撲滅しない?それなら、ユーザーが投稿したコンテンツから守る貴重な法的保護を剥奪しよう。
続きを読む
しかし、もっと優れた能力を持つ生物システムも存在します。オレゴン大学の大学院生、ジョナサン・サンダース氏は、マウスは実はかなり人間の声を聞き分けるのが得意で、訓練すればそうできるようになると説明しています。
研究チームはマウスに人間の音声を認識させる訓練を行い、単純な音声では75%の認識率を達成しました。複雑な語彙では65%まで低下しましたが、マウスの脳神経パターンを観察することで、AIシステムの偽動画検知能力向上に役立つ重要なツールとなる可能性があると研究チームは考えています。
「聴覚システムを使うべき時が来たと考えています。マウスに偽の音声と本物の音声を識別できるように訓練するべきです」と彼は言った。「人間は偽の音声を見抜くのが得意ですが、これは猫とネズミの追いかけっこになるでしょう。」[聴衆からくぐもったうめき声が上がる]
研究の全文は[PDF]からご覧いただけます。®