「インターネットで見たものを信じてはいけない」と、明らかにAIアルゴリズムを使って動画クリップを加工し、YouTubeに投稿している技術者が警告した。
結果として得られるデジタル加工された素材は、コメディアンが有名人の真似をする場面で、風刺対象のスターの顔に合わせて顔を変えたものから、ヒース・レジャー演じるジョーカーの顔を他の映画のキャラクターに重ねたものまで多岐にわたる。これらの加工は、ディープフェイクニューラルネットワークアルゴリズムを用いて行われているとされている。
ロシアの研究者たちが先週、AIを用いて油絵の肖像画や写真を話す顔に蘇らせ、話題をさらった。ディープフェイクを作成するためのツールは、適切なスキルさえあれば誰でも簡単に入手できるということを改めて思い起こさせる。YouTuberのCtrl Shift Faceが投稿した加工動画は、特に不気味だ。
特定の映画クリップに登場する登場人物の顔は、最初は普通で見覚えのあるものですが、徐々に別人に変化していきます。そして、映画『ファイト・クラブ』のワンシーンで、俳優のエドワード・ノートンが突然ブラッド・ピットに変身するシーンも見られます。下の動画で実際にご覧ください。クリップ開始から42秒あたりで変化が見られます。
瞬きするとトランジションを見逃してしまいます。全体的な効果はうまく機能していますが、ノートンが立ち上がったときに何かがおかしいことに気づくので、完璧ではありません。
YouTubeビデオ
別のクリップでは、コメディアンのビル・ヘイダーがテレビのトークショー司会者コナン・オブライエンとのインタビュー中に、俳優のアル・パチーノとアーノルド・シュワルツェネッガーの真似を披露し、徐々に顔が変化。二人の真似をしています。こちらのクリップはさらに印象的です。
これは、実際に話していない言葉を説得力を持って言わせることがいかに簡単であるかを示しています。
YouTubeビデオ
そしてこちらは、ヒース・レジャーが演じたジョーカーで、ウィリアム・サッチャー役を演じた『A Knight's Tale』です…こちらもヒース・レジャーが演じています。
YouTubeビデオ
目に宿る真実:AIが操作した偽の「ディープフェイクス」動画が瞬きしない視線で見破られる
続きを読む
動画は徐々に再生回数を増やし、合計で300万回以上再生されています。非常に説得力のある作品もあれば、そうでない作品もありますが、アマチュア作品のように見える作品としては悪くない出来栄えです。
Ctrl Shift Faceが投稿したこれらのクリップはすべて、広く入手可能なトレーニングデータを使用している可能性が高い。ニューラルネットワークモデルのトレーニングには、被写体の映画やテレビ出演時の静止画が大量に利用可能だ。これらの動画は、おそらく、各クリップを顔スワッピングアルゴリズムに通して、各フレームの顔を別の顔に置き換え、必要に応じて自動的に調整し、適切なタイミングで手動で加工されたクリップを加工されていないクリップにフェードイン/フェードアウトさせ、最終編集版を新しい動画として保存することで制作されている。
たとえば、『ファイト・クラブ』のシーンでは、フェイススワップ方式を使用して、モデルにエドワード・ノートンの顔をブラッド・ピットの顔に置き換えるように指示し、その後、必要に応じて変更されたクリップを元のクリップにフェードインおよびフェードアウトさせます。
ほとんどのディープフェイクソフトウェアは、顔の特徴を検出するアルゴリズムを使用し、ある顔を別の顔にマッピングすることで、表情をリアルで自然なまま再現します。場合によっては、高度なAIソフトウェアは不要で、標準的なポストプロダクションツールで実現できます。
このチャンネルに次に投稿される動画は、『ターミネーター2』のワンシーンでアーノルド・シュワルツェネッガーの顔をシルベスター・スタローンの顔に変えるというものだ。Ctrl Shift Faceがこれらのディープフェイクと思われる映像クリップをどのように作成しているのか、そしてこのような不気味な結果を得るためにどれだけの計算量とアルゴリズムのトレーニングが必要なのかは、完全には明らかではない。
Ctrl Shift Faceにコメントと詳細を問い合わせました。この最新の取り組みが示すのは、技術が進歩するにつれて、インターネット上のどこかであなたの顔や声さえも見つけられれば、同じようなトリックを実行することが難しくなくなるということです。®