科学者がフェイクニュースの早期警告システムを考案:AIが疑わしいドメインを指摘

Table of Contents

科学者がフェイクニュースの早期警告システムを考案:AIが疑わしいドメインを指摘

米国と英国の学者たちは、新しく登録されたインターネットドメインがいつ偽情報の拡散に使われるかを予測する機械学習ツールを作成した。オンライン通信チャネルが汚染される前に、こうしたサイトをブロックしたり閉鎖したりすることが期待されている。

最近公開されたワーキングペーパー「オンラインの虚偽情報提供者とその特徴のリアルタイム予測」では、Anil R Doshi (UCL 経営学部)、Sharat Raghavan (カリフォルニア大学バークレー校)、William Schmidt (コーネル大学) が、ドメイン登録データと Mozilla の Web 閲覧データを組み合わせて、どの Web サイトが虚偽のコンテンツを流布する可能性があるかを予測できる機械学習分類器を構築した方法について説明しています。

「ドメイン登録データを利用することで、アクターにとって操作が困難と言えるデータを用いた早期警戒システムを提供することができます」とドシ氏は声明で述べた。「偽情報を生み出すアクターは隠れた状態を好む傾向があり、私たちはそれをモデルに取り入れています。」

「偽情報」とは、偽情報、誤情報、捏造されたニュースを指す言葉です。これらは、正当なニュース報道のように見せかけ、公共の利益ではなく特定の目的のために作られた偽コンテンツです。このような悪質な捏造は、2016年の米国大統領選挙後に大きな懸念事項となりました。米国国家情報長官室は、この選挙をロシアによる影響力行使キャンペーンと表現しました[PDF]。このキャンペーンは、秘密裏にサイバー攻撃と「ロシア政府機関、国営メディア、第三者仲介者、そして有料ソーシャルメディアユーザー、いわゆる『荒らし』による公然たる活動」を組み合わせたものでした。

それ以来、虚偽情報は、学者、政策立案者、テクノロジー推進者、インターネットユーザー、そして企業から、ますます大きな懸念と監視の対象となっています。しかしながら、Google、Facebook、Twitterのように、エンゲージメントを高める虚偽情報の拡散から恩恵を受けている一部の企業は、収益を減少させる対策の実施を利己的に遅らせています。

ドナルド・トランプがフェイクニュースを読む

では、Google、Facebook、あなたはどれだけフェイクニュースをブロックできただろうか?ウェブの巨人たちは、欧州に自己評価の宿題を提出した。

続きを読む

ドーシ、ラガヴァン、シュミットは、ウェブサイトが虚偽情報の拡散を促進する役割に焦点を当てています。彼らは論文の中で、ウェブサイトは簡単に開設でき、閉鎖にも費用がかからないと指摘しています。そして、虚偽を拡散するサイトがシステムに浸透すると、偽情報の発信者はネットワークコミュニケーションのバイラル性を利用して、ソーシャルメディアネットワークを通じてメッセージを拡散することができます。

研究者たちは、被害が発生する前に、悪意を持って作られたウェブサイトを早期に発見することを望んでいる。

「私たちの早期特定システムは、政策立案者が、制裁の対象となる可能性のある領域や監視を強化する領域を優先することで、限られたリソースをより迅速かつ効果的に活用するのに役立つ」と論文は説明している。

分類器を構築するにあたり、専門家たちはパブリックドメイン登録から得られる様々なデータポイントを活用しました。例えば、請求先連絡先欄に個人名または組織名が含まれているかどうか、ドメイン拡張子、レジストラ、登録州と国、ドメイン名に政治用語が含まれているかどうかなどです。こうした分析は熟練した人間でも行うことができますが、機械学習によって自動化が実現され、悪質なサイトが拡散する前に迅速に検出・ブロックする上で鍵となります。

研究者のデータによれば、機械学習分類器はかなりうまく機能しており、2016年の米国選挙のために設定された偽情報ドメインの92%と正当な情報ドメインの96.2%を正確に識別しているという。

セキュリティ企業SophosLabsの脅威研究者ショーン・ギャラガー氏はThe Registerに対し、研究者の手法は情報セキュリティの専門家が使用する手法と類似していると語り、偽情報の背後にいる者は防御策に適応するため、偽情報の検出は本質的に信頼できないと警告した。

「この論文で説明されている機械学習技術は、フィッシング詐欺の可能性のあるドメインや詐欺ウェブサイトの検出に用いられてきた研究と非常によく似ています」と彼は述べた。「偽情報の戦術は、他のウェブ上の脅威と同様に流動的であり、その多様性によって100%正確な検出システムの構築は困難になる可能性があります。特に、偽情報の拡散経路は他にも存在することを考えるとなおさらです。」

関係する学者たちは、その点を十分理解しているようだ。彼らは、この機械学習分類器がテキストベースの分類器などの他のツールと組み合わせて使用​​されることを期待しており、「政策立案者が、あらゆる機械学習システムに内在する誤検知の可能性に基づいて行動を起こす可能性を軽減できる」ことを期待している。®

Discover More