コンピューター科学者のグループが、ソーシャルネットワークに潜む偽のプロフィールを嗅ぎ分ける機械学習アルゴリズムを開発した。
Facebookの友達とあなたとは共通の友達がいる可能性が高いです。また、Twitterでは、共通の興味を持つフォロワーがあなたと同じ人をフォローしている可能性もあります。
ソーシャルネットワークにおけるこれらの関連性は、グラフ上でエッジとしてモデル化することができ、ユーザーは頂点またはノードとなります。イスラエルのベン=グリオン・ネゲブ大学と米国のワシントン大学の研究者たちは、頂点間にエッジが存在する確率を測定する教師なし学習アルゴリズムを開発することで、偽のソーシャルメディアアカウントを探しました。
確率の低い辺を多く持つ頂点(またはアカウント)は、おそらく偽物であるという兆候だと、今月「ソーシャルネットワーク分析とマイニング」誌に掲載された論文で研究者らは説明している。
偽のプロフィールは通常、怪しいウェブサイトへのリンクを自動的にスパムしたり、偽情報を拡散したり、フォロワー数を増やしたり、悪口を言ったりするボットによって運営されています。
「ユーザーのプライバシー保護の失敗や、ロシアが選挙に影響を与えるためにソーシャルメディアを標的に利用しているという最近の憂慮すべきニュースを受けて、偽ユーザーの根絶はこれまで以上に重要になっている」と、研究の筆頭著者でBGU大学ソフトウェア・情報システム工学部の研究者ディマ・ケイガン氏は述べた。
科学者たちは、精密なターゲット広告を使ってFacebook中毒者から個人情報を吸い上げる新しい方法を発見した
続きを読む
グラフ構造を分析し、頂点間の弱いリンクを探した後、分類器はグラフを再度スキャンし、異常である可能性が高いリンクをハイライト表示します。グラフ内の辺の数や、存在確率が低い辺の数などの特徴を探します。
論文によると、「私たちは記述された特徴を使用して、すべての頂点をさまざまな特徴でランク付けし、異常である可能性が最も高い上位の頂点と最も低い下位の頂点を手動で検査しました」。
研究者たちは、このアルゴリズムを10種類の異なるネットワークでテストしました。中には完全にシミュレーションされたもの、YelpやArXivのような現実世界のネットワークにシミュレーション上の異常な頂点を追加したもの、そしてTwitterのようにラベル付けされた異常な頂点を持つ現実世界のネットワークも含まれています。
結果は、アルゴリズムが優れたパフォーマンスを発揮し、真陽性率が高く、偽陽性率が低いことを示しています。
「全体的に、この結果は、現実の友情のシナリオにおいて、Twitter上であっても、最も強い友情の絆を持つ人々と悪意のあるユーザーを検出できることを実証した」と研究者らは述べた。
「当社の方法は他の異常検出方法よりも優れており、特にサイバーセキュリティ分野において幅広い応用が可能だと考えています。」®