ユニバーシティ・カレッジ・ロンドンのコンピューター学者フアン・エチェベリア氏とシ・ゾウ氏は、スター・ウォーズの小説を引用することを好む35万以上のアカウントで構成された休眠中のツイッター・ボットネットを偶然発見した。
Twitterボットは2016年の選挙の論調を歪めたとして非難されています。また、娯楽、マーケティング、スパム、Twitterのトレンドリストや世論の操作、荒らし、偽フォロワー、マルウェアの拡散、データセットの汚染などにも利用される可能性があります。
最近発表された研究論文の中で、2人のコンピューター科学者は、英語圏のツイッターアカウントの1%(約600万アカウント)をランダムに抽出して、どのようにして今回の発見に至ったかを詳述している。
研究者たちは、無関係な調査を進める中で、アカウントサンプルのツイート8億4,300万件のデータセットにある位置情報タグ付きツイート2,000万件の地理的分布を調べていたところ、異常な分布パターンに気付きました。
一部のアカウントは、アメリカとヨーロッパの人口密集地と一致する予想分布パターンを示しました。しかし、別のアカウント群は、これらの地域内でランダムな分布を示し、海、砂漠、北極といったありそうもない場所からのツイートが多く見られました。
ヨーロッパ上空のボックスの端にある青い点は、画像圧縮によりほとんど見えなくなり、スターウォーズのボットを示している
研究者らがこれらのツイートのテキストを手作業で調べたところ、その大部分はスター・ウォーズの小説からのランダムな抜粋で構成されており、その多くが不完全な単語で始まったり終わったりしていたり、ランダムに配置されたハッシュタグを含んでいたことが判明した。
例えば:
ルークの答えは、さらにスピードを上げることだった。二人の距離はたった10メートルしか離れていない。もし彼が
「この引用は『スター・ウォーズ:チョイス・オブ・ワン』という書籍からの引用で、ルーク・スカイウォーカーが重要な登場人物です」と論文は説明している。「少なくとも11冊のスター・ウォーズ小説からの引用が見つかりました」
4,942 のアカウントに関連するデータを手動で調べた結果、一貫した特徴を持つ 3,244 個のボットが特定されました。
- スターウォーズの引用だけをランダムにツイートします。
- フォロワー獲得に関連したハッシュタグ、またはランダムな単語の先頭に付けられたハッシュタグを使用します。
- 他の Twitter ユーザーをリツイートしたりメンションしたりしないでください。
- 各ボットは開始以来 11 件以下のツイートしか投稿していません。
- 各ボットには 10 ~ 31 人の友達がいます。
- ボットはソース アプリケーションとして「Twitter for Windows Phone」のみを選択します。
- ボットのユーザー ID 番号は、1.5 × 10^9 から 1.6 × 10^9 までの狭い範囲に収まります。
研究者たちは、このボット群を基に、類似した特徴を持つ他のアカウントを探すための機械学習分類器を作成した。このアルゴリズムは356,957個のスター・ウォーズ・ボットを特定した。
研究者たちは、自動検出方法を妨害するために設計されたと思われるボットを発見できたのは幸運だったと述べています。彼らは、ボットが人間であったことが発見を可能にしたと指摘しています。
「ボットがツイートに北米とヨーロッパのランダムな位置情報をタグ付けしたのは、ツイートをより本物らしく見せるための(意図的な)試みだった」と論文は説明している。「しかし、この偽装工作は裏目に出た。偽装された位置情報を地図上にプロットすると、全く異常な姿に見えてしまったのだ。この異常性は地図を見た人間にしか気づかれず、コンピューターアルゴリズムでは認識が難しい点に注目すべきだ。」
不思議なことに、スターウォーズのボットは2013年以来沈黙している。研究者は、古くなってしまったボットは新しく作られたボットよりも闇市場で高く売れることがあるのを観察している。これはおそらく、ボット検出方法では古いアカウントの方が信頼性が高いと判断されるためだと考えられる。
Twitter社は今回の調査結果についてコメントを控えているが、これは同社が今までこの事実を認識していなかったためかもしれない。
「(まだ)Twitterに直接アカウントを報告していません」とエチェベリア氏はThe Registerへのメールで述べた。「論文が投稿された科学誌の承認を待っているところです。また、研究者の方々には、データセットがなくなる前に自分で入手する機会を与えたいと考えています。そのため、Twitterに直接報告していませんが、論文が受理され次第、報告します。」
スターウォーズのボットネット特定に成功したことに刺激を受けた研究生のエチェベリア氏と彼の指導教官である上級講師のシ・ゾウ氏は、50万アカウントに及ぶさらに大規模なボットネットを特定したと主張している。
「この大規模なボットネットは、現在審査中の後続の研究論文の一部です」とエチェベリア氏は述べた。「承認され次第、より詳しい情報を公開できるでしょう。」
エチェベリア氏は、人々が研究者にボットを報告しやすくするために、「@thatisabot」という名前のTwitterアカウントができたと付け加えた。
「Twitterではなく研究者向けの@spamと考えてください」と彼は言った。「さらに、www.thatisabot.comというウェブページがあり、(近々)ボットを研究者に報告できるようになる予定です。」
「司令官、この船を破壊して設計図を見つけ出し、アンバサダーを連れてきてください。彼女を生かしておいて欲しいんです!」®