分析ツイッター上で人種差別的な発言をする人が多い都市に住んでいる場合、人種差別を動機としたヘイトクライムの発生率も高くなる可能性が高いようです。
この研究結果をまとめた論文(PDF)は、今月ドイツで開催された人工知能推進協会(AI推進協会)のウェブとソーシャルメディアに関する会議で発表されました。ニューヨーク大学の研究者たちは、米国100都市における炎上ツイートの数とヘイトクライムの発生件数の間に相関関係があることを発見しました。
まず、研究チームはTwitterのストリーミングAPIを用いて、2011年から2016年の間に投稿されたツイートの1%を取得しました。ツイートを場所別にフィルタリングし、投稿された場所を確認しました。また、ツイートの内容、タイムスタンプ、ユーザー名に関する情報も収集し、5億3200万件のラベル付きデータセットを作成しました。
次に、研究チームは「浅いニューラルネットワーク」を訓練し、ツイートを「標的を絞った人種差別」と「人種差別体験の自己語り」の2つのグループに分類・分離しました。前者は特定の人種を直接的に差別し攻撃するメッセージであり、後者は単に人種差別的発言に対するコメントです。例えば、人種差別的な中傷を含むツイートは、必ずしも敵対的とは限りません。
TwitterのAPI制限を鼻で笑う科学者たち。今や彼らは思う存分情報を吸い上げることができる。
続きを読む
モデルの学習には合計1万6000件のツイートが使用されました。サンフランシスコに拠点を置く機械学習スタートアップ企業Figure Eightに雇用された人間のアノテーターが、1698件のツイートを「差別」、1万4302件を「非差別」と手動で分類しました。研究者らは、差別的ツイートを「人種、民族、または国籍に対する偏見を全面的または部分的に動機として、個人、財産、または社会に対して投稿されたツイート」と定義しました。
5億3200万件のツイートをニューラルネットワークに入力すると、研究チームは「標的型差別」とタグ付けされたツイートを収集した。そして、回帰モデルを用いて、このデータをFBIが報告した米国100都市におけるヘイトクライムの総件数と比較した。
「都市部でより標的を絞った差別的なツイートが投稿されるほど、ヘイトクライムの発生件数が増えることが分かりました」と、この研究を率いたニューヨーク大学のルミ・チュナラ助教授は述べた。「都市部、地方、大都市、小都市など、様々な都市タイプに見られるこの傾向は、オンライン上の様々な差別的発言が現実世界でどのような結果をもたらすのか、より具体的に研究する必要があることを裏付けています。」
いくつかの例外
しかし、この傾向はすべての都市に当てはまるわけではありません。バーモント州のキャッスルトンやアイダホ州のモンペリエなど、例外的な都市もいくつかあります。キャッスルトンは人種差別を動機としたヘイトクライムの発生件数が最も少ない都市ですが、人種差別的なツイートの割合は17位でした。モンペリエは人種差別的な犯罪の発生件数では19位ですが、人種差別的なツイートの数では5位でした。
「個々の都市における差別ツイートの数とヘイトクライムの件数を比較するのは難しい。しかし、回帰分析の結果、つまりヘイトクライムに関連して標的とされた差別ツイートの割合は、外れ値の都市を含めた場合と除外した場合で有意であったことは注目に値する」とチュナラ氏はThe Register紙に語った。
ヘイトクライムの通報要件は都市ごとに標準化されていないことに留意することが重要です。これが、これらの例外的な都市が存在する理由の一つです。調査したところ、これらの例外的な都市は、一般的にヘイトクライムの通報件数が極めて多いことが分かっています。これは、市民や警察の通報方法の違いなど、様々な理由が考えられます。
研究者らはまた、米国の各都市における人種差別的なツイートの数とヘイトクライムの数には一定のパターンがあるようだが、因果関係はないとも指摘している。
論文には、「我々の研究はソーシャルメディア上の議論と犯罪の間に直接的な因果関係を主張するものではないが、この研究の知見は差別監視と差別緩和の取り組みを改善する上で重要であることを強調する」と記されている。
研究者たちは、オンラインコミュニティにおける差別が現実世界とどのように関連しているかを研究し続けたいと考えている。「最近、Facebookから研究助成金をいただき、オンライン差別の下流への影響を調査する研究を継続できるようになりました。私たちの主要な研究結果の一つは、オンライン差別の種類とそれらがオフラインの出来事とどのように関連しているかが複雑であるという点です。そのため、これは重要なことです」とチュナラ氏は結論付けた。®