トランプ氏のツイートの内容から、その話が真実かどうかがわかる:コードでは、文言から大統領の嘘をほぼ見抜くことができる

Table of Contents

トランプ氏のツイートの内容から、その話が真実かどうかがわかる:コードでは、文言から大統領の嘘をほぼ見抜くことができる

オランダとフランスの学者たちは、ドナルド・トランプ大統領のツイートにおける言葉の選択と文章の構成は、嘘を見抜くのに十分利用できると主張している。

今月初めにArXivで配布された論文の中で、エラスムス大学、ユトレヒト大学、カシャン高等師範学校の研究者であるソフィー・ファン・デル・ゼー、ロナルド・ポッペ、アリス・ハブリレック、オーレリアン・バイヨンは、事実として正確なトランプ氏のツイートと不正確なトランプ氏のツイートの間に大きな言語的差異があることを発見し、この発見を利用して言語ベースの嘘発見モデルを構築した方法について述べている。

彼らのモデルの精度は約73パーセントで、コイントスよりは優れているが、評価が完璧というには程遠い。

研究者たちは、ワシントン・ポスト紙によってファクトチェックされ、正確かどうかが判断できるトランプ大統領のツイートセットをデータセットとして使用した。まず、2018年2月から4月にかけてTwitterアカウント@realDonaldTrumpから投稿された605件の大統領関連ツイートのデータセットを作成した。その後、リツイートとウェブリンクを除外して絞り込みを行った。その結果、447件のツイートのデータセットが得られた。

このうち約30パーセントはファクトチェッカーによって事実誤認であると判断された。

研究者らは、多変量分散分析(MANOVA)として知られる統計手法を使用してツイートの言語を評価し、モデルの特性が発言の確立された正確性または不正確さを反映しているかどうかを調べた。

真実性は言語に現れるという彼らの仮説は、研究結果によって裏付けられました。彼らは正確なツイートと不正確なツイートの間に言語的な差異を検出し、その差異を用いてツイートを約73%の確率で真偽に分類しました。

トランプ大統領の新しいZTEツイートは、彼の最初のZTEツイートを上回った古いZTEツイートを上回った。

続きを読む

研究者たちは、間違いは意図しない不正確さを表すため、言語は間違いによって変化するものではないと仮定している。むしろ、言語を歪めるのは嘘だと彼らは言う。

「間違いは言語使用に影響を与えるべきではない。なぜなら、発信者の認識や意図に違いはないからだ」と論文は説明している。「対照的に、虚偽の陳述を意図的に真実として提示した場合、欺瞞仮説によれば、言語使用に変化が生じると予想される。嘘をつくことは認知能力を刺激し、感情を引き出し、行動制御の試みを強めるため、行動変化を引き起こす可能性がある。」

このモデルを、2017年11月から2018年1月までの期間をカバーする464件のツイート(そのうち約22パーセントは事実上不正確であると判断された)の2番目のデータセットに適用したところ、ツイートに対する研究者の予測は、ファクトチェッカーによって確立された真実と約73パーセントの割合で一致した。

研究者たちは、正しい発言には肯定的な感情がより多く含まれているのに対し、誤った発言はより回避的で、否定、ためらい、比較表現が多く含まれていることを発見しました。また、誤ったツイートには「#」と「@」の記号がより少なかったこともわかりました。

お金に関する言葉を含むツイートは虚偽である可能性が高く、宗教用語を含むツイートは虚偽である可能性が低いことが判明した。

この技術はジャーナリストやファクトチェッカーがソーシャルメディアのコンテンツの真実性を評価するのに役立つ可能性があると研究者らは示唆しており、キー入力分析などの他の嘘発見方法と組み合わせることで精度をさらに高めることができると考えている。

しかし、研究者たちは、誰でもこの手法を使って特定の人物に対する嘘発見器を作ることができると警告している。「したがって、これらの結果は、膨大な個人情報をオンラインに投稿するすべての人々への警告でもある」と研究者たちは結論付けている。®

Discover More