おい、クリックベイト警官ボット、これをニューラルネットワークに詰め込め。注目の新型AIがウェブジャーナリストを破滅させると脅す

Table of Contents

おい、クリックベイト警官ボット、これをニューラルネットワークに詰め込め。注目の新型AIがウェブジャーナリストを破滅させると脅す

人工知能ソフトウェアは、クリックベイトの見出しを検出し、フラグを立てるように訓練されています。

El Regでは、ラリー・ウォール氏に心から感謝しています。今、インターネットに必要なのは、宇宙人移民や偽の月面着陸などに関する怪しい記事のタイトルをハイライトして削除するソフトウェアです。

機械学習の専門家たちは自然言語処理の限界を押し広げ続け、見出しが実際にどれほどクリックベイト的であるかを検出できるというモデルを作り上げました。

このシステムは、畳み込みニューラルネットワークを用いて、投稿された記事のタイトルに含まれる単語をベクトルに変換します。これらの数値は長短期記憶ネットワークに入力され、見出しのクリックベイト度に基づいてスコアを算出します。タイトルがクリックベイトであるかどうかについては、10回中8回程度、人間の判断と一致したとのことです。

問題は、クリックベイトの見出しとは一体何なのか、ということだ。これは難しい問題だ。AIチーム(インドのハイデラバードにある国際情報技術研究所、マニパル工科大学、ビルラ工科大学から構成)は、クリックベイトの定義に、由緒あるメリアム・ウェブスター辞典を参考にすることにした。

疑わしい

「メリアム・ウェブスターはクリックベイトを、(見出しなど)付随する情報の断片に基づいて読者にハイパーリンクをクリックするように促すもの、特にそれらのリンクが疑わしい価値や興味の対象につながるもの」と定義している」と論文には記されている。

「これは、見出し、画像、関連テキストなどを通じて、ウェブ上の記事を読んでいるときに何が期待できるかを意図的に誤って伝えたり約束したりすることで、ローウェンスタインの情報格差を作り出し、結果的にそれを利用するように構築されています。」

「ローウェンスタイン情報ギャップ」を活用するというのは、人の好奇心、つまり人が知っていることと知りたいことのギャップを利用するという意味で、おしゃれな言い方です。

人々は、少しでも興味のあるトピックについてもっと知りたいと思い、特定の記事や書籍、ドキュメンタリーがその答えを与えてくれると信じている場合、情報を消費する可能性が高くなります。したがって、この研究によると、クリックベイトは、実際には内容が浅いにもかかわらず、読者に何かについてより深く学べると思わせてしまうのです。

群れをなすバカども

研究者たちは、Twitterから収集した19,538件のツイートを含むデータセットを用いてモデルを訓練した。各ツイートには見出しと記事へのリンクが含まれており、記事本文に対するタイトルのセンセーショナルさを定量化したスコアが付与されていた。これらのスコアは別の研究チームによって作成されたもので、彼らの論文「Twitterにおける大規模クリックベイトコーパスのクラウドソーシング」は、数週間後に開催される国際計算言語学会議(COLING)で発表される予定である。

スコア付けされた投稿のうち、2,538件を除くすべてがモデルの学習に使用されました。残りのツイートは、AIに入力し、予測されたクリックベイトスコアと人間が付与したスコアを比較することで、モデルの能力をテストしました。モデルは83.49%の精度を達成しました。

プーチン、トランプ、金正恩のモデルたちが自撮りをしている

うわあ!また不気味な偽のしゃべる顔を作るAIが出てきた

続きを読む

残念ながら、論文ではモデルがどのようなパターンを捉えたのか、例えばどのような単語の組み合わせがクリックベイトと判断される可能性が高いのかなど、あまり詳細には触れられていません。しかし、この研究の共著者であるヴァイブハブ・クマール氏はThe Register紙に対し、何らかの衝撃的な要素を持つ単語はクリックベイトと判断される傾向があると述べています。「ちょっとした驚きのある単語が、クリックベイトの検出に大きな役割を果たしていることが分かりました」とクマール氏は述べています。

彼が挙げた例の一つは、「話題のホットな携帯電話」です。「ホット」や「話題の」という言葉は読者を惹きつけるためによく使われますが、おそらく効果は薄いでしょう。

彼は、このモデルを改良すれば見出しも生成できると述べた。「私たちが使用したデータは、実際に『クリックベイト』なニュースの見出しを作成するのに使用できます。私たちのアプローチの基本は見出しを生成するのに使用できますが、使用するディープラーニングモデルを完全に変更する必要があります。」

「私の意見では、従来のニュースではそのような機能は使うべきではありません。しかし、重要なニュースではなく、単に軽く読んで楽しむためのブログや記事であれば、使えるかもしれません。従来のニュースでそのような機能を使うと、人々が本当に望んでいるものを奪ってしまうことになります。」

問題はここにある。クリックベイトとは何かについて誰も意見が一致していないのだ。

クリックベイトとは、期待に応えられないもの、つまり誇張したり、本文と比べて明らかに間違った見出し、あるいは記事の内容と全く関係のない見出しを指すと考える人もいます。また、際どい内容や感情を搾取するような内容はすべてクリックベイトだと考える人もいます。中には、同意できない記事をクリックベイトだと決めつける人もいます。ツイートスコアを付ける人間たちが、この点についてどのような立場を取っているのかはまだ分かりません。

El Regでは、正確ではあってもクリックさせようとしない見出しには意味がないと思っています。そもそも、誰もクリックしたくなくなるような見出しを書く人なんているのでしょうか? ちょっと待ってください、そういう出版物はいくつか思い浮かびます…®

Discover More