分析:インターネット企業は無償の労働力に依存しています。Amazon、Facebook、Googleといった企業は、プラットフォームへの参加、あるいは純粋な利他主義のために作品を無料で提供するコンテンツクリエイターに依存しています。
Intuition Machinesというスタートアップ企業は、機械学習(ソフトウェア)とブロックチェーン(当然)を活用した、もっと良い方法があると考えています。
Google は、好まれるウェブサイトへのリンクに費やされる労力を捕捉し、それを利用して検索結果の関連性を高める PageRank アルゴリズムによって、オンラインでの潜在的な労力を活用する技術の先駆者となった。
10年前、チョコレートファクトリーはカーネギーメロン大学のコンピュータ科学者からreCAPTCHAを買収し、ボットではないことを証明しようとする人々のクリック情報をデータに変換し、テキストのデジタル化、画像アノテーション、機械学習プロジェクトの改善に役立て始めました。誰もが恩恵を受けますが、中でもGoogleほど恩恵を受けている人はいません。
Intuition Machines は、毎日 100 人年に相当するクラウドソーシング労働に相当すると推定される、婉曲的に「マスコラボレーション」と呼ばれるものの価値は、今年初めにリリースされたオークションベースのシステム「hCaptcha」を通じてより適切に配分できると主張している。
インターネットユーザーはあまり興奮しすぎない方がいいでしょう。彼らのほとんど価値のない労働を収益化できないからです。しかし、十分な数のユーザーがCAPTCHA(コンピューターと人間を区別するための完全に自動化された公開チューリングテスト)パズルを解けば、ウェブサイトは集めた小銭をわずかな収益に変えることができるかもしれません。また、効率的なデータラベリングを必要とする企業は、より効率的な市場にアクセスして、そのようなタスクに取り組むことができるようになるかもしれません。
hCaptchaチームは、ハッキングサービスを介してreCAPTCHA v3パズルを解読するコストは、1,000回解くごとに約1ドル以下、または1回回答あたり0.001ドル以下だと推定しています。また、Amazon Mechanical Turkなどを使用して画像にラベルを付けるコストは、画像1枚あたり0.03ドルから1ドル以上と、大幅に高くなります。
これら 2 つのコストの差は、少なくとも hCaptcha チームの計算によれば、Google が長年にわたり reCAPTCHA クリックを通じて集めた価値に換算すると数十億ドルに相当します。
Intuition Machinesは、クリック労働を最高額入札者にオークションで提供することで、ウェブパブリッシャーがその恩恵を受けられるよう支援できると主張している。同社によると、hCaptchaパズルを大量に提供する大手パブリッシャーは、イーサリアムトークンで月に1,000ドル以上を稼ぐことができるという。
「hCaptchaの背後には、イーサリアムブロックチェーン上で稼働する人間の労働のためのオープンな分散型プロトコルであるHUMANプロトコルがある」と同社は昨年ベータテストを発表した際に説明した。
「これには多くの利点があります。たとえば、報奨金を公平に分配していることを証明するための『オープンブック』の実現、Human Tokens(カスタム Bulk API を備えた EIP20 互換トークン)による効率的なマイクロペイメント、資本効率の高い方法で二面市場を拡大するための新しいメカニズムの提供などです。」
落札者は、ウェブサイト訪問者にhCaptchaパズルを提示し、入札者のデータ収集目標に役立つタスク(物体認識、属性検出、関連性ランキング、境界検出、画像内テキスト識別など)を実行できます。さらに、ユーザーもこの交換から、人間とボットの曖昧性解消能力の向上といった形で何らかの利益を得られると、同社は示唆しています。
アメとムチ
Intuition Machines によると、Google ではボット検出を非常に優れたものにすることには消極的な傾向がある。そうすると広告収入が減ってしまうからだ。
「Googleが、広告を見たりリンクをクリックしたりしたユーザーが実際にはボットであると公式に判断した場合、そのユーザーに表示される広告に対して料金を請求することはできません」と、同社は水曜日のブログ投稿で説明している。「この利益相反により、Googleのボット対策の取り組みの範囲は著しく制限されています。」
GoogleのreCAPTCHAは、Googleを優遇する - 予想通り - Google: 当然、チョコレート工場へのサインインを拒否するのはボットだけだ
続きを読む
同社は、Google が、ログファイルを調べて広告詐欺を発見し、返金できるような遡及的なボット検出システムを開発していないと主張し、これは広告業界が reCAPTCHA を最高のものにすることに関心がないことの表れだと述べている。
「遡及的なボット識別機能を提供すると、Googleは、不正なトラフィックに広告費を費やした広告主にどのように遡及的に返金するかという厄介な問題に直面することになる」と同社は述べている。「そのため、reCAPTCHA製品は10年間停滞したままとなっている。」
この主張を裏付けるように、同社は reCAPTCHA チャレンジを解くサービスに課される料金は 2016 年以来変わっていないことを指摘している。つまり、それ以降 Google が改良を重ねてきたにもかかわらず、少なくとも金銭的な観点からは、パズルの解読が難しくなったわけではないのだ。
The Registerは、hCaptchaとreCAPTCHAのパフォーマンスに関するより具体的なデータを提供するよう同社に要請しました。サービス利用規約の制限により提供が困難であるため、同社は第三者からの数値提供を待っているとのことです。
同様に、Intuition Machines社は顧客からhCaptchaの利用についてまだ説明を受けていません。私たちの理解する限り、企業は社内の機械学習能力の向上を外部ベンダーに頼っていると見られたくないようです。
さらに、CAPTCHAシステムの比較は難しい場合があることは承知しています。reCAPTCHAからhCaptchaに切り替えるだけで、偽アカウントを作成するボットが大幅に減少する可能性がありますが、これは必ずしも優れた技術によるものではありません。サイトにアクセスするボットスクリプトがreCAPTCHAを攻撃するように調整されている可能性があります。hCaptchaに特化した調整を行うことで、ボットの直帰率を低下させることができるかもしれません。
The RegisterはGoogleにコメントを求めたが、返答はなかった。®