Facebookはタマネギのことを知らない:機械学習アルゴリズムが野菜の写真を「露骨に性的」と判断、種子広告が禁止

Table of Contents

Facebookはタマネギのことを知らない:機械学習アルゴリズムが野菜の写真を「露骨に性的」と判断、種子広告が禁止

簡単に言うと、 Facebookのコンピュータービジョンアルゴリズムが、同社のソーシャルメディアプラットフォームに投稿された無害なタマネギの広告を「露骨に性的」とフラグ付けしたのだ。

カナダの園芸用品店「EW Gaze のシード・カンパニー」は、ワラワラタマネギの種子をソーシャルネットワークで宣伝したいと考えていたが、広告に使用した画像がフェイスブックのソフトウェアによって下品すぎると判断され、その試みは却下された。

かごに入った玉ねぎのクローズアップ写真にセクシーさなど微塵もない、と多くの人が主張するだろうが、Facebookの自動ソフトウェアは明らかにそうは考えなかった。同社が投稿したスクリーンショットには、この画像は「露骨に性的」なポーズをしていると記載されていた。

玉ねぎ

キンクを非難するつもりはありませんが、これはあまり刺激的ではないようです…クレジット: EW Gaze

プライバシー重視のスタートアップ企業の研究者、ヴィナイ・プラブ氏は実験で、この画像には中央に、物体認識モデルでポルノと誤認されることが多い、問題のあるタマネギが一つ含まれているように見えることを明らかにした。目を凝らして見れば、乳房のように見えるかもしれない。Facebookのアルゴリズムも、そこに狙いを定めているのかもしれない。

— ヴィナイ・プラブ (@vinayprabhu) 2020年10月9日

ウェイモ、自動運転タクシーの実験を強化

ウェイモはアリゾナ州フェニックスで「完全自動運転」車を公表した。

Waymo Oneとして知られる自動運転タクシーフリートサービスは現在も試験運用中で、これまでは秘密保持契約に署名した一部の乗客のみが利用できました。しかし、アルファベット傘下のプロジェクトであるWaymo Oneは、この無人運転サービスをすべてのWaymo One乗客に開放しました。

「まずはWaymo Oneにすでに参加している人たちから始め、今後数週間かけて、当社のアプリ(Google PlayとApp Storeで入手可能)を通じて、より多くの人たちをサービスに直接迎え入れる予定です」と同社は述べた。

繰り返しになりますが、Waymo Oneの早期利用者プログラムは、一般向けにはまだ提供されていませんが、参加者は審査・選抜されます。また、Waymo Oneの利用者が利用する乗車のうち、完全自動運転・無人運転は現時点では約20%に過ぎませんが、Waymoは「近い将来」に提供開始を目指しています。

arXivの論文は入手できました。次はコードです。

arXiv の機械学習研究の下部に、論文に記載されている対応する AI コードへのリンクをホストするための追加タブが追加されました。

機械学習の研究は理解し、再現するのが難しい場合があります。論文で説明されているモデルは往々にして非常に曖昧であり、開発者の多くはコードを共有しようとしません。

機械学習エンジニアのチームが立ち上げたオープンソースプロジェクト「Papers With Code」は、arXivに新機能を組み込むことで、より多くの人々がコードを公開し、誰もが閲覧できるように促しています。著者は自分のコードへのリンクを直接送信できるほか、ソフトウェアの再現を試みる他のエンジニアとのコミュニティ全体の取り組みも追加できます。

「arXivにコードを掲載することで、研究者や実践者が最新の機械学習研究を基に研究を進めることがはるかに容易になります」とPapers With CodeはMediumの投稿で説明している。

「この変化が機械学習にとどまらず、より広範な計算科学にも波及効果をもたらすことを期待しています。科学は積み重ねていくものです。コードなどの重要な成果物を公開するオープンサイエンスは、研究の基盤を築きやすくすることで、進歩を加速させるのに役立ちます。」

機械学習で生成された偽の履歴書

AIソフトウェアによって生成された架空の人物画像を延々と掲載するサイトは既に目にしました。今度は、えーっと、偽のソフトウェア開発者の履歴書を掲載するサイトが登場しました。

ニューラルネットワークが吐き出す新しい履歴書の例は、更新ボタンを押すたびに表示されます。「Almost Real Resume」というウェブサイトは、GitHub上で作成者によって「ちょっとした楽しみのため」と説明されています。彼らはモデルを訓練し、テキスト形式を模倣して約6,000件の履歴書を表示するようにしました。

「プライバシー保護のため、現在モデルの学習に使用している実データは含めていません」と彼らは付け加えた。「注:モデル/出力は明らかにひどいものです。データのクリーニングが不十分で、十分な期間の学習もできていません。(そんな余裕があるでしょうか?)」

それでも、偽の例文をざっと見て、どんな名前や役職が出てくるかを見るのは楽しいです。このモデルは完璧ではありません。文法も間違っていることが多く、新しいエンジニアを探している雇用主が感心する可能性は低いでしょう。®

Discover More