YouTubeのアルゴリズムがスパーリングロボットを動物虐待と誤認、Xbox AIでゲーマーが監視されるなど

Table of Contents

YouTubeのアルゴリズムがスパーリングロボットを動物虐待と誤認、Xbox AIでゲーマーが監視されるなど

まとめ今週(英国では 4 日間の週)を、これまでに取り上げた内容を超えた最近の AI 関連のニュースから始めましょう。

ロボット同士が戦う様子は見ない方がいい。だって、えーっと、残酷だから? YouTubeは、ロボット同士が戦う様子を映した動画を、アルゴリズムが奇妙なことに動物虐待だと分類したため、一時的に削除した。

YouTubeのコミュニティガイドラインでは、「動物に故意に苦痛を与える不必要な苦痛や危害」を描写したコンテンツや、「人間が動物に闘争を促したり強制したりする」シーンは、動画共有プラットフォーム上では許可されていません。それ自体は素晴らしいのですが、YouTubeが最近削除した動画には動物は登場せず、機械しか登場していませんでした。

Maker's MuseのようなYouTuberたちは、この騒動の原因はGoogleのアルゴリズムにあると非難した。これはViceが最初に報じたところによると、アメリカのロボット格闘番組「Battlebots」に参加していたエンジニアたちの動画が削除された。彼らは、動画のタイトルの一部に動物の名前が含まれていたと指摘した。

YouTubeビデオ

YouTube が誤ってフラグを付けていたことを認め、その後、これらの動画は復元されました。

その他のニュースでは、香港での政治抗議活動の中、中国のプロパガンダを拡散したとして210のアカウントが削除されました。これは、Twitterが中国政府による「香港での政治的不和を煽る」試みの一環とみられる中国で作成された936のアカウントを発見し、削除した後のことです。

3番目に大きいGPT-2モデルが公開されました。OpenAIの巨大言語モデルは、公開するには危険すぎると判断されました。それから6ヶ月後、同組織は新たなGPT-2モデルを公開しました。今回は7億7400万個のパラメータを備えていますが、これは10億個を超えるパラメータを持つフルバージョンよりも少ない数です。

MCubed ビッグロゴスクリーン

MCubed に参加して、機械学習が詐欺師と戦う方法、ポケベルのノイズを削減する方法などを学びましょう。

続きを読む

7億7400万のモデルは、これまでにアメリカの4つの大学と共有されています。OpenAIはコーネル大学と共同で、人間が機械生成テキストに騙される可能性を研究しています。ミドルベリー国際大学院は、GPT-2がオンライン上のテロリストによってどのように悪用されるかを調査しています。オレゴン大学はシステム内のバイアスを研究しています。テキサス大学オースティン校は、特定のデータセットと異なる言語を用いてモデルを訓練した場合の挙動を分析しています。

このモデルは、研究者による技術のサブライセンスを禁じる法的契約で保護されています。また、GPT-2の全体または一部を他者に販売、貸与、賃貸、リース、譲渡、または権利付与することも禁止されており、商業目的で使用することもできません。ライセンシーが発表を希望するGPT-2に関する研究はすべて、OpenAIによる事前審査を受けます。

一方、約15億のパラメータを持つバージョンが欲しいなら、OpenAIの最大のモデルを再現しようと試み、そのコードをオンラインで公開している2人のエンジニアに頼るしかありません。ただし、唯一の欠点は、それを使うには、例えばトレーニングに必要なクラウドコンピューティング費用として約5万ドルが必要になることです。

GPUを大量に購入するために、すべての資金を無駄にする必要はありません。英国のディープラーニング研究チームが、CIFAR-10画像データセットを用いて、人気のコンピュータービジョンモデルをわずか1つのグラフィックアクセラレータだけでわずか26秒で学習させることに成功しました。AIエンジニアは常に学習プロセスを高速化する方法を探しています。最も簡単な方法は、ハードウェアを大量に投入することです。しかし、それはコストがかかるため、より安価なソフトウェアのトリックを選ぶ人もいます。

ケンブリッジに拠点を置くMyrtle.aiは後者の戦略を採用しました。チーフサイエンティストのDavid Page氏は今月、Nvidia V100 GPU 1基を使用して、CIFAR-10モデル上で9層ResNetモデルを学習させたところ、1分15秒というタイムを達成したと発表しました。

Page氏の結果を、DAWNBenchコンペティションの一環としてCIFAR-10を高速処理しようと試みた他のグループと比較したところ、Myrtle.aiは6位に留まりました。提出されたほとんどのグループが複数のGPUを使用していることを考えると、悪くない結果です。しかし、2018年11月の提出以来、Myrtle.aiはわずか26秒まで時間を短縮することに成功したようです。その秘訣は、トレーニング中にGPUとCPU間でデータと命令をやり取りする時間を最小限に抑える手法を採用していることです。

Microsoft の Cortana は、Xbox でプレイしているときにあなたの話を聞いていた:テクノロジー大手が、AI 搭載の音声制御スマート アシスタントがあなたの話を聞いていると言うとき、それはソフトウェアだけでなく、人間のハンドラーもあなたの話を聞いているという意味だということを、ここで改めて思い出させてくれる。

Apple、Amazon、Facebook などと同様に、Microsoft は、常にユーザーの話を聞き、ウェイクワードを待って起動し命令を受ける仮想ヘルパーを提供しています。レドモンドの場合、それは Cortana であり、Windows 10 ラップトップから Xbox One コンソールまで、さまざまな形式とシステムに存在しています。

ごく最近まで、マイクロソフトが雇用する請負業者が、ゲーム機からCortanaが収集した音声クリップの文字起こしを行っていました。搭載ソフトウェアが周囲の音声を理解するのに助けを必要とするたびに、その断片が人間のフリーランサーに渡され、文字起こしされてシステムに取り込まれ、システムの改善に役立てられていました。もちろん、これらの録音にはプライベートな会話や親密な瞬間も含まれている可能性があります。想像力を働かせてみてください。

実際、マザーボードによると、これらの請負業者は、コンソールシリーズに音声起動のCortanaが搭載される前からゲーマーの声に耳を傾けていました。中には、Kinectシステムで音声コマンドを録音できる2014年という早い時期に業務を開始した企業もありました。

「音声対応サービスの向上のために音声データを収集しており、このデータはベンダーによって確認されることがあることは、以前から明確に申し上げてきました。最近、プライバシーに関する声明を更新し、製品改善プロセスの一環として、このデータが確認される場合があることをより明確にしました」と、マイクロソフトの広報担当者はThe Register紙に語った。

実際、マイクロソフトは今月初め、SkypeとCortanaがデスクトップPCから人間に音声クリップを渡していたことが明らかになった後、状況を説明するためにプライバシーポリシーを更新した。「当社は、異なるコンテキスト(例えば、2つのマイクロソフト製品の使用状況など)から収集したデータや、サードパーティから取得したデータを統合することで、よりシームレスで一貫性があり、パーソナライズされたエクスペリエンスを提供し、情報に基づいたビジネス上の意思決定を行い、その他の正当な目的に利用しています」と、この米国の巨大企業は述べている。

マイクロソフトは、私たちの知る限り、ユーザーの音声を録音し、それを人間に渡して確認させているとは、いまだに明確に述べていません。なぜなら、巨大IT企業が積極的に人々の自宅に盗聴器を仕掛けていることを、一般の人々、政治家、そして規制当局が知ったら、誰もがパニックに陥るだろうと私たちは考えているからです。

レドモンドの広報担当者はまた、「数か月前、製品改善のためにXboxを通じて録音された音声コンテンツの確認を停止しました。もはや必要性を感じなくなったためです。また、この確認を再開する予定もありません。録音が利用規約に違反しているという報告があり、調査が必要になった場合、Xboxユーザー間で少量の音声録音を時折確認しています。これはXboxコミュニティの安全を守るための措置であり、Xboxの利用規約にも明記されています。」®

Discover More