Facebookが物体検出技術をオープンソース化:GoogleのCAPTCHAにご注意

Table of Contents

Facebookが物体検出技術をオープンソース化:GoogleのCAPTCHAにご注意

RoTM Facebook は、物体検出用のコードベース Detectron をオープンソース化することで、コンピューター ビジョンの天才への取り組みを表明し、Skynet の未来に一歩近づきました。

Python で記述され、Caffe2 ディープラーニング フレームワークを搭載したコードベース (Mask R-CNN や RetinaNet などのオブジェクト スニッフィング アルゴリズムを実装) は、Apache 2.0 ライセンスの下で利用できます。

15 分で機械学習を学びたいですか? ここから始めましょう...

続きを読む

CAPTCHAのジョークはさておき、画像に写っているものを識別するだけではありません。通常、静止画や動画を見るとき、私たちは複数の重なり合った物体を見て、それらの相対的な距離、互いの関係、前景と背景の物体がカメラ(または人間の目)の焦点距離の影響を受けるという事実、そしてある物体の終わりと別の物体の始まりの位置を計算します。トレーニングデータに動画が含まれている場合は、フレームごとに相対的なサイズ、位置、または部分的な遮蔽を確認する必要があるかもしれません。これらは、コンピュータービジョン、特に物体検出の分野で機械学習研究者が解決しようとしている問題の一部です。

Fbookのフレームワークには、物体の検出と分類だけでなく、同時にセグメンテーションマスクを生成するアルゴリズムの実装が含まれています。画像内の選択された領域をグループのメンバーとして識別することで、モデルがそのグループ内の他の物体を識別するためのトレーニングに役立ちます。Facebookのブログに掲載された図(Mask R-CNNの出力を描写)から判断すると、一部の研究者は相当なヒット率を達成しているようです。

Detectronは、Facebook AI研究(通称FAIR)における多くの研究プロジェクトの基盤となっています。ザッカーボルグ氏によると、研究者はクラウドやスマートモバイルなどのモバイルデバイスに展開できるモデルをトレーニングできるようになるとのことです。

私たちは、ザッカーボットとグーグルボルグが互いのコンピュータービジョンを騙そうとし、一方で人間のユーザーはぼやけたヘラや椅子、レーザーで武装してマシンと戦おうとする未来を想像せずにはいられません。®

Discover More