百度は、深層学習スイート「PaddlePaddle」をオープンソース化してから1年後、スマートフォンにAIを搭載するプロジェクトという新たなAI技術をパブリックドメインに公開した。
モバイル ディープラーニング (MDL) が MIT ライセンスの下で GitHub に登場し、その際には「ぜひご覧ください」という呼びかけも寄せられました。
MDLは、モバイルデバイスに適合するように設計された畳み込みベースのニューラルネットワークです。百度によると、スマートフォンのカメラを使って画像内の物体を認識するようなアプリケーションに適しているとのことです。
同社のリポジトリによると、ニューラルネットワークの計算はスマートフォンのGPUにオフロードされ、高速かつ低複雑性を実現しているという。iOSとAndroidのどちらでも動作するが、プロジェクトのドキュメントはGoogleよりもApple寄りで、GPUサポートはAndroidではまだ未定であり、TensorFlowモデルのサポートも同様に未定となっている。
Baiduによると、このコードは(ニューラルネットワークモデル以外)サードパーティのライブラリに依存しておらず、約4MBに収まるとのことです。開発者はMDLでの使用に同社のPaddlePaddleモデルを推奨していますが、Caffeも使用可能です。
以下のスクリーンショットは、MDL が 0.5 秒以内にスマートフォンを認識できることを示しています。
別の MDL デモでは、陶器のティーカップのパターンを識別し、それを使用して一致する販売商品を検索しました。
MDL は MobileNet、SqueezeNet、GoogLeNet をサポートしています。®