機械学習初心者向け:大学に戻る必要はありません

Table of Contents

機械学習初心者向け:大学に戻る必要はありません

人工知能とそのサブドメインは、ソフトウェア開発者、プログラマー、ハッカー、そしてソフトウェアに関係するほぼすべての人にとって、次の大きな成長分野になると思われます。

自動運転車、Pornhub でのポルノスターのタグ付け、ヘルスケア、セキュリティなど、生活のあらゆる分野に AI が関わっているようです。

森の中の背の高い松の木

15 分で機械学習を学びたいですか? ここから始めましょう...

続きを読む

しかし悲しいことに、ほとんどの人はこの分野を理解していません。アルゴリズムを開発し、テストし、製品としてリリースするという「通常の」プログラミングとは大部分が異なります。

例えば、機械学習はモデルの選択、開発、モデルの学習、テスト、そしてリリースという一連のプロセスを経ます。これらはAI開発者になるために育成すべき特定のスキルですが、問題は、AIや機械学習を扱うためにこれらのスキルが本当に必要なのかということです。

おそらく最も安全な方法の 1 つは、専門家によって提供されるとされる大学のコースを受講することです。ただし、そのモジュールが分析プログラムやデータ サイエンス プログラムの中に埋もれている場合があります。

大学を通して、AIと機械学習の現状を深く理解し、独自のモデルを開発し、既存のモデルを調整して最高のパフォーマンスを引き出す方法を学ぶことは間違いありません。そのためには高度な数学の知識が必要となり、大学ではその知識を豊富に得ることができます。

ロボット読書写真(Shutterstockより)

Word2Vecを使っていますか?Googleのニューラルネットワークの本の虫

続きを読む

講義は多くの場合、複雑な方程式から始まり、それが単純化された形(ほとんどの場合はあり得ませんが)か、あるいはさらに複雑な形に変換されます。

しかし、本当にそうである必要があるのでしょうか?多くの(もちろんすべてではありませんが)機械学習モデルの中核を成すベイズ統計を考えてみましょう。これは次の式で表すことができます。

P(A|B) = P(B|A)P(A)/P(B)

  • ここでP(A|B)はBが真である場合のAの確率である。
  • P(B|A)はAが真である場合のBの尤度である。
  • P(A) と P(B) は、A と B が独立している場合の確率です。

分かりやすいですね!しかし、ジェームズ・ストーンは著書『ベイズの定理:ベイズ分析入門』の中で、 Two Ronniesの「4つのキャンドル」スケッチという素晴らしい例を挙げながら、ここまで複雑にする必要はないと主張しています。

YouTubeビデオ

ロニー・バーカーは金物店のオーナー、ロニー・コーベットに「4 本のキャンドル」または「フォークの柄」として解釈できるものを尋ねます。

従来の統計では、どちらの注文の確率も50/50とされています。しかし、お店ではハンドルよりもキャンドルの販売数が多いことが分かっている場合、顧客が「4本のキャンドル」を注文する可能性は「フォークハンドル」を注文する可能性よりも高くなります。

それがベイズの本質です。

他の多くの ML 技術についても同様です。非常に複雑な数学に関わっていますが、教師が本当に理解していれば、ほとんどの人にかなり簡単に説明できます。

しかし、ここに難点があります。大学のコースは、研究に携わり、場合によっては博士課程に進学できるような卒業生を輩出することを目的として設計されていることが多いのです。講師自身もその分野の研究者であることが多く、最先端の研究の向上に関心を持っていることが多いのです。

これは確かに崇高な使命だが、業界が本当に必要としているものなのだろうか?

ここで2つの点が挙げられます。まず、業界には機械学習を理解し、新しく有用なモデルを実装できる人材が必要です。しかし、これらの人材がモデル内部で何が起こっているかを、経営陣が理解できるような簡潔な方法で説明できることが不可欠です。

最近、優秀なデータサイエンティストのチームが優れたモデルを開発し、それを方程式のボードを使って顧客に説明し始めたという話を耳にしました。もちろん、顧客が求めていたのは、システムによってどれだけの収益が上がるか、あるいはどれだけのコストが節約できるかという点だけでした。

ML は近年大きく進歩しており、既成のモデルがいたるところにあり、大手クラウド プロバイダーはすべて、比較的使いやすく調整のみで済むモデルを提供しています。

クラウドへの移行を望まなくても、便利な機械学習モデルはたくさんあります。最近書いたTensorflowとword2vecに関する記事では、どちらもそのような例を2つ使用しました。モデル内部で何が起こっているのかは分かりませんが、かなり簡単に使えます。

自転車事故の写真(Shutterstockより)

TensorFlow: 好きになりたいけど、あなたはトリッキーだね

続きを読む

これらの事前構築済みモデルは、データセットを用いて学習させる必要がありますが、学習させることなく機械学習を活用する別の方法があります。これまで見てきたように、AppleとGoogleはどちらも、モバイルアプリに事前学習済みモデルを組み込むためのシンプルな方法を提供しています。有能なスマートフォンアプリ開発者であれば、機械学習を組み込むのは、適切な依存関係を設定し、学習済みモデルを読み込むだけで簡単です。モデルはまさにブラックボックスです。

では、教育はどうなるのでしょうか?オンラインコースは数多く存在しますが、大学の授業と同様に、数学的な要素が非常に強いものになりがちです。この分野の主要企業はすべて、トレーニングコースを提供しています。例えば、Microsoftは様々なレベルのAIトレーニングを提供していますが、もちろん、これらのコースはベンダーごとに異なる傾向があるため、ある程度の制約があることに注意してください。

大学は、AI がもはや単なる学術的な演習ではないという事実を認識する必要があります。

私が 1996 年に勤務していた大学では、業界ではリンク リスト ライブラリをゼロから構築できる人材ではなく、既存のライブラリをいつどのように使用するかを知っている人材が必要であると認識し、コンピュータ サイエンスを廃止して応用コンピューティングを導入しました。

このようなアプローチを採用した優れたコースが存在しないと言っているわけではありません。AI のより広範な普及と業界のために、このようなコースがもっと必要だと私は考えています。®

Discover More