富国生命保険の34人の従業員は、保険金の支払額を熱心に計算していたにもかかわらず、無残にもAIシステムに置き換えられてしまった。哀れな話だ。1月の報道を信じるなら、AI革命はまさに今そこにある。
私の意見では、日本で起きていることは到底 AI とは言えませんが、その理由を説明するには、AI が何を意味するのかを説明する必要があります。
AIの統一された定義が存在しないことから、ある意味ではこの試みは失敗する運命にあると言えるでしょう。しかし、このテーマを理解するための枠組みを提供することで、少しでもお役に立てれば幸いです。
しかしその前に、原始的なAIシステムと言えるかもしれない例を挙げましょう。この話(個人的にはずっと興味深い話ですが)は、保険の件ほど広く報道されていませんでした。Google翻訳はすでに広く利用されており、その名の通り、人間の言語間の翻訳が可能です。
11月、Google翻訳が独自の言語を発明したようだと報じられました。当初は特定の言語ペア間の翻訳に訓練されていました。例えば、日本語と英語の文章で訓練し、その言語ペア間の翻訳方法を学習します。次に、別の言語ペア(韓国語と英語)の文章で訓練し、これを繰り返します。韓国語から日本語に翻訳する場合、中間段階として英語を経由すると考えられます。
しかし、どうやらそうではないようだ。Googleの研究ブログは次のように報告している。
このことから、私たちは次のような疑問を抱くようになりました。システムがこれまで見たことのない言語ペア間で翻訳できるだろうか?
驚くべきことに、答えは「はい」です。
研究者たちはその後、Google翻訳が特別な訓練を受けていないにもかかわらず、どのようにして新しい翻訳を行っているのかを解明しようと試みました。彼らは次のように結論付けました。「ネットワークは、単にフレーズごとの翻訳を記憶しているのではなく、文の意味に関する何かをエンコードしているに違いありません。これは、ネットワーク内に中間言語が存在する兆候だと解釈しています。」
この引用文で重要なのは「我々はこれを次のように解釈する」という部分です。言い換えれば、彼らは自分たちが構築したシステムがどのようにしてこの問題を解決できたのか理解していないということです。彼らのシステム(ニューラルネットワーク)は、単に大量の例から一連のルールを学習したのではなく(コンピューターは長年それを行ってきました)、問題を解決するための斬新な方法を編み出したようです。
私の主張の根本的な前提は、AIとは下から積み重なるスタック内の一つのレベルに過ぎず、各レベルは下のレベルに依存しているということです。実際には、レイヤー間の境界が非常に曖昧であるため、AIはむしろスペクトルに近いと言えますが、スペクトルは記述が非常に難しいことで知られています。幸いなことに、すべてのレベルに明確な名前が付けられているので、ここではスタックとして記述します。
一番下は数学です。
数学
学校では数学が嫌いでしたが、それは数学と算数の違いを理解していなかったからです。算数は機械的なものです。数学は、数に内在するパターンを解明すること、つまり数が従う固有の規則を見つけることです。例えば、素数の分布の根底にある基本的なパターンを解明できていない(あるいは、そのようなパターンが存在することを証明できていない)ことが挙げられます。ある数が素数かどうかは検証できますが、次の数がどこにあるかを正確に予測することはできません。人類は有史以来、少なくともタリースティックの誕生以来、数学を研究してきました。
統計
数学の上に位置しているのは統計学です。統計学とは、現実世界の数値がどのように振る舞うかを研究することです。例えば、ヨークシャーでは人口一人当たりの魚の販売量がランカシャーよりも有意に多いかどうかを確認するために、売上高に対して統計検定を実行することがあります。私たちが統計検定を行うのは、通常、将来の何らかの行動を予測したいからです。統計学は、何かが必ず起こると断言することはできませんが、何かが起こる(あるいは起こった)確率を教えてくれます。この確率を用いて、情報に基づいた意思決定(例えば、ドナルド・トランプの行動について)を行うことができます。
統計学を数学の一分野と考える人もいれば、独立した学問分野だと主張する人もいます。統計学が数学に大きく依存していることに疑問を抱く人はほとんどいません。統計学なしに数学は存在し得ますが、その逆はあり得ません。統計学の起源は定義によって議論の余地がありますが、現代の統計学は驚くほど最近、わずか100年ほど前に始まりました。
データマイニング
統計学の上にデータマイニングがあります。これは、汎用化されたアルゴリズムを用いてデータ内のパターンを見つけるプロセスです。この用語は1990年代にデータベースコミュニティで登場しました(ただし、その根本的な起源はもっと以前から存在しています)。
明らかに、データ マイニングを実行するためにコンピューターが絶対に必要というわけではありません (鉛筆と紙によるアプローチも可能ですが、非常に時間がかかります)。現実的に、このプロセスは常にコンピューターと関連付けられてきました。
クエリとデータマイニングには根本的な違いがあります。クエリを実行する際、通常は仮説を立て、理論を検証します。「ヨークシャーではランカシャーよりも魚の売り上げが多いと思われるので、各郡での販売数をカウントするクエリを実行します。」一方、データマイニングを実行する際は、「このデータからパターンを見つけてください。」と要求します。
データ マイニングにはさまざまな種類 (クラスタリング、回帰など) があるため、検索するパターンの一般的なタイプを選択しますが、必ずしも特定の仮説をテストするわけではありません。
データマイニングアルゴリズムは統計に大きく依存しています。例えば、下のスクリーンショットのうち、クラスターが2つあるのはどれで、クラスターが1つあるのはどれでしょうか?クラスタリングアルゴリズムは確率に基づいて決定を下し、統計を実行することで確率を取得します。
牧師さん、クラスターは 1 つですか、それとも 2 つですか?
機械学習
データマイニングに加えて、機械学習があります。これは、データマイニングを用いてパターンを学習する技術です。例えば、保険金請求に関するデータセットをクラスタリングアルゴリズムに入力すると、不正請求であることが分かっている(訴状があるからです!)とします。アルゴリズムはクラスターのパターンを生成し、そのパターンを記憶させることができます。パターンを記憶させることで、機械に学習を促し、機械に学習をさせているのです。
次に、誠実であると知られているクレームをシステムに入力することで、誠実なクレームのクラスターパターンを学習します。学習されたパターンはデータモデルと呼ばれます。そして、(その誠実性の有無について意見を持たない)いくつかの新しいクレームを取り上げ、データモデルを用いて各クレームの誠実性について予測を行うことができます。これは機械学習(の一形態)です。
最後に、AI
機械学習は、ますます複雑な世界モデルを構築するために用いられ、私たちはそれらのモデルに基づいて意思決定を行い、アドバイスを提供するソフトウェアを開発しています。ある時点で、このソフトウェアは人工知能と呼べるほど複雑かつ効率的になります。
もちろん、「ある時点」というのは判断の問題です。あなたにとってAIとは何でしょうか?(AIは機械の意識を意味するものではありません。)自動運転車はAIの一例でしょうか?SiriやCortanaはどうでしょうか?
基準をどこに設定しても、AI と呼んでいるシステムは機械学習に大きく依存しており、それが機能するにはデータ マイニングが必要であり、データ マイニングは統計に大きく依存しており、統計は基本的に数学に基づいています。
例えば、自動運転車。AIを搭載しているかどうかに関わらず、これまで様々な情報源から膨大な量のセンサーデータを収集し、そのデータをマイニングしてデータモデルを生成してきました。走行中は、受信したデータとモデルを比較することで、車両の制御方法を決定します。そして、走行を続けることで学習を続けます。
AIを正確に定義したわけではありません。これはかなり意見の分かれるところだと思います。しかし、これらの基本的な定義が議論の助けになることを願っています。少なくとも、これらの定義によって、多くのシステムをAIではないものとして除外することができます。機械学習については十分に理解されているため、生データから一連のルールを学習してそれを適用するだけのシステムはAIではなく、機械学習です。AIであるためには、それ以上のことをしなければなりません。
私が目にした証拠から判断すると、富国生命にAIシステムがあるとは思えません。機械学習のように思えます。AIには、世界の様々な側面を学習し、それらの情報を統合して一般的な意思決定を行う要素が含まれているように思えます。保険システムはAIと呼ぶにはあまりにも焦点が絞られすぎているように思います。しかし、実用的なAIシステムの開発は目前に迫っていると確信しています。自動運転車はおそらくこれを実証している(あるいは実証するだろう)でしょう。
確かに、近い将来、AI が私たちの生活に影響を与え始めると私は信じています。
利用規約を見ると、Microsoft が Cortana を「それ」であるはずのものを「彼女」という言葉を使って人であるかのように呼んでいることがわかります。
Microsoftによると、「Cortanaはあなたのパーソナルアシスタントです。Cortanaはサインインしてデバイスのデータの使用を許可すると、最も効果的に機能します。」
ということは、Microsoft ではなく Cortana だけが私のデータを見るということでしょうか?
つまり、マイクロソフトはCortanaをAIと明確に考えており、その意味するところはAIが今ここにあるということです。®