AI医療?ワトソン博士、未来への回帰だ

Table of Contents

AI医療?ワトソン博士、未来への回帰だ

分析「確かにエラー率はひどいですが、人工知能なので改善されるばかりです!」

もちろんです。AIは常に「改善」し続けています。巧妙に擬人化された「機械学習」という表現からもそれが分かります。学習システムは愚かになることはありません。しかし、実際には改善しなかったとしたらどうなるでしょうか?

この警告は、今日の機械学習やAIに関する主流の話題のほとんどに付きまとう。しかし、実はこの警告は40年前、AIが「医療に革命を起こす」と最後に言われた時に、大きな自信を持って表明されていたのだ。

IBMのワトソン・ヘルス担当ゼネラル・マネージャー、デボラ・ディサンゾ氏によると、IBMの野心的なワトソン・ヘルス・イニシアチブは「2兆ドルの価値」を生み出すという。

しかし、今年は間違った種類の見出しを呼んでいる。テキサス大学のがんセンターは2月、IBMとコンサルタント会社プライスウォーターハウスクーパースに6000万ドル以上を費やした後、Watsonプロジェクトを一時停止した。今月初め、StatNewsは後継機であるIBMのWatson for Oncologyの欠陥に関する興味深い調査記事を掲載した。IBMのマーケティング部門は、Watson for Oncologyは「医師が患者一人ひとりに対して、がんの診断をより深く理解するのを支援する」と主張している。

AI導入を検討しているなら、 StatNews記事は必読です。人工知能についてほんの少し触れているだけで、実際にはシステム導入の落とし穴や文化的な慣習についてより深く掘り下げているからです。ここ数週間、GizmodoMIT Technology ReviewもWatson for Oncologyを批判的に取り上げています。後者の記事では、システムの設計者たちがWatsonを擁護する主張に失望を表明しています。

「本当に残念だ」と、テクノロジー書籍出版社オライリーの書籍編集者アンディ・オラム氏は、ネットプロトコルのパイオニアであるデイブ・ファーバー氏に宛てた手紙で述べた。「この話題の医療AIは、1980年代のエキスパートシステムのようなもので、がんの診断には向いていない」

彼は何を意味しているのでしょうか?

今日の機械学習熱の多くが以前の誇大宣伝を彷彿とさせていることが不思議なので、少し立ち止まって、ある傑作の人工知能医療システムの運命を検証し、歴史から学べることがあるかどうかを見てみましょう。

マイシン

AIの歴史は、短い期間の誇大宣伝と投資を挟みつつ、長く続く無関心の「冬」の時代でした。エドワード・ショートリフによって開発されたMYCINは、最初の「AIの冬」の早い時期に登場した、臨床医を支援するために設計された後方連鎖システムでした。

MYCIN は AI を利用して感染の原因となる細菌を特定し、臨床医から提供された情報に基づいて患者に適切な投与量を推奨しました。

MYCINにも経験の痕跡が残っていた。AIの最初の20年間は、人間のあらゆる知識を記号と規則にコード化し、デジタルコンピュータでアルゴリズム的に処理できるようにするという野心的なプロジェクトだった。大きな成果が期待されていたにもかかわらず、実用化にはほとんど至らなかった。そして1973年、英国は3校を除くすべての大学からAIへの資金提供を停止した。AI研究の環境は再び冷え込んでしまった。

AI研究者たちは新たなアプローチを模索せざるを得ませんでした。最も有望視されたのは、システムに制約を与えること、つまり問題空間を単純化することだったのです。マイクロワールド、つまり人工的に単純な状況は一つのアプローチであり、テリー・ウィノグラッドのブロックスタッカーSHRDLUはその一例です。マイクロワールドから、ルールベースの「エキスパートシステム」が生まれました。MYCINはまさにそのようなルールベースのシステムでした。150個のIF-THEN文で構成されるMYCINは、限られた知識ベースから推論を行いました。

MYCIN の詳細な説明は、こちら (PDF) にあります。

当時、MYCINの擁護者たちは、どんな「専門家」もMYCINを上回ることはできないと主張し、熱狂的な支持を集めました。MYCINには称賛すべき点が多くありました。ユーザーに確率値と証拠の完全なトレースを提供するという点で、誠実でした。

今日の AI 実験では、あなたが同性愛者であるかどうか (そして将来的には、スタンフォード大学の開発者は、あなたの政治的見解も) を判別できると主張しているが、この見出しには、多くの訓練 (または「学習」) を経て導き出された確率が隠されている。

ほとんど、あるいは全く失敗率を報じない主流の出版物とは異なり、私たちは失敗率を報じています。例えば、マスク着用の顔を識別できると主張するAI認識の失敗率は驚くべきものでした。帽子とスカーフを着用した状態では、AIの精度は43~55%でした。「実用的なレベルでは、それほど素晴らしいものではありません」と私たちは指摘しました。

Discover More