今年の ACM コンピューティング賞は、名前は聞いたことがなくても、その研究成果はよく知られているであろう機械学習の専門家に贈られる。
カリフォルニア大学バークレー校教授でAIロボット企業Covariantの共同創業者でもあるピーター・アビール氏がこの賞と25万ドルの賞金を受賞した。この賞は機械学習分野において「研究貢献が根本的な影響と幅広い意味を持つ」人に与えられる。
アビール氏はコンピュータサイエンスと電気工学の教授であり、その研究は既に一定の評価を得ています。今回の新たな賞に加え、MITテクノロジーレビュー誌の25歳未満の若手イノベーターとして選出され、ロボット工学とオートメーション分野の米国最優秀博士論文賞も受賞しました。
2021年ACMコンピューティング賞受賞者ピーター・アビール
ACMは、アビール氏が徒弟制度と強化学習の先駆者であると述べ、変形可能な物体をより巧みに操作できる衣服折りたたみロボットを設計したことを強調した。また、縫合糸を結んだり物体の軌跡を検出したりできる機械の開発にも貢献した。
さらに、アビール氏は、信頼領域ポリシー最適化、ワンショット模倣学習、ドメインランダム化、後知恵経験再生、一般化利点推定、ソフトアクター クリティックと呼ばれる強化学習アルゴリズムの開発にも貢献しました。
アビール氏の会社であるコバリアント社も、2020年に人間よりも速く機器を仕分けできるロボットアームを開発するなど、画期的な進歩を遂げている。
- 前糖尿病の診断においてAIと人間の間に「実質的な違いはない」
- Nvidia、AI・アクセラレータハードウェア販売を牽引した米国の主要パートナーを発表
- マイクロソフトとHPE、宇宙飛行士の手袋のチェックにAIを導入
- Googleは5400億パラメータのテキスト生成AIシステムを宣伝している
ACMは、アビール氏の機械学習分野における最も重要な貢献の一つは、強化学習と深層ニューラルネットワークを組み合わせた深層強化学習の研究であると述べた。「初期の強化学習プログラムは効果的でしたが、単純なタスクしか実行できませんでした。…深層強化学習は、強化学習のみで開発されたコンピュータプログラムよりもはるかに複雑な問題を解決できます」とACMは述べている。
深層強化学習(DRI)は、抽象的で非構造化されたデータからより効果的に学習できるため、AIはより少ない事前知識でより迅速に学習することを可能にします。このアプローチは、囲碁、チェス、ポーカーで人間に勝つための学習といった注目度の高いアプリケーションで利用されているほか、ソーシャルメディアの通知機能の改善や自動運転車のトレーニングにも活用されています。
一方で、深層強化学習は機械学習のパラダイムであり、現実を正確に複製することができない非実用的なプロセスであると考える人もいます。
Google のソフトウェア エンジニアである Alex Irpan 氏は、2018 年に、ディープラーニングでは結果を生成するために非常に大量のデータが必要になるという特性があり、実際のアプリケーションではその利点が得られない可能性があると書いています。®