人間の想像力において、AIは二つの点で有益だと考えられてきました。一つは、人間を支配しようとすること、そしてもう一つは、良いゲームを愛することです。戦後初期のAI研究者たちは、コンピューターがチェスで人間に勝てば、真の人工知能が到来するだろうとほぼ当然のことと考えていました。しかし、この考えは50年後、1997年にIBMのディープ・ブルーがカスパロフを破ったことで反証されました。コンピューターは、小石程度のIQしか持たないにもかかわらず、チェスでは非常に優れた能力を発揮できるのです。
ゲームをプレイすることとAIをプレイすることの間の、機能不全な恋愛関係が薄れることは決してありません。機械学習推進派は、囲碁プレイヤーへの勝利や、AIがビデオゲームを嗜むようになったことを大々的に宣伝しています。一方で、一流の生成AIでさえ、ビデオチェスではAtari 2600に勝てません。もしかしたら、8ビットのZX81 1K Chessの1024バイトから始める方が親切かもしれません。ChatGPTは三目並べでは相変わらず見事に無能です。さあ、起動して試してみましょう。三目並べはあまりにもシンプルなゲームなので、リレーと電球をいくつか用意するだけで無敵のマシンを作ることができます。
これは笑える。しかし、些細なことだ。チェスとAIを結びつける初期の議論は誤りだったが、重要な反証となった。当時、人間の知性の仕組みは、コンピューターの発展の仕方と同じくらい理解されていなかった。非常に賢い人々がそう考えていたということは、二つのことを示している。一つは、私たちが直感的にゲームを腕前のベンチマークとして使っていること、もう一つは、ゲームが幅広い聴衆を保証できるAIについての議論の場を生み出しているということだ。人々の議論を呼ぶAIベンチマークこそが、現在私たちが歓迎するよう促されているAIの虚脱に対する最良の防御策となるだろう。
「AIは本来の役割を果たしていないので、我々を放っておくべきだ」とガートナーのトップアナリストは言う
続きを読む
エージェント型AIが実際にどれほどうまく機能するかに関する最新の研究をご覧ください。AIエージェントは、データの収集、分析、そしてそれに基づいた行動といった特定の作業ベースのタスクを任せられる、魔法のような新しい独立したアシスタントとして大いに宣伝されています。しかし、実際にはうまく機能するのでしょうか?ほとんどの場合、うまく機能しません。複雑な状況や状況に対応できなかったり、幻覚を起こしたり、人を欺いたり、タスクを完了できなかったりといった、AIによくある行動をします。
カーネギーメロン大学(CMU)の研究者たちが、従業員を演じることのできる擬似ビジネス環境を作り上げ、AIエージェントを配置して綿密な監視とスコアリングを実施しました。言い換えれば、現実世界の課題をシミュレーションしたゲームです。これは技術的なプロセスを人間味あふれるものにし、重要な意味を持ちます。
私たち人類にとって、ゲームの目的は勝つことではありません。少なくとも、心の底では。ほとんどの人はほとんどの場合勝てません。ゲームは実験を通してスキルを学ぶ場です。人間にとって、そこには他者との協力や評価といった重要なスキルが含まれます。自信過剰、スキル不足、そして現実よりも欺瞞を好む傾向は、チームプレーヤーにすぐに悪評をもたらし、それが現実生活にも影響を及ぼします。正気な雇用主は、このような人材を雇うべきではありません。もし雇うとしたら、その正気さは疑わしいものです。
AI、特にあなたの代わりに行動できると主張するAIは、約束だけで安易に利用されるべきではありません。これは、実際の人間のアシスタントが履歴書の記載だけで採用されるべきではないのと同じです。AI開発者は素晴らしい約束をしますが、AI自身は(過剰な)自信の持ち主です。面接プロセスが、将来性と自信をスキルや誠実さと比較評価する方法であるように(あるいはそうあるべきですが)、AIと共に働く人々が使用できるベンチマークを進化させる必要があります。それは、AI評価スキルを持つ人だけに限定されるべきではありません。そのようなスキルを持つ人は、そもそも存在するとしても稀です。
ここでゲームの出番です。ゲームは非常に人間的な評価手法であり、その結果は他の人に伝えやすいです。最終的なスコアは重要ですが、プレイ中の感情ほど重要ではありません。人々が関心を持ち、語りたくなる物語を突き動かすのは、まさにこの感情なのです。
- あなたのブラウザには広告技術の痕跡がびっしりついている。しかし、街にはそれを一掃する部隊がいる。
- 人類が反撃の準備を整える中、AIの誇大宣伝は悪夢に見舞われる
- 脆弱なアジャイル開発モデルは、プロジェクト失敗の原因ではなく、症状である。
- 企業のWindows 11更新にAIが貢献?誰も信じない
ChatGPTに三目並べを頼む場合は、事前にChatGPTの強みについてどう考えているか尋ね、その後でどこがうまくいかなかったのかを説明してみてください。そうすれば、誰にでも話せる、そして話したくなるような、技術に関するストーリーが生まれるでしょう。
AIの誇大宣伝から身を守るには、まさにこれが必要です。IT業界の同僚に技術のつまらなさを語るだけでは意味がありません。叔母や甥、CEOにも知られるほど、文化に深く根付いていなければなりません。人間とAIを繋げられるゲームのような環境を作る方法を見つけるのは容易ではありませんが、CMUの論文には多くのヒントが示されています。結局のところ、ビジネスにおけるゲーミフィケーションに他に応用できないというわけではありません。
大規模推論モデルに圧力をかけると、意味をなさなくなると科学者は言う
続きを読む
AI業界は、もし誇大妄想や希望ではなく、もっと根拠のある自信を持っているなら、この問題に全力で取り組むべきです。過去のAIの冬の時代は、スプレッドシートと同じくらい感情的なものでした。AIは偉大な時代を迎えつつあり、さらなる投資によってそこに到達するだろうという認識は、他の話題がより魅力的になるにつれて薄れていきました。AIエージェントが、人々が本質的に評価できる方法で、共に働くのに良いものであることを示すことは、良いこと以外の何ものでもありません。そうでしょう?
そう思っていないこと自体、良い話だ。しかし、深刻な欠陥を抱えながら、副チームメーカーのアシスタント職にも就けないほどの技術を、ビジネスの中心に据えようとしているのもまた、また別の話だ。こうした物語をテクノロジーの殿堂の外で伝える方法を見つけることは、実に真剣な仕事だ。さあ、ゲーム開始だ。®