Atari 2600 エミュレータ上で Video Chess の手にかかって ChatGPT を打ち負かすだけでは満足せず、Robert Caruso 氏は、今度は Microsoft の Copilot を使って再度挑戦しました。
理論上は結果は同じで、Copilotも同様に大敗するはずです。しかし…もしChatGPTができなかったことをCopilotが成し遂げたらどうなるでしょうか?「そんなことは考えられません」とCaruso氏は書いていますが…「もしマイクロソフト製品がChatGPTを上回ったら、誰もが頭が爆発しそうになるのを想像してみてください。」
そこでカルーソはステラエミュレータを起動し、Copilotとゲーム開始前にチャットを行い、ChatGPTの何がうまくいかなかったのかを説明した。彼はチャットボットに、ChatGPTが負けた主な理由の一つは盤面の追跡ができなかったことだと伝えた。もしCopilotでも同じ問題が起きるなら、わざわざプレイする意味はほとんどないだろう。
AIチャットボットならではの自信で、コパイロットはチェスをプレイできるだけでなく、実に上手いと主張した。カルーソ氏は「10~15手先まで予測できると主張していたが、2600に対しては『最適ではない手』を打つため、『深い計算にこだわるよりも、それを活かせる』と考え、3~5手までしか予測できないと考えた」と述べている。
囲碁を打つAIシステムに人間が反撃
続きを読む
盤面の追跡はどうなっているのだろうか?コパイロットは「前の動きをしっかり覚えて、ゲームプレイの連続性を保つように心がけているので、試合はもっとスムーズに進むはずです」と自慢げに語った。
CopilotはChatGPTと同様の空間記憶の欠陥を認めたものの、現在の盤面を分析し、適切な動きを選ぶことはできると述べている。Caruso氏は、Atariの手番後の盤面のスクリーンショットをチャットボットに渡し、Copilotの動きをVideo Chessに手動で入力する必要がある。
ゲームが始まりました!
今日のジェネレーティブAIシステムを経験した人なら、何が起こったかもうお分かりでしょう。コパイロットの傲慢さは見当違いでした。その動きは…興味深いものでした。強力なAtari 2600 Video Chessがポーン1つしか失っていないのに対し、コパイロットはポーン2つ、ナイト1つ、ビショップ1つを失いました。最終的に、カルーソはコパイロットに、自分が貼り付けた最後のスクリーンショットと、コパイロットが想像した盤面を比較するように指示しました。すると、チャットボットは両者が異なっていることを認めました。
- チャップは、Atari 2600がChatGPTのチェスを完全に破壊したと主張している
- グーグルはマイクロソフトと戦う業界団体と提携するために数百万ドルを提示した
- クラウドストライク、世界的なIT障害を引き起こした「パーフェクトストーム」について議会に謝罪
- CISPEの求婚者はマイクロソフトだけではなかった。クラウドライセンスに関する自社の見解が受け入れられるために、グーグルも金銭を支払う用意があったようだ。
「ChatGPTのデジャブ。」
このハンディキャップでマイクロソフトのチャットボットが勝てるはずはなかった。それでも、敗北を潔く受け入れた。「このラウンドはアタリが勝利を収めた。正々堂々と私を打ち負かした、往年のシリコンの天才に、尊厳と名誉を込めてデジタルキングを捧げよう。」
カルーソの実験は面白いが、AIがいかに自信過剰でナンセンスを吐き出せるかを浮き彫りにする。Copilot(ChatGPTと同様に)はチェスの基礎を訓練されていたと思われるが、戦略を立てることができなかった。チェス盤上の局面をCopilotが理解していたものと現実の局面が著しく異なっていたという事実が、問題をさらに複雑にしていた。
この話の教訓はこうだ。チャットボットの自信過剰には注意せよ。法学修士は確かに得意なことがあるようだが、45年前のチェスゲームは明らかに得意ではない。®