特集1876 年の最初の電話通話は、アレクサンダー グラハム ベルが助手のトーマスに「ワトソンさん、こちらへ来てください。お会いしたいのですが」と頼んだことで始まりました。
1969 年、当時 ARPANET と呼ばれていたインターネット上で最初に送信されたメッセージは「LO」でした。システムがクラッシュしていなければ、これは「LOGIN」になっていたはずです。
Physical Intelligence の共同創設者であるセルゲイ・レヴィン氏によると、2023 年の最初のロボット基盤モデル API 呼び出しは「ナスを鍋に入れる」というものだったそうです。
レヴィン氏は、カリフォルニアのコンピュータ歴史博物館でヒューマノイド・ロボット工学と人工知能の現状を探ることを目的としたイベント「ヒューマノイド・サミット」を開始した。
野菜の配置は、マイルストーンとしてはドラマチックさに欠けるが、ヒューマノイドロボットを一般の人々にとって意味のあるものにするための道のりにおいて、意義深い節目となる。ナスを問題なく操作することは、決して容易な技術的課題ではない。
移動ロボットは、Waymo 社の自律走行車の形で、すでにカリフォルニア州サンフランシスコ、アリゾナ州フェニックス、カリフォルニア州ロサンゼルス、テキサス州オースティンなどの地域に導入されています。
ヒューマノイドロボットは、研究室や工場の現場で活躍しています。Fourier社は9月にGR-2シリーズのヒューマノイドロボットを発表しました。Figure社のO2ヒューマノイドロボットはBMWに導入されています。また、Boston Dynamics社のAtlasは、様々な動画でスタントを披露しています。
フーリエGR1ロボットの画像 – クリックして拡大
まもなく(正確な日付は未定)人間のようなボットが一般向けに利用可能になる。
1X Technologiesの共同創業者兼CEOであるベルント・ボルニッチ氏が発表したスライドによると、同社のNeoヒューマノイドロボットは、サンフランシスコ・ベイエリアの早期導入者向けに2025年にデビューする予定だ。
しかし、それには注意点がある。Neoは当初の展開では完全な自律走行ではなく、遠隔操作されることになる。
「AIが行うタスクもいくつかあります」と、1Xの営業担当副社長、ホルヘ・ミルバーン氏は説明した。「ナビゲーションはもちろん、ピックアンドプレースなど、その他の機能もすぐに使えるようになります。」
しかし、ネオは遠隔操作できる人間のオペレーターとペアになるだろうと彼は述べた。おそらく1対1で、遠隔操作を行うことになるだろう。「将来的には、実際の遠隔操作というよりも、監視に近いものになるだろう」と彼は述べた。
ミルバーン氏によると、1X社はNeoの設置場所については当初慎重になる見込みで、安全性への懸念が高いため、子供がいる家庭は避けることになるという。Neoは身長175cm、体重66ポンド(約30kg)で、バッテリー駆動時間は4時間だが、子供の上に落ちれば損傷する可能性がある。同社は、Neoの改良に必要なデータを集め、フィードバックを提供してくれる顧客を特に求めている。
主なボトルネックはデータの多様性です。ロボットが社会に広く普及するための道は、家庭を経由することになるでしょう。なぜなら、そのデータが必要だからです。
ミルバーン氏は、日常的なさまざまな作業の補助に加え、Neo の仲間としての側面も重要になると予想しており、これには常駐の AI モデルまたは人間の遠隔操作者との会話が含まれるだろうと述べた。
「自分自身をテレポートさせる機能も提供する可能性がある」と彼は述べた。つまり、VRヘッドセットを装着した外出先から、自宅にいるロボットの目を通して見ることができ、遠隔操作や通信を引き継ぐことができるようになるということだ。
人間の家庭に導入される最初のロボットの自律性が限られているのは、自動運転車と同様に、機械が住宅環境で動作するには大量のデータが必要であり、そのデータはまだ収集されていないという事実に起因しています。シミュレーションデータは役立ちますが、ヒューマノイドロボットが人間の世界で効果的に移動するには、人間の間を歩けるようになる前に、つまずいたり、手探りで進んだりする必要があります。
「最大のボトルネックはデータの多様性です」とボルニッチ氏は述べた。「ロボットが社会に広く普及するには、家庭を経由することになるだろう。なぜなら、家庭にはデータが必要だからです。」
- チャットボットにロボットを操作させると、予想通りひどい結果になる
- ロボットが低技能労働者のキャリア機会を奪う
- ああ、なんて気持ちいいんだ。トヨタは練習すればするほど上手くなるロボットを作っている
- 米陸軍、文字通り1トンの装備を運ぶ次世代ロボットラバを発注
Waymoのロボタクシーが当初人間の監視員に付き添われていたように、Neoボットやその他の人間型家庭用ロボットも、人間の監視の下、ぎこちなく外の世界へと旅立ち、最終的には自立運転に必要なデータを収集することになるだろう。そして、携帯電話と同様に、ロボットメーカーが課すプライバシーポリシーはプライバシーをほとんど保障しないだろう。ロボットが頼んだ朝食を落とした動画記録は、メーカーのエンジニアがロボットの性能向上に役立つだろう。
レヴィン氏の会社、フィジカル・インテリジェンスは、ロボットメーカーが遠隔操作の補助輪の域を超えて進化するのに役立つAIモデルの開発に取り組んでいます。これは「π0(パイゼロ)」と呼ばれる汎用ロボット基礎モデルです。
これは、GoogleのGemini 2.0 Flashのような単なる視覚言語(マルチモーダル)モデルではありません。これは視覚言語アクションモデルであり、その応答はロボットのハードウェアを制御するコマンドに変換されます。これは、ソフトウェアアプリケーションではなく物理ハードウェアにアクセスするソフトウェアエージェントシステムに似ています。
「ロボット基礎モデルのコンセプトは、多種多様なタスクを実行する膨大な種類のロボットシステムからのデータでトレーニングされたモデルです」とレバイン氏は説明した。
「インターネット規模のデータで事前学習されており、ビジョンと言語を理解できます。これにより、タスクの実行を指示したり、特定のアプリケーションドメインに合わせて微調整したりすることが可能になり、必要なデータ量や労力を大幅に削減して、ゼロからアプリケーションを開発できるようになります。」
このアプローチは有効であることが実証されています。π0モデルを搭載したロボットは、洗濯物を畳んだり、テーブルを片付けたり、箱を組み立てたりすることができます。これらの作業は人間の作業員の方がまだ得意で速いですが、ロボットも進歩しています。
ヒューマノイドロボットの雇用への影響は、様々なパネルディスカッションで取り上げられました。有能なロボット開発の根拠として、高齢化と雇用不足が盛んに議論されました。機械化労働力を売り込む人々は、自社のロボットが人間がやりたがらない仕事を奪う、あるいは単に人間が仕事のよりやりがいのある側面に集中するのを助ける、とよく主張していました。
私たちが目にするヒューマノイドの多くは、釘を探しているハンマーのようだ
確かにそういった側面もあるでしょうが、企業がオフショアリングによって人件費を削減できる機会があるにもかかわらず、人間の従業員にほとんど忠誠心を示さなかったことも事実です。ロボットが人間よりも安価に、少なくとも同等の能力と効率性で仕事をこなせる場合、人間はいずれ衰退していくでしょう。
いくつかのシナリオでは固定されたロボットアームや車輪付きの機械の方が理にかなっている可能性があるため、ヒューマノイドフォームファクターが正しい選択であるかどうかについては懐疑的な意見も出ました。
「私たちが目にするヒューマノイドの多くは、釘を探しているハンマーのようだ」とエンジニアード・アーツの米国事業部長レオ・チェン氏はパネルディスカッションで述べた。
チェン氏は、現在最も先進的なロボットの一つであるボストン・ダイナミクス社のアトラス・ロボットを例に挙げ、同社がこのロボットで得た最大の収益は、実用的なアプリケーションを実行する能力からではなく、スーパーボウルの広告にこのロボットを登場させることによるエンターテインメントから得たものだと語った。
ロボットのデザインに多様性が生まれると本当に素晴らしいと思います
テクノロジー業界において、適切なフォームファクターとは、顧客が購入するものそのものです。そして、人間向けに設計された環境で動作する必要があるシナリオにおいては、ロボットを人間のイメージに合わせて作ることには十分な根拠があります。
ロボットを作る人々のフォルムファクターについても話題に上がった。セミオの創業者兼CEOであるロス・ミード氏は、ほとんどのヒューマノイドロボットは、ロボットのあるべき姿について彼が少年時代に抱いていた考えを反映していると指摘した。パネルディスカッションに登場した6人が全員男性だったように、現在のロボットは男性のデザイン志向を反映している傾向があると彼は述べた。「ロボットのデザインに多様性が生まれると、本当に本当に素晴らしいと思います」と彼は語った。®