昨年、Meta スマートグラスをプライバシー侵害マシンに変えたことで話題を呼んだハーバード大学の 2 人組は、今度は独自のスマート グラスを販売している。彼らはThe Registerに対し、このグラスは人々の会話を 24 時間 365 日盗聴し、一方的にフィードバックすることで人々を「超インテリジェント」にするものだと語った。
ケイン・アーデイフィオ氏とアンフー・グエン氏は火曜日、Halo Xの予約注文を開始しました。これは、彼らが設計したスマートグラスです。Meta Ray-Banのようなカメラは搭載されていませんが、ヘッドアップディスプレイを備えています。ディスプレイと内蔵マイクに加え、グラスが聞き取った情報を処理できるとされるエージェントAIを搭載しており、装着者の状況に応じて適切な情報を返すことができます。
「これを装着した瞬間、文字通りどんな質問にも答えられるようになります」とグエン氏はインタビューで語った。「世界のGDPトップ3は何か、コロンブスが航海に出た日はいつか、といった質問もできます。経済、歴史など、あらゆる分野のあらゆる事実を知ることができるのです。」
念のため言っておくと、グエン氏とアーデイフィオ氏は現在も独自のハードウェア開発プロセスを進めており、The Register紙の取材に対し、最終製品については現在3社のベンダーから選定中だと語った。そのコンセプトイメージはこの記事に掲載されている。シリコンバレー地域には約20名のテスターがベータ版を装着しており、これらは非公開のサードパーティ製ハードウェア上で動作している。
しかし、Halo 社が夏に公開したソーシャルメディアのビデオでは、このメガネのベータ版が公共の場で使用されている様子や、メガネを使用するシミュレーション画像が紹介されている。
設計通り、このグラスはBluetooth Low Energy接続を介して、ペアリングされたHaloアプリを実行しているiPhoneに音声を送信し、iPhoneは文字起こしされたリクエストをHaloのクラウドプラットフォームに送信して処理します。文字起こしと要約はペアリングされたデバイスにローカルに保存されますが、AIによる処理はすべてクラウドで行われます。Ardayfio氏によると、GoogleやPerplexityなどのプロバイダーのモデルを組み合わせることで、Haloは「速度、コスト、文脈推論」のバランスをとっているとのことです。
メガネのディスプレイには、1行あたり約40文字のテキストを4行ほど表示できます。それほど多くはありませんが、Ardayfio氏はこれを「長い文章ではなく、素早く一目でわかるプロンプト」を表示するのに最適化したちょうど良い手段だと説明しました。
Halo Xグラス自体は画面のみなので、操作性はあまり良くありません。Ardayfio氏によると、グラス本体でできることは、上方向にうなずくことで時間やカレンダーの予定などを表示するダッシュボードを表示することくらいで、それ以外はすべてペアリングしたスマートフォンから操作します。
グエン氏とアーデイフィオ氏によると、インターネット検索を必要とする質問には最大2秒かかるものの、天気予報などの質問には数百ミリ秒で回答できるとのことだ。このメガネ自体はAIの高度な処理をほとんど行わず、アーデイフィオ氏はこれをより大規模なAIシステムのディスプレイのようなものだと説明している。
このメガネができるのは、ウェブで面白い豆知識を検索するだけではありません。聞いた内容をすべて記録したリポジトリを作成し、必要に応じて過去の会話のAIによる要約や、会議での発言内容のリマインダーなどを提供することもできます。例えば、「土曜日に妻と娘の大学の授業料についてどう決めたか教えてください」と尋ねると、このメガネはクラウドストレージサービスにリクエストを送信して会話のテキストを検索し、要約してディスプレイにテキストとして表示します。
設計とデモの通り、Halo Xはプロンプトワードを聞き取ることすらありません。単に、何かが自分宛てのものかどうかを理解し、適切な応答を返すだけの知性を備えているだけです。つまり、Halo Xは常に聞き耳を立て、常に記録していますが、それでも時々間違えることがあります。
「当社のカスタム AI エージェントは、あなたの一日を丸一日聞いています」とグエン氏は説明する。「あなたが言うすべての文章が AI に送信され、AI は、その時間にあなたを助けるべきかどうか、また、どのようなことであなたを助けるべきかを理解します。」
公共の場で聞こえるすべての音を録音することによるノイズ(およびプライバシーの侵害)については、アーデイフィオ氏は、このメガネは着用者に焦点を当てるように設計されており、背景の会話は通常無視されると語った。
「このメガネは、ユーザーの発言が返答に値するかどうかを継続的に確認します」とアーデイフィオ氏は電子メールでの声明で述べた。「人間からのフィードバックを用いてシステムをトレーニングし、介入すべきタイミングと介入すべきでないタイミングを改善してきました。まだ完璧ではありませんが、このアプローチによって着実に改善が見られてきました。」
最終的には、メガネが十分なトレーニングを受けて、望ましくないときに介入するハードウェアではなく、礼儀正しく役立つアシスタントになることをデザイナーたちは思い描いています。
「私たちは、自分たちの技術が完全に消え去ることを望んでいます。ただのスマートウォッチではなく、直感のように感じられる第二の脳を作りたいのです」とグエン氏は語った。
Halo Xがそこまで到達できれば、職場で非常に役立つ可能性があります。誰も、そのプロジェクトを率いることを申し出なかった、あるいは悪いアイデアの責任を逃れたとは言えなくなります。2人は、エンタープライズユーザーを視野に入れており、その分野の人たちと話し合ってニーズを探っているとのことですが、まだ具体的なことは何も明かせませんでした。
プライバシーの挑発
2024年に私たちが最後にアルデイフィオ氏とグエン氏に話を聞いたとき、彼らはMeta Ray-Banスマートグラスからビデオストリームをキャプチャし、それをAIに送り、不運にも視界に入ってしまった人々の詳細な個人情報を収集するソフトウェアをデモンストレーションしたばかりだった。
彼らのこれまでの取り組みを考えると、瞬時に目に見える形で情報を取得するという発想は理にかなっている。しかし、プライバシーの問題も伴う。Halo XのAIエージェントは、ペアリングしたスマートフォンアプリ(iOSでは利用可能だが、Ardayfio氏によるとAndroidでは「しばらくは」対応しない見込み)で無効化できる。しかし、サービスを提供せずにバッテリーを徐々に消耗させるだけのメガネ以上のものを望むなら、AIエージェントに常に聞き耳を立てさせる必要がある。
- セルゲイ・ブリンは、次世代のグラスホールはそれほど目立たなくなると約束している
- Googleがビジネスグレードの拡張現実(AR)機器の販売を停止
- ニューオーリンズの襲撃犯は元旦の大量殺人を計画するためにメタスマートグラスを使用していた
- Metaは、チャットボットにソーシャル要素を少し加えたいと考えているようだ
もしそれがプライバシーの悪夢のように思えるなら、それはあなただけではありません。当然のことながら、Ardayfio氏とNguyen氏はこうした懸念に対処する計画を立てています。
「あなたについてすべてを知っているAIは非常に便利です」とグエン氏は述べた。「しかし、プライバシーは大きな問題です。」
火曜日からHaloから予約注文できるAIグラスには、エンドツーエンドの暗号化を提供するソフトウェアが搭載され、「あなた以外は誰も会話を読めない」とグエン氏は語った。
Ardayfio社によると、テストではまだ実装されていないものの、暗号化はキャプチャ時、保管時、そして転送時にグラス上で行われるとのことです。つまり、正しく実装されれば、Halo Xグラスのトランスクリプトは、スマートフォンとグラスの画面で作成した本人のみがアクセスできることになります。Halo社は、SOC 2準拠の達成にも取り組んでいると述べています。
Halo X のユーザーが公共の場で聞いたすべてを録音し、AI で消化してインデックス化することに関してプライバシー上の懸念があるかどうかについては、それはユーザーの責任ではないと Nguyen 氏は語った。
「結局のところ、ZoomのメモアプリからiPhoneのボイスメモまで、適切な同意を得る責任はエンドユーザーにあります」とグエン氏は述べた。「他の会議メモアプリと同様に、ユーザーには責任ある方法で製品を使用し、やり取りする相手から同意を得ることを期待しています。」
しかし、ZoomノートテイカーとHalo Xの違いは、後者はいつでもどこでもオンにしておくことを前提に設計されている点です。では、ユーザーは公共の場ではHalo Xをオフにしたり、レストランのウェイターやスーパーのレジ係に録画の同意を求めたりするのでしょうか?それとも、そのままオンにして他の人の意向を無視するのでしょうか?また、録画に双方の同意が必要なカリフォルニア州に住んでいる場合はどうでしょうか?
Halo Xスマートグラスのレンダリングされたコンセプト画像 - クリックして拡大
3 週間のテストを経て、結果は良好でしたが、完璧ではありませんでした。
「まだ初期段階ですが、フィードバックは非常に期待できます」とグエン氏は述べた。「専門家の方々は、既にメモを取るソフトウェアを使っているにもかかわらず、このソフトはどこでも使えるので、概ね好評です。」
「とはいえ、AIにはまだやるべきことがたくさんあると思います」とグエン氏は続けた。これは、AIが愚かだと言っているわけではない。むしろ、初期テスターたちは、AIがユーザーをどのように、何を使って、いつ支援すべきかを判断する能力をもう少し向上させてほしいと考えていたのだ。
「人々が望む支援方法は実に多種多様です」とグエン氏は付け加えた。「ですから、私たちは今も制御方法の改善策を考えています。」両氏によると、一つの可能性として、ユーザーがHaloエージェントのマスターAIプロンプトを編集し、特定の状況でのみ応答するように指示する機能を追加することが挙げられた。
常に聞き耳を立ててくれるAIグラスを試してみたい方は、今すぐ249ドルで予約注文できます。ただし、発送は来年初めまでお待ちください。ただし、あなたの前にいる人が話さなくなるかもしれませんので、驚かないでください。®