アントロピックがクロード3をアンロック、ChatGPTやジェミニよりも優れていると主張

Table of Contents

アントロピックがクロード3をアンロック、ChatGPTやジェミニよりも優れていると主張

AIスタートアップのAnthropicは、大規模言語モデルの最新バージョンであるClaude 3をリリースした。同社は、これがOpenAIのGPT-4よりも強力だと主張している。

月曜日に発表されたClaude 3には、Opus、Sonnet、Haikuの3つのサイズがあります(PDFファイルのフォーマットが不適切)。Opusは3つの中で最も高性能で、AnthropicのAPIとClaude Proサブスクリプションを通じて開発者とユーザーに提供されています。Sonnetは開発者がAPI経由でアクセスでき、現在Anthropicの無料ウェブチャットボットに利用されています。最小サイズのHaikuはまだ提供されていません。

アントロピックの報告によると、法学修士(LLM)の一般知識の保持能力、数学の問題の解決能力、コード生成能力、推論能力を評価する学術ベンチマークテストにおいて、OpusはOpenAIのGPT-4やGoogleのGemini Ultraよりも高いスコアを獲得した。開発者は、Opusが「複雑なタスクにおいて人間に近いレベルの理解力と流暢さを示し、汎用知能のフロンティアをリードしている」とまで自慢している。

一方、Sonnet と Haiku は OpenAI の以前の GPT-3.5 モデルよりも強力ですが、Google の Gemini Ultra および Pro モデルほど機能的ではありません。

Anthropic は、コンテキスト ウィンドウ (一度に処理できる入力の量) は最初は 20 万トークンになるが、最大 100 万トークンまで拡張できると説明しました。

Opusは高価で、科学研究や長く複雑なレポートの分析など、最高レベルのデータ理解と生成を必要とするタスクにAIを活用したいユーザー向けに設計されています。100万トークンに達する入力プロンプトの処理には15ドル、出力用に100万トークンを生成するには75ドルかかります。ちなみに、OpenAIはGPT-4 Turboモデルで100万トークンの処理と生成に10ドルから30ドルを請求しています。

Sonnetは、情報の検索・取得、マーケティングコピーの作成、コード生成など、高機能かつ高速なモデルを必要とする主流のエンタープライズユーザーを対象としています。大規模導入向けに最適化されており、入力100万トークンの処理と出力100万トークンの生成にかかるコストはそれぞれ3ドルと15ドルです。Haikuはさらに安価で、入力100万トークンの処理と生成にかかるコストはそれぞれ0.25ドルと1.25ドルです。コンテンツモデレーション、言語翻訳、カスタマーサービスなどの用途に役立つはずです。

  • ビジネス製品にLLMがますます増えていますが、その成果に対して誰が責任を取るのでしょうか?
  • トップレベルの法学修士課程修了生は、正確な法的議論を行うのに苦労している
  • FTC、OpenAIとAnthropicへの数十億ドルの寄付をめぐりAmazon、Microsoft、Googleを調査
  • 「スリーパーエージェント」AIアシスタントが気づかれずにコードを妨害する方法

Amazonは、AnthropicのClaude 3モデルをBedrockクラウドプラットフォームでホストすると発表しました。Sonnetは本日、OpusとHaikuは近日中にホスト予定です。Google CloudのVertex AI Model Gardenについても同様の発表があり、Sonnetは現在プライベートプレビューとして提供されており、3つのモデルすべてへのAPIアクセスがまもなく提供される予定です。

Claude 3は、前世代機よりも慎重さが欠けています。Claude 2.1では、架空の物語を書くようにというリクエストなど、必ずしも有害ではないプロンプトへの応答を拒否することがよくありました。開発者の発表では、ユーザーに対して次のように保証しています。「この分野では大きな進歩を遂げました。Opus、Sonnet、Haikuは、システムのガードレールに抵触するプロンプトへの応答を拒否する可能性が、前世代機と比べて大幅に低くなっています。」

AIの顔の概念図

大規模言語モデルの驚くべき創発的行動は「幻影」として片付けられた

続きを読む

しかし、法学修士(LLM)を悩ませる最大の問題は、不正確な情報を生成したり、ユーザーが信じてしまうほど自信過剰に情報を捏造したりする傾向があることです。こうした誤り(幻覚と呼ばれる)は、AIソフトウェアの出力を信頼することを困難にし、ましてやコンピューターにタスクにおける自律性を与えることを困難にしています。

アントロピックは、OpusはClaude 2.1と比較して精度が「2倍向上」すると約束し、最新モデルの出力結果に出典を明記してユーザーが確認できる機能を導入する予定だ。これは、Google Geminiが質問への回答の一部で情報の出典を明示するのと似ている。

「モデルのインテリジェンスが限界に近づいているとは考えていません。今後数か月間、Claude 3 モデルファミリーのアップデートを頻繁にリリースする予定です。また、特にエンタープライズユースケースや大規模展開向けに、モデルの機能を強化する一連の機能をリリースできることを嬉しく思います」と、Anthropic の発表は締めくくられています。

興味深いことに、AnthropicはClaude 3をマルチモーダルシステムにしないことを選択しました。Claude 3は画像を処理できますが、画像を生成することはできず、ChatGPTやGeminiとは異なり、音声やビデオ入力も処理できません。®

進行中の AI 戦争への一撃となる、The Next Platform による Claude の考察をお見逃しなく。

Discover More