ビデオOpenAI の挑戦者である Anthropic は、最新モデルである Claude 3.5 Sonnet を発表し、多くのタスクでライバルを凌駕していると主張しました。
アントロピックは木曜日の発表で、クロード3.5ファミリーの最初のリリースとなるモデルを提供し、以下の表に示すさまざまな知識ベースのベンチマークを使用して、OpenAIのGPT-4o、GoogleのGemini 1.5 Pro、およびMetaが最近発表したLlama3-400Bモデルの初期スナップショットよりも高いパフォーマンスを実現したと主張した。
Anthropic は、Claude 3.5 モデル ファミリーの最初のエントリが、さまざまな知識ベースのベンチマークですでに OpenAI と Google を上回っていると主張しています... クリックして拡大
元OpenAIスタッフや、元Registerのハゲタカ、ジャック・クラーク氏らによって開発されたAnthropicは、Claude 3.5 Sonnet(以下、Sonnet 3.5と略します)はユーモアの理解度が向上し、より扱いやすくなっていると主張しています。Anthropicによると、この点とその他の改良点により、複雑な命令の実装を要求された場合でも、モデルの信頼性が向上しているとのこと。
以下はサンフランシスコの新興企業が自社の技術をデモしているビデオです。
YouTubeビデオ
このリリースでは、Claude.ai チャットボットに「Artifacts」と呼ばれる機能も導入されました。これは、プログラムによって生成されたコンテンツを専用ウィンドウに送信するもので、Anthropic はこれを「ユーザーが Claude の作品をリアルタイムで確認、編集、構築し、AI 生成コンテンツをプロジェクトやワークフローにシームレスに統合できる動的なワークスペース」と説明しています。
「近い将来、チーム、そして最終的には組織全体が、知識、文書、進行中の作業を 1 つの共有スペースに安全に一元管理できるようになり、クロード氏はオンデマンドのチームメイトとして機能できるようになります」と Team Anthropic は誇らしげに語った。
この機能は、Sonnet 3.5 が、モデルの短期メモリと考えることができる、前身の 200,000 トークン コンテキスト ウィンドウを維持しているという事実によって間違いなく助けられています。
Sonnetのビジョン処理能力は、複雑な画像からテキストを抽出し、グラフやチャートを解釈する能力が向上しました。Anthropicの言うことを信じるならば、Sonnet 3.5は、視覚的な質問応答を除くすべての分野で、GPT-4oおよびGemini 1.5とビジョンワークロードを比較した際に優位に立っています。
グラフィックスの解釈などの視覚ワークロードに関しては、Anthropic は ChatGPT や Gemini よりも優れていると主張しています... クリックして拡大
安全性とプライバシーは、このスタートアップ企業にとって依然として中心的な信条であり、同社は最新モデルにAI安全レベル2(ASL-2)を付与しました。Anthropicは、スコアが高いほど危険な能力が高いと認識しています。この評価は、生物兵器の製造方法を人に教える能力など、「危険な能力の初期兆候を示す」モデルを指し、検索エンジンでは提供できない情報を提供するには至りません。
- Google DeepMindの最新モデルは、AI生成動画にリアルな音声を実現することを約束する
- マスク氏、デルとスーパーマイクロをxAIスーパーコンピュータプロジェクトに引き入れ
- クラウドとネットワークのAI支援自動化がガートナーのハイプサイクルを駆け上がる
- OpenAIの共同創設者イリヤ・スツケヴェル氏の新しいスタートアップは「安全なスーパーインテリジェンス」の創造を目指す
アンスロピックは、モデルの安全性とプライバシーを維持するために、英国の人工知能安全研究所と、ネット上での児童の保護を専門とする組織であるソーンからのフィードバックも取り入れ、モデルを微調整した。
Sonnet 3.5はAnthropicのウェブアプリとモバイルアプリで利用可能で、開発者はAPI、Amazon Bedrock、またはGoogle Vertex AIを使用してモデルをプロジェクトに統合できます。APIアクセスには、入力トークン100万個ごとに3ドル、出力トークン100万個ごとに15ドルの費用がかかります。
AnthropicはClaude 3.5ファミリーにさらなるモデルを追加する予定で、HaikuとOpusのバリエーションは今年後半にリリース予定です。モデルビルダーであるAnthropicはすでに次世代AIモデルの開発に着手しており、メモリなどの新機能を統合することで、その機能をさらに拡張する予定です。
法学修士課程の学生たちはいつもそうであるように、幻覚作用があり、間違った解釈をすることもあります。もちろん、役に立つ部分もあります。人それぞれです。®
追伸:マーケティングの話から離れて科学的な話に移りましょう。Anthropicが先月発表した研究論文は、同社のモデルが内部的にどのように機能するかを非常に詳細に解説しており、興味深い内容となっています。論文では、例を挙げながら数学的な解説もされています。