すべて
タグ
Anthropic、新AIモデル「Claude Sonnet 4.6」を発表
アップデート
AI関連

Anthropic、新AIモデル「Claude Sonnet 4.6」を発表

公開日:

米AI企業Anthropicは、主力AIモデル「Claude」シリーズの新バージョン「Claude Sonnet 4.6」を発表しました。コーディングやコンピューター操作、長文理解など、幅広いスキルにおいて従来モデルを上回る性能を実現し、一部のタスクでは最上位モデル「Opus」に匹敵する結果も示しています。無料プランを含む全プランでデフォルトモデルとして利用可能です。

この記事をシェア

ポイント

  • 1
    コーディングやコンピューター操作能力が大幅向上
  • 2
    一部タスクで最上位モデル「Opus」に匹敵する性能
  • 3
    最大100万トークンの長文コンテキストをベータ提供

性能と機能の向上

Anthropicによると、Claude Sonnet 4.6はコーディング、コンピューター操作、長文推論、エージェント計画、知識作業、デザインなど、あらゆるスキルにおいてフルアップグレードを果たしました。特にコーディング能力の向上は顕著で、早期アクセスユーザーの70%が前バージョンであるSonnet 4.5よりも4.6を好み、59%のユーザーは昨年11月にリリースされた最上位モデル「Opus 4.5」よりもSonnet 4.6を選好したと報告されています。

コンピューター操作能力の進化

コンピューター操作能力においても大きな進歩が見られます。OSWorldベンチマークでは、16ヶ月にわたってSonnetモデルのスコアが着実に上昇。複雑なスプレッドシートの操作や多段階のウェブフォーム入力など、人間レベルの能力を発揮するようになりました。一方で、悪意のあるプロンプトインジェクション攻撃への耐性も強化され、安全性の向上も図られています。

長文処理と実ビジネスへの応用

新モデルは最大100万トークンのコンテキストウィンドウをベータ提供しており、大規模なコードベースや長文契約書、数十本の研究論文を単一のリクエストで処理できます。また、模擬ビジネス運営を評価する「Vending-Bench Arena」では、初期に設備投資を積極的に行い、後半で収益性に焦点を移すという独自の戦略を開発し、競合を上回る結果を出しました。企業顧客からは、フロントエンドコードの生成や財務分析、文書理解ワークロードにおいて、大幅な改善が報告されています。

Q&A

Q. Claude Sonnet 4.6の主な特徴は?

A. コーディングやコンピューター操作能力が大幅に向上し、一部タスクでは最上位モデル「Opus」に匹敵する性能を持つAIモデルです。

Q. 従来のSonnet 4.5と比べて何が改善された?

A. ユーザー評価では、指示への従順さが向上し、コード修正時の文脈読み取りや、マルチステップタスクの一貫した遂行能力が高まったと報告されています。

Q. コンピューター操作能力はどの程度?

A. 複雑なスプレッドシート操作や多段階ウェブフォーム入力など、実用的な作業において人間レベルの能力を示すまでに進化しています。

O!Productニュース編集部

O!Productニュース編集部からのコメント

「Opus級の性能をSonnetの価格帯で」というAnthropicの進化が鮮明です。コストパフォーマンスに優れた中核モデルの強化は、AIの実業務への浸透をさらに加速させるでしょう。

引用元:Anthropic

この記事をシェア

AI事例マッチ度診断背景

AI事例マッチ度診断

あなたにビッタリのサービスを診断できます!
個人情報・会員登録は一切不要。完全無料で診断いただけます。

AI事例マッチ度診断
AI事例マッチ度診断

関連ニュース

AIエージェントのサービス

この記事を読んだ人はこんなタグにも興味があります

この記事をシェア