すべて
タグ
Anthropic、最上位AIモデル「Claude Opus 4.6」を発表
リリース
アップデート
AI関連

Anthropic、最上位AIモデル「Claude Opus 4.6」を発表

公開日:

AI企業のAnthropicは、最上位モデル「Claude Opus 4.6」の提供を開始しました。コーディング能力や自律的な作業能力が強化され、より複雑で長期的なタスクをこなせるようになったとしています。また、Opusクラスのモデルとして初めて、100万トークンのコンテキストウィンドウをベータ提供します。

この記事をシェア

ポイント

  • 1
    コーディングと自律的作業能力が大幅に強化
  • 2
    初の100万トークンコンテキストをOpusクラスでベータ提供
  • 3
    安全性は維持したまま、複数ベンチマークで業界最高性能を主張

コーディングと自律的作業に特化した進化

Anthropicによれば、Claude Opus 4.6は前身モデルであるOpus 4.5と比較して、計画立案や長期的な自律的タスクの遂行、大規模なコードベースでの操作において改善が見られるといいます。特に、エージェントとしてのコーディング評価「Terminal-Bench 2.0」や、複雑な学際的推論テスト「Humanity's Last Exam」で最高スコアを獲得したと発表しました。経済的に価値のある知識作業を評価する「GDPval-AA」では、次善のモデル(OpenAIのGPT-5.2)を約144エロポイント上回ったとしています。

長いコンテキストでの性能向上と新機能

Opus 4.6は、膨大なテキストから情報を検索する能力が向上しており、数十万トークンにわたる情報の保持と追跡が改善され、埋もれた詳細も拾えるようになったとされます。これにより、長い会話の中で性能が低下する「コンテキストロット」の問題が軽減されたとしています。APIでは、モデルが深い推論が必要な場面を自ら判断する「適応的思考」や、会話を要約して長いタスクを可能にする「コンテキスト圧縮(ベータ)」などの新機能が導入されました。

製品連携の強化と安全性への取り組み

Claude Codeでは、複数のエージェントが並行して自律的に協調する「エージェントチーム」機能が研究プレビューとして追加されました。また、日常業務ツールとの連携も強化され、Excelでの処理能力が向上し、PowerPoint連携機能も研究プレビューとして提供開始されました。Anthropicは、知性の向上が安全性の犠牲を伴わないことを強調しており、自動化された行動監査では、Opus 4.5と同等かそれ以上の安全性プロファイルを示したと報告しています。

引用元:Anthropic

O!Productニュース編集部

O!Productニュース編集部からのコメント

コーディングと自律作業に特化した進化が目立ち、AIがより「一人前の協業者」に近づいている印象です。長いコンテキストの実用性向上も、実業務での活用範囲を広げるでしょう。

Q&A

Q. Claude Opus 4.6の主な強化点は何ですか?

A. コーディングスキル、自律的な計画・実行能力、そして長いコンテキスト(100万トークン)での情報処理能力が大幅に向上しています。

Q. Claude Opus 4.6はどのような作業に役立ちますか?

A. 複雑なコードのデバッグや大規模コードベースの管理、財務分析、資料作成など、多段階にわたる専門的な知識作業を支援できます。

Q. 100万トークンのコンテキストウィンドウとはどういう意味ですか?

A. AIが一度に処理できる会話や文章の量が非常に大きくなり、長いドキュメント全体を考慮した分析や、極めて長い対話が可能になることを意味します。

この記事をシェア

AI事例マッチ度診断背景

AI事例マッチ度診断

あなたにビッタリのサービスを診断できます!
個人情報・会員登録は一切不要。完全無料で診断いただけます。

AI事例マッチ度診断
AI事例マッチ度診断

関連ニュース

AIエージェントのサービス

この記事を読んだ人はこんなタグにも興味があります

この記事をシェア