
Anthropic、最上位AIモデル「Claude Opus 4.6」を発表
公開日:
AI企業のAnthropicは、最上位モデル「Claude Opus 4.6」の提供を開始しました。コーディング能力や自律的な作業能力が強化され、より複雑で長期的なタスクをこなせるようになったとしています。また、Opusクラスのモデルとして初めて、100万トークンのコンテキストウィンドウをベータ提供します。
ポイント
- 1コーディングと自律的作業能力が大幅に強化
- 2初の100万トークンコンテキストをOpusクラスでベータ提供
- 3安全性は維持したまま、複数ベンチマークで業界最高性能を主張
コーディングと自律的作業に特化した進化
Anthropicによれば、Claude Opus 4.6は前身モデルであるOpus 4.5と比較して、計画立案や長期的な自律的タスクの遂行、大規模なコードベースでの操作において改善が見られるといいます。特に、エージェントとしてのコーディング評価「Terminal-Bench 2.0」や、複雑な学際的推論テスト「Humanity's Last Exam」で最高スコアを獲得したと発表しました。経済的に価値のある知識作業を評価する「GDPval-AA」では、次善のモデル(OpenAIのGPT-5.2)を約144エロポイント上回ったとしています。
長いコンテキストでの性能向上と新機能
Opus 4.6は、膨大なテキストから情報を検索する能力が向上しており、数十万トークンにわたる情報の保持と追跡が改善され、埋もれた詳細も拾えるようになったとされます。これにより、長い会話の中で性能が低下する「コンテキストロット」の問題が軽減されたとしています。APIでは、モデルが深い推論が必要な場面を自ら判断する「適応的思考」や、会話を要約して長いタスクを可能にする「コンテキスト圧縮(ベータ)」などの新機能が導入されました。
製品連携の強化と安全性への取り組み
Claude Codeでは、複数のエージェントが並行して自律的に協調する「エージェントチーム」機能が研究プレビューとして追加されました。また、日常業務ツールとの連携も強化され、Excelでの処理能力が向上し、PowerPoint連携機能も研究プレビューとして提供開始されました。Anthropicは、知性の向上が安全性の犠牲を伴わないことを強調しており、自動化された行動監査では、Opus 4.5と同等かそれ以上の安全性プロファイルを示したと報告しています。
引用元:Anthropic

O!Productニュース編集部からのコメント
コーディングと自律作業に特化した進化が目立ち、AIがより「一人前の協業者」に近づいている印象です。長いコンテキストの実用性向上も、実業務での活用範囲を広げるでしょう。
Q&A
Q. Claude Opus 4.6の主な強化点は何ですか?
A. コーディングスキル、自律的な計画・実行能力、そして長いコンテキスト(100万トークン)での情報処理能力が大幅に向上しています。
Q. Claude Opus 4.6はどのような作業に役立ちますか?
A. 複雑なコードのデバッグや大規模コードベースの管理、財務分析、資料作成など、多段階にわたる専門的な知識作業を支援できます。
Q. 100万トークンのコンテキストウィンドウとはどういう意味ですか?
A. AIが一度に処理できる会話や文章の量が非常に大きくなり、長いドキュメント全体を考慮した分析や、極めて長い対話が可能になることを意味します。

関連ニュース

人材紹介AI「MENDAN」で面談時間半減、決定数2倍を実現 Kaiketsu社が導入効果を公開

対話型データ活用AIエージェント「DataBuddy」が正式提供開始、PoCプログラムも募集

OpenAI、エージェント型の新モデル「GPT-5.3-Codex」を発表。開発作業からプレゼン作成まで自律実行

Skywork Desktopが発表、OSと統合するAIエージェントで生産性を革新

SHIFT、24時間自律稼働でテスト期間を最大80%短縮する「AIテストエージェント」を提供開始

自治体の電話窓口をAIが24時間対応、「GRANTOWN」が八王子市と厚木市で実証実験

AGSグループが「PKSHA AI ヘルプデスク」を導入、問い合わせの自己解決率3割を目指す

AIエージェントプラットフォーム「OpenClaw」が正式リリース、ローカル環境で動作するAIアシスタントに

OpenAI、macOS向け「Codexアプリ」をリリース。複数AIエージェントの同時管理を可能に












