
OpenAI、業務特化の新モデル「GPT-5.4」をChatGPTとAPIでリリース
公開日:
OpenAIは3月5日、業務利用に特化した新たなフロンティアモデル「GPT-5.4」を発表しました。ChatGPT(GPT-5.4 Thinkingとして)、API、Codexで利用可能です。同社はこれまでに発表した推論、コーディング、エージェントワークフローに関する技術を統合し、スプレッドシートやプレゼンテーションなど実務タスクの精度と効率を高めています。業務でAIを活用するユーザーにとって、より信頼性の高いアシスタントとして期待されます。
ポイント
- 1業務文書作成の精度が向上。投資銀行の新人アナリストレベルのスプレッドシートモデリングで、GPT-5.2から約19ポイント向上。
- 2初の汎用モデルとして「コンピュータ使用能力」を搭載。デスクトップやブラウザを操作するエージェントの構築が可能に。
- 3ツールの検索機能「Tool Search」を導入。多数のツールを扱う際のトークン使用量を最大47%削減。
業務文書作成の精度向上
GPT-5.4は、スプレッドシート、プレゼンテーション、文書の作成・編集能力に特に焦点を当てて開発されました。同社の内部ベンチマークでは、投資銀行の新人アナリストが行うようなスプレッドシートモデリングタスクにおいて、GPT-5.4は平均スコア87.3%を達成。これはGPT-5.2の68.4%から大きく向上しています。
プレゼンテーション評価では、人間の評価者がGPT-5.2の出力よりもGPT-5.4の出力を好む割合が68.0%に上りました。美的センスの向上、視覚的多様性の増加、画像生成の効果的な活用が理由とされています。
コンピュータ操作が可能なエージェントの実現
GPT-5.4は、OpenAIの汎用モデルとして初めてネイティブの「コンピュータ使用能力」を備えています。これは、Playwrightのようなライブラリを介してコードを書いてコンピュータを操作したり、スクリーンショットに応じてマウスやキーボードのコマンドを発行したりできる能力です。
デスクトップ環境の操作を測る「OSWorld-Verified」ベンチマークでは、GPT-5.4は75.0%の成功率を記録。GPT-5.2の47.3%、人間の平均パフォーマンス72.4%を上回る結果となりました。これにより、Webサイトやソフトウェアを横断して実タスクを完了するエージェントの構築が、より現実的なものとなります。
効率化されたツール利用と検索機能
APIでは、多数のツールを効率的に扱うための新機能「Tool Search」が導入されました。従来は全てのツール定義をプロンプトに含める必要があり、トークン数が膨れ上がる課題がありました。新機能では、モデルが必要な時にツール定義を検索して参照できるため、ツールを多用するワークフローの総トークン使用量を最大47%削減できます。
また、Web検索能力も強化されました。特定の情報を探し出す能力を測る「BrowseComp」では、GPT-5.4はGPT-5.2を17%上回る82.7%のスコアを記録しています。複数の情報源を統合して回答するような、実務的な調査タスクの精度向上が期待できます。
提供開始と価格
GPT-5.4は本日より、ChatGPTとCodexで順次提供が開始されています。APIでは として利用可能です。より複雑なタスクで最大のパフォーマンスを求める開発者向けに、 も提供されます。
価格は、能力向上を反映しGPT-5.2より高く設定されています。APIの入力トークン価格は100万トークンあたり2.50ドル(GPT-5.2は1.75ドル)です。一方で、トークン効率が向上しているため、多くのタスクでは必要な総トークン数が減少し、コスト削減につながるとしています。
Q&A
Q. GPT-5.4の「コンピュータ使用能力」とは何ですか?
A. モデルが直接、デスクトップやブラウザ上のアプリケーションを操作できる能力です。スクリーンショットを見てマウスをクリックする位置を判断したり、特定のソフトを起動して作業を進めたりできます。
Q. 業務文書作成の精度はどのくらい上がりましたか?
A. 投資銀行のスプレッドシートモデリングタスクの内部評価では、GPT-5.2の68.4%からGPT-5.4は87.3%にスコアが向上しています。
Q. 新しい「Tool Search」は誰に役立ちますか?
A. 数十や数百のツールを連携させて複雑な自動化ワークフローを構築している開発者や企業に特に役立ちます。処理の高速化とコスト削減が期待できます。

O!Productニュース編集部からのコメント
「コンピュータを操作するAI」が汎用モデルに標準搭載されたのが大きな一歩です。経理や人事の定形業務を、ブラウザ上のシステムを介して自動化するような使い道が、ぐっと現実的になりそうです。
引用元:OpenAI
この記事の著者
O!Productニュース編集部


関連ニュース

中小企業向けAI「Claude for Small Business」、給与や請求書対応などを自動化

エックスサーバー、AIエージェント対応のMCPサーバーと公式CLIを提供

ホリエモンAI学校、AIエージェント構築代行サービス「AAA」を開始

Sysdig、AIエージェント時代に向けたヘッドレス型クラウドセキュリティを発表

名刺アプリ「Eight」が人材紹介会社をグループ化、AIエージェントも提供開始

AIで社内の声を可視化「KAITO NEXT PostBox」が5月末提供開始

Salesforce、全新規顧客にSlackを標準提供 導入初日からAIワークプラットフォーム利用可能

Loglass 経営管理、対話型AI分析機能を標準提供、会議準備を効率化

neodig、対話でFAQ作成・編集できるAIエージェント「FAQ AI Agent」提供開始











