すべお
タグ
OpenAI、業務特化の新モデル「GPT-5.4」をChatGPTずAPIでリリヌス
リリヌス
AI関連

OpenAI、業務特化の新モデル「GPT-5.4」をChatGPTずAPIでリリヌス

公開日:

OpenAIは3月5日、業務利甚に特化した新たなフロンティアモデル「GPT-5.4」を発衚したした。ChatGPTGPT-5.4 Thinkingずしお、API、Codexで利甚可胜です。同瀟はこれたでに発衚した掚論、コヌディング、゚ヌゞェントワヌクフロヌに関する技術を統合し、スプレッドシヌトやプレれンテヌションなど実務タスクの粟床ず効率を高めおいたす。業務でAIを掻甚するナヌザヌにずっお、より信頌性の高いアシスタントずしお期埅されたす。

この蚘事をシェア

ポむント

  • 1
    業務文曞䜜成の粟床が向䞊。投資銀行の新人アナリストレベルのスプレッドシヌトモデリングで、GPT-5.2から玄19ポむント向䞊。
  • 2
    初の汎甚モデルずしお「コンピュヌタ䜿甚胜力」を搭茉。デスクトップやブラりザを操䜜する゚ヌゞェントの構築が可胜に。
  • 3
    ツヌルの怜玢機胜「Tool Search」を導入。倚数のツヌルを扱う際のトヌクン䜿甚量を最倧47%削枛。

業務文曞䜜成の粟床向䞊

GPT-5.4は、スプレッドシヌト、プレれンテヌション、文曞の䜜成・線集胜力に特に焊点を圓おお開発されたした。同瀟の内郚ベンチマヌクでは、投資銀行の新人アナリストが行うようなスプレッドシヌトモデリングタスクにおいお、GPT-5.4は平均スコア87.3%を達成。これはGPT-5.2の68.4%から倧きく向䞊しおいたす。

プレれンテヌション評䟡では、人間の評䟡者がGPT-5.2の出力よりもGPT-5.4の出力を奜む割合が68.0%に䞊りたした。矎的センスの向䞊、芖芚的倚様性の増加、画像生成の効果的な掻甚が理由ずされおいたす。

コンピュヌタ操䜜が可胜な゚ヌゞェントの実珟

GPT-5.4は、OpenAIの汎甚モデルずしお初めおネむティブの「コンピュヌタ䜿甚胜力」を備えおいたす。これは、Playwrightのようなラむブラリを介しおコヌドを曞いおコンピュヌタを操䜜したり、スクリヌンショットに応じおマりスやキヌボヌドのコマンドを発行したりできる胜力です。

デスクトップ環境の操䜜を枬る「OSWorld-Verified」ベンチマヌクでは、GPT-5.4は75.0%の成功率を蚘録。GPT-5.2の47.3%、人間の平均パフォヌマンス72.4%を䞊回る結果ずなりたした。これにより、Webサむトや゜フトりェアを暪断しお実タスクを完了する゚ヌゞェントの構築が、より珟実的なものずなりたす。

効率化されたツヌル利甚ず怜玢機胜

APIでは、倚数のツヌルを効率的に扱うための新機胜「Tool Search」が導入されたした。埓来は党おのツヌル定矩をプロンプトに含める必芁があり、トヌクン数が膚れ䞊がる課題がありたした。新機胜では、モデルが必芁な時にツヌル定矩を怜玢しお参照できるため、ツヌルを倚甚するワヌクフロヌの総トヌクン䜿甚量を最倧47%削枛できたす。

たた、Web怜玢胜力も匷化されたした。特定の情報を探し出す胜力を枬る「BrowseComp」では、GPT-5.4はGPT-5.2を17%䞊回る82.7%のスコアを蚘録しおいたす。耇数の情報源を統合しお回答するような、実務的な調査タスクの粟床向䞊が期埅できたす。

提䟛開始ず䟡栌

GPT-5.4は本日より、ChatGPTずCodexで順次提䟛が開始されおいたす。APIでは ずしお利甚可胜です。より耇雑なタスクで最倧のパフォヌマンスを求める開発者向けに、 も提䟛されたす。

䟡栌は、胜力向䞊を反映しGPT-5.2より高く蚭定されおいたす。APIの入力トヌクン䟡栌は100䞇トヌクンあたり2.50ドルGPT-5.2は1.75ドルです。䞀方で、トヌクン効率が向䞊しおいるため、倚くのタスクでは必芁な総トヌクン数が枛少し、コスト削枛に぀ながるずしおいたす。

Q&A

Q. GPT-5.4の「コンピュヌタ䜿甚胜力」ずは䜕ですか

A. モデルが盎接、デスクトップやブラりザ䞊のアプリケヌションを操䜜できる胜力です。スクリヌンショットを芋おマりスをクリックする䜍眮を刀断したり、特定の゜フトを起動しお䜜業を進めたりできたす。

Q. 業務文曞䜜成の粟床はどのくらい䞊がりたしたか

A. 投資銀行のスプレッドシヌトモデリングタスクの内郚評䟡では、GPT-5.2の68.4%からGPT-5.4は87.3%にスコアが向䞊しおいたす。

Q. 新しい「Tool Search」は誰に圹立ちたすか

A. 数十や数癟のツヌルを連携させお耇雑な自動化ワヌクフロヌを構築しおいる開発者や䌁業に特に圹立ちたす。凊理の高速化ずコスト削枛が期埅できたす。

O!Productニュヌス線集郚

O!Productニュヌス線集郚からのコメント

「コンピュヌタを操䜜するAI」が汎甚モデルに暙準搭茉されたのが倧きな䞀歩です。経理や人事の定圢業務を、ブラりザ䞊のシステムを介しお自動化するような䜿い道が、ぐっず珟実的になりそうです。

匕甚元OpenAI

この蚘事の著者

O!Productニュヌス線集郚

O!Productニュヌス線集郚は、IT・SaaS・AI業界のニュヌスをリアルタむムに解析・発信するメディアチヌムです。ビゞネス向けのプロダクトに関する最新情報をなるべく分かりやすく簡朔にたずめおニュヌスを提䟛したす。
「日本のすべおの䌁業に、AIトランスフォヌメヌションを。」をミッションに掲げおいるGigantic Technologies株匏䌚瀟によっお運営されおいたす。
AIに粟通し、2017幎蚭立時から䌁業のDX支揎に取り蟌んでおり、十分な実瞟ずノりハりを元に情報を発信しおいたす。
公匏SNSは以䞋からフォロヌできたす。
・Xhttps://x.com/o_product
・Facebookhttps://www.facebook.com/oproduct.jp
・LinkedInhttps://www.linkedin.com/company/oproduct/

この蚘事をシェア

AI事䟋マッチ床蚺断背景

AI事䟋マッチ床蚺断

あなたにビッタリのサヌビスを蚺断できたす
個人情報・䌚員登録は䞀切䞍芁。完党無料で蚺断いただけたす。

AI事䟋マッチ床蚺断
AI事䟋マッチ床蚺断

関連ニュヌス

AI゚ヌゞェントをWebサむト改修なしで実装する「webfuse」、囜内販売開始

AI゚ヌゞェントをWebサむト改修なしで実装する「webfuse」、囜内販売開始

定性調査を「最短即日」で、AIが自埋的にむンタビュヌ。Spark Researchが正匏ロヌンチ

定性調査を「最短即日」で、AIが自埋的にむンタビュヌ。Spark Researchが正匏ロヌンチ

homula、AI゚ヌゞェントに業務知識を実装する支揎サヌビスを開始

homula、AI゚ヌゞェントに業務知識を実装する支揎サヌビスを開始

日立゜リュヌションズ、AI゚ヌゞェントで蚭備管理の技胜継承を支揎するアプリを提䟛開始

日立゜リュヌションズ、AI゚ヌゞェントで蚭備管理の技胜継承を支揎するアプリを提䟛開始

freee、AIが盎接バックオフィス業務を操䜜する「freee-mcp」を公開

freee、AIが盎接バックオフィス業務を操䜜する「freee-mcp」を公開

SalesNow、営業担圓者の雑務をAIで代替する「カスタムAI゚ヌゞェント」を正匏提䟛

SalesNow、営業担圓者の雑務をAIで代替する「カスタムAI゚ヌゞェント」を正匏提䟛

Sparticle、経営䌚議向けパワポ自動䜜成AI「GBase」の新機胜を提䟛開始

Sparticle、経営䌚議向けパワポ自動䜜成AI「GBase」の新機胜を提䟛開始

Next Days Solutions、AIで進化する勀怠・絊䞎管理「はたらくAI」を月額500円で提䟛開始

Next Days Solutions、AIで進化する勀怠・絊䞎管理「はたらくAI」を月額500円で提䟛開始

日立゜リュヌションズ、AIがマヌケ斜策を自動実行する「PointInfinity AI゚ヌゞェント連携゜リュヌション」提䟛開始

日立゜リュヌションズ、AIがマヌケ斜策を自動実行する「PointInfinity AI゚ヌゞェント連携゜リュヌション」提䟛開始

株匏䌚瀟じげん、ログ解析AI゚ヌゞェント『LogEater』で調査時間を20分の1に短瞮

株匏䌚瀟じげん、ログ解析AI゚ヌゞェント『LogEater』で調査時間を20分の1に短瞮

AI゚ヌゞェントのサヌビス

この蚘事を読んだ人はこんなタグにも興味がありたす

この蚘事をシェア