すべて
タグ
OpenAI、リアルタイムコーディング向け超高速モデル「GPT-5.3-Codex-Spark」を発表
リリース
アップデート
AI関連

OpenAI、リアルタイムコーディング向け超高速モデル「GPT-5.3-Codex-Spark」を発表

公開日:

OpenAIは、リアルタイムでのコーディング作業に特化した新モデル「GPT-5.3-Codex-Spark」のリサーチプレビューを開始しました。Cerebras社とのパートナーシップで実現したこのモデルは、超低遅延ハードウェア上で秒間1000トークン以上の速度を実現し、開発者とのインタラクティブな作業を可能にします。

この記事をシェア

ポイント

  • 1
    リアルタイムコーディングに特化した初のモデルで、秒間1000トークン以上の超高速処理を実現
  • 2
    Cerebras社の専用AIアクセラレーターを採用し、エンドツーエンドのレイテンシーを大幅改善
  • 3
    ChatGPT Proユーザー向けにリサーチプレビューを開始し、開発者のフィードバックを収集

OpenAIは、Cerebras社との提携を発表した1月に続く最初のマイルストーンとして、「GPT-5.3-Codex-Spark」のリサーチプレビューを開始しました。このモデルは、既存のGPT-5.3-Codexの小型版として開発され、コード編集やロジックの再構築、インターフェースの改良といった作業をリアルタイムで行えることが特徴です。

高速性と実用性の両立

Codex-Sparkは、インテリジェンスと同様に遅延時間が重要なインタラクティブ作業に最適化されています。開発者はモデルとリアルタイムで協業し、作業を中断または方向転換しながら、ほぼ即時の応答で迅速に反復作業を行うことが可能です。速度にチューニングされているため、デフォルトの作業スタイルは軽量に保たれており、最小限のターゲット編集を行い、指示がない限り自動的にテストを実行しません。

ベンチマークテストでは、エージェント型ソフトウェアエンジニアリング能力を評価するSWE-Bench ProとTerminal-Bench 2.0において、GPT-5.3-Codex-SparkはGPT-5.3-Codexと比較してタスク完了時間を大幅に短縮しつつ、強力なパフォーマンスを示しています。

全モデルに波及するレイテンシー改善

Codex-Sparkの開発を通じて、モデルの速度だけでなく、要求から応答までの全パイプラインにおけるレイテンシー低減も重要であることが明らかになりました。OpenAIは、全モデルに恩恵をもたらすエンドツーエンドのレイテンシー改善を実施。永続的なWebSocket接続の導入とResponses API内の最適化により、クライアント/サーバー間の往復ごとのオーバーヘッドを80%、トークンごとのオーバーヘッドを30%、最初のトークン表示までの時間を50%削減することに成功しました。

Cerebras社の技術を活用

Codex-Sparkは、Cerebras社の専用AIアクセラレーター「Wafer Scale Engine 3」上で動作し、Codexにレイテンシー最優先の提供階層を追加します。OpenAIはCerebras社と提携し、既存の本番提供スタックにこの低遅延パスを統合。これにより、Codex全体でシームレスに動作し、将来のモデルサポートの基盤も整えました。Cerebras社のSean Lie CTO兼共同創業者は、このパートナーシップにより可能になる新しいインタラクションパターンやユースケースの発見に期待を示しています。

現在、Codex-Sparkは128kのコンテキストウィンドウを持つテキスト専用モデルとして提供されていますが、これは一連の超高速モデルファミリーの最初の一歩に過ぎません。開発者コミュニティとの協業を通じて高速モデルの活用領域を学びながら、より大規模なモデル、より長いコンテキスト長、マルチモーダル入力などの機能拡張を進めていく方針です。

Q&A

Q. GPT-5.3-Codex-Sparkとは何ですか?

A. OpenAIが発表した、リアルタイムコーディングに特化した超高速AIモデルで、Cerebras社のハードウェア上で動作します。

Q. GPT-5.3-Codex-Sparkは誰が利用できますか?

A. 現在はChatGPT Proユーザーを対象としたリサーチプレビューとして、Codexアプリ、CLI、VS Code拡張機能の最新版で提供されています。

Q. GPT-5.3-Codex-Sparkの主な特徴は何ですか?

A. 秒間1000トークン以上の超高速処理と、開発者とのインタラクティブなリアルタイム協業を可能にする低遅延設計が特徴です。

O!Productニュース編集部

O!Productニュース編集部からのコメント

「考える」時間と「試す」時間の間の遅延がほぼゼロになる体験は、開発のワークフローそのものを変える可能性を秘めています。高速化が単なる利便性を超えて、新しい創造のスタイルを生み出す瞬間を目の当たりにしている気がします。

引用元:OpenAI

この記事をシェア

AI事例マッチ度診断背景

AI事例マッチ度診断

あなたにビッタリのサービスを診断できます!
個人情報・会員登録は一切不要。完全無料で診断いただけます。

AI事例マッチ度診断
AI事例マッチ度診断

関連ニュース

この記事を読んだ人はこんなタグにも興味があります

この記事をシェア