OpenAIは2月12日(現地時間)、GPT-5.3-Codexシリーズの新モデル「GPT-5.3-Codex-Spark」をリサーチプレビューとしてChatGPT Proユーザー向けに公開した。
同モデルは、今年1月に発表されたCerebrasとの提携による取り組みの最初の成果であり、リアルタイムでのコーディング作業向きに設計された初のモデルとなる。Codex-SparkはCerebrasの超低遅延ハードウェア上で動作し、1秒あたり1000トークン以上を提供する速度を実現している。
また、Codex-Sparkはエンドツーエンドのレイテンシーを大幅に削減するため、クライアントとサーバ間のやり取りを効率化し、最初のトークン表示までの時間を50%短縮した。ウェブソケット接続による最適化により、1回の往復のオーバーヘッドを80%削減し、逐次トークン生成時のオーバーヘッドも30%低減している。これにより、開発者はモデルとリアルタイムに対話し、即座に編集・リファクタリングの効果を確認できる。
さらに、同モデルでは12万8000トークンのコンテキストウィンドウを持ち、テキスト入力に限定されている。SWE-Bench ProやTerminal-Bench 2.0といったベンチマークでも、従来モデルより高速にタスクを完了し、高い精度を示した。開発者向けには、Codexアプリ、CLI、VS Code拡張の最新版で順次提供されており、APIでは一部パートナーへの限定提供も行われている。
Codex-Sparkは、本線モデルと同様のセーフティートレーニングを受けており、サイバーセキュリティや生物学分野などの高度なリスクには該当しないと評価されている。今後は、速度と応答性を活かした新たなユースケースや、より大型・長文・マルチモーダルなモデルへの展開も計画されている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
