OpenAIは8月7日(現地時間)、最新のAIモデル「GPT-5」をAPIプラットフォーム上で公開した。
「GPT-5」は、スタートアップや企業の初期テスターとして、実際の開発現場のタスクをもとに訓練されている。
同社が行ったコーディング評価では、ベンチマーク評価、実際のユースケースいずれも、同社の推論モデル「o3」を上回るパフォーマンスだった。主要なコーディングベンチマークである、SWE-bench Verifiedで「GPT-5」は74.9%を記録している。

また、高い推論負荷において、「GPT-5」はo3に比べて出力トークンを22%、ツール呼び出しを45%削減。加えて、コード編集の評価であるAider polyglotでは、「GPT-5」は88%を記録し、o3と比較してエラー率が3分の1に減少している。

長期間のエージェントタスクでも高い性能を発揮し、タスクに対して適切なツールを利用できるか評価するベンチマークでは96.7%の精度を報告。複数のツールを順次・並列で組み合わせた複雑な実タスクの自動化、指示通りのツール利用、エラー処理の精度向上、長文コンテキスト情報の検索などで、o3および「GPT-4.1」から改善が見られた。

「GPT-5」では新しいツールタイプである「カスタムツール」も導入。これにより、同モデルはJSONではなくプレーンテキストでツールを呼び出すことが可能になった。
APIでは、gpt-5、gpt-5-mini、gpt-5-nanoの3つのサイズで提供されており、価格はgpt-5が入力100万トークン当たり1.25ドル、出力100トークン当たり10ドルから利用可能。Microsoft 365 Copilot、GitHub Copilot、Azure AI Foundryなどの各種プラットフォームでも順次展開される。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です