SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

CodeZineニュース

OpenAI、AIエージェント開発のための新機能を追加 TypeScript版「Agents SDK」や音声エージェント構築向け機能など

  • X ポスト
  • このエントリーをはてなブックマークに追加

  • X ポスト
  • このエントリーをはてなブックマークに追加

 OpenAIは2025年6月4日、エージェント開発のための新機能としてTypeScript対応のAgents SDKや、音声エージェント向けRealtimeAgent機能など4点のアップデートを発表した。

 今回新たに「Agents SDK」がTypeScriptで利用可能になり、従来のPython版と同様に、ハンドオフ、ガードレール、トレース、MCPなどのコア機能を備えた。加えて、人間による承認(human-in-the-loop)機能が追加され、ツール実行の一時停止やエージェント状態のシリアライズ保存、処理の承認・拒否、エージェントの再開といった柔軟な制御が可能である。

 音声エージェント開発に向けては、「RealtimeAgent」機能が追加された。これにより、クライアントサイドやサーバー上で動作する音声エージェントを構築できる。一連のフローはテキストベースのエージェントと同様の定義が可能で、ツールコールやハンドオフ、ガードレールに加え、音声や割り込みへの自動対応が特徴となる。

 また、「Traces」ダッシュボードがRealtime APIセッションをサポートしたため、音声エージェントの各種実行状態やオーディオ入出力、ツール呼び出しや割り込みなどの可視化が容易になった。これにより、APIまたはAgents SDKで生成されたセッションの挙動を詳細に分析できる。

 このほか、OpenAIは音声から音声へのAIモデルの改善も発表した。命令通りの挙動やツール呼び出しの一貫性、割り込み時の動作の信頼性が向上し、APIには音声再生速度を調節可能な「speed」パラメータも新設された。新しいモデルは「gpt-4o-realtime-preview-2025-06-03」としてRealtime APIで、「gpt-4o-audio-preview-2025-06-03」としてChat Completions APIで利用できる。

関連リンク

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
この記事の著者

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/21654 2025/06/04 16:20

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング