米OpenAIは、11月6日(現地時間)に開催した開発者向けカンファレンス「OpenAI DevDay」において、数多くの発表を行っている。
同カンファレンスでは、7月に一般提供が開始されたGPT-4の次世代モデルであるGPT-4 Turboのプレビューが発表された。GPT-4 Turboは、2023年4月まで学習が行われ、128kコンテキストウィンドウを備えており、1つのプロンプトに300ページ以上のテキストが収められる。また、GPT-4と比較して入力トークンを3倍、出力トークンを2倍、それぞれ安価に提供可能となっている。
あわせて、単一のメッセージで複数の機能を呼び出せるなど関数呼び出しの更新や、命令追従やJSONモードにおけるいくつかの更新、出力を再現できるようにするseedパラメータの追加およびGPT-4 Turbo/GPT-3.5 Turboによって生成される可能性がもっとも高い出力トークンのログ確率を返す機能の提供開始、これらの改善が行われたGPT-3.5 Turboへのアップグレードが発表された。
さらに、コードインタプリタや関数呼び出し機能などによって、高品質なAIアプリを構築できるAssistants APIがリリースされている。Assistants APIは、開発者が自身のアプリケーションにおいて、エージェントのようなエクスペリエンスの構築を可能にするための最初のステップと位置づけられており、同日にベータ提供が開始された。
ほかにも、GPT-4 Turboに搭載されたChat Completions APIが画像の入力に対応し、キャプションの生成、現実世界の画像の詳細な分析、図のある文書の読み取りといったユースケースを実現するとともに、DALL・E3をモデルとして指定することで、Images API経由でアプリや製品に直接統合できるようになっている。また、Text-to-Speech API経由でのテキストからの人間レベルの音声生成、GPT-4を微調整するための実験的なアクセスプログラムの作成、より大規模なモデルの調整を可能にするカスタムモデルの提供も発表された。
なお、GPT-4 Turboの安価な利用だけでなく、GPT-3.5 TurboやファインチューニングされたGPT-3.5 Turbo 4Kモデルにおいても価格の引き下げが行われるとともに、有料版GPT-4におけるレート制限の引き上げ、著作権保護をさらに推し進める著作権シールドの導入、自動音声認識モデル(ASR)の新バージョンとなるWhisperlarge-v3のリリースも予定している。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です