米OpenAIは、新たな2つの埋め込みモデル、「GPT-4 Turbo」のプレビューモデルの更新、「GPT-3.5 Turbo」モデルのアップデート、テキストモデレーションモデルの更新を行ったことを、1月25日(現地時間)に発表した。
新たな埋め込みモデルとしては、小型で高効率なtext-embedding-3-smallと、大規模でより強力なtext-embedding-3-largeが導入されている。
text-embedding-3-smallは、2022年12月にリリースされたtext-embedding-ada-002と比較して、多言語検索で一般的に用いられているベンチマーク(MIRACL)の平均スコアが31.4%から44.0%に増加するとともに、英語タスクで一般的に使用されるベンチマーク(MTEB)の平均スコアが61.0%から62.3%に増加した。さらに、大幅な効率の向上によって、1Kトークンあたりの価格が0.0001ドルから0.00002ドルに引き下げられている。
text-embedding-3-largeは、最大3072次元の埋め込みを作成可能な同社の最高性能モデルで、text-embedding-ada-002との比較では、MIRACLで平均スコアが31.4%から54.9%、MTEBでは平均スコアが61.0%から64.6%へと増加した。1Kトークンあたりの価格は、0.00013ドルとなっている。
さらに、text-embedding-3-smallとtext-embedding-3-largeでは、短縮埋め込みがネイティブサポートされ、MTEBでは埋め込みサイズを256に短縮しても、従来モデルにおける埋め込みサイズ1536と比較して優れたパフォーマンスを実現し、より柔軟な使用が可能になった。
また、gpt-3.5-turbo-0125において過去1年間において3回目の価格引き下げが行われ、入力価格は1Kトークンあたり0.0005ドルに(50%引き下げ)、出力価格は1Kトークンあたり0.0015ドル(25%引き下げ)となっている。なおgpt-3.5-turbo-0125では、要求された形式での応答精度の向上や、英語以外の言語による関数呼び出しにおいて、テキストエンコードの問題を引き起こしてきたバグの修正といった改善も行われた。
GPT-4 Turboプレビューの最新バージョンとなるgpt-4-0125-previewは、コード生成などのタスクを以前のプレビューと比較して徹底的に完了し、モデルがタスクを完了しない「怠惰」なケースを減らすことを目的に開発されており、英語以外のUTF-8世代に影響を及ぼすバグの修正も行われている。
あわせて、潜在的に有害なテキストを識別できるモデレーションAPIが無料提供された。同社は今回提供を開始したモデレーションAPIを、これまででもっとも堅牢なモデレーションモデルだとしている。
そのほか、開発者がAPIキーの使用状況をより詳細に把握して制御可能にするために、APIキーページからAPIキーに権限を割り当てられるようになり、内部追跡ダッシュボードを強化すべくキーに読み取り専用アクセスを割り当てたり、特定のエンドポイントへのアクセスのみに制限したりできるようになった。
さらに、使用状況ダッシュボードと使用状況エクスポート機能では、追跡を有効化した後にAPIキーレベルでメトリクスを公開するようになり、それぞれに個別のAPIキーを用意することで機能、チーム、製品、プロジェクトレベルごとの使用状況を簡単に表示することが可能になっている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です