米Anthropicは、同社におけるこれまででもっともインテリジェントなモデルであり、市場初となるハイブリッド推論モデルとなる「Claude 3.7 Sonnet」を、2月25日(現地時間)に発表した。
Claude 3.7 Sonnetは、通常のLLMと推論モデルの両方を1つにまとめたもので、通常通りの回答をさせたい場合と、長く考えさせた上で回答させたい場合(拡張思考)を選べる。標準モードはClaude 3.5 Sonnetのアップグレード版に相当し、拡張思考モードでは回答前に自己反省を行い、数学や物理学、コーディングなどのタスクにおけるパフォーマンスが向上する。
また、APIを経由してClaude 3.7 Sonnetを使用する場合には、出力制限の128Kトークンまでの任意のN値に対して、Nトークン以下で考えるように指示することで、速度(およびコスト)と回答品質のトレードオフが可能になり、思考の予算を制御できる。
さらに、推論モデルの開発にあたっては、数学やコンピュータサイエンスの競技問題に対する最適化をやや控え、企業による実際のLLMの使用をよりよく反映する、現実世界のタスクに重点を移している。
あわせて、初のエージェントコーディングツールであるClaude Codeを、ユーザーを限定した研究のためのプレビューとして導入した。Claude Codeは、コードの検索と読み取り、ファイルの編集、テストの作成と実行、GitHubへのコードのコミットとプッシュ、コマンドラインツールの使用などが可能な、アクティブなコラボレータであり、あらゆるステップでユーザーを支援する。
現時点では、Claude Codeは開発初期段階ながら、とりわけテスト駆動開発、複雑な問題のデバッグ、大規模なリファクタリングにおいて優れた性能を実現しており、初期のテストでは手作業なら通常で45分以上かかるタスクを1回の実行で完了し、開発時間とオーバーヘッドの削減につながったという。
今後、同社は使用状況に基づいてClaude Codeを継続的に改善していく予定で、ツール呼び出しの信頼性向上、長時間実行コマンドのサポート追加、アプリ内レンダリングの改善などを行っていく。
そのほか、Claude.aiにおけるコーディングエクスペリエンスも向上し、GitHub統合がClaudeのすべてのプランで利用できるようになった。
Claude 3.7 Sonnetは、Free、Pro、Team、Enterpriseを含むすべてのClaudeプラン、およびAnthropic API、Amazon Bedrock、Google CloudにおけるVertex AIでの利用が可能になっている。拡張思考モードは無料プラン以外で利用できる。
標準モードおよび拡張思考モードの両方で、Claude 3.7 Sonnetの価格は従来モデルと同じ、入力トークン100万個あたり3ドル、出力トークン100万個あたり15ドル(思考トークン含む)となっている。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です