F1デモが示したエージェントの自律改善サイクル
Lesse氏はF1レーシングのライブデモでプラットフォームの全機能を実際に示した。2月にAtlassian Williamsフォーミュラ1チームの公式思考パートナーとなったClaudeを基に、架空のシェイカー・レーシングのダッシュボードを設定。空力学・タイヤ温度・パワーユニット・ドライバー安全の4領域をそれぞれClaude Managed Agentsが担当し、各エージェントがマシン改善に必要な変更点をリサーチする構成だ。
特筆されたのがグレーダーエージェントの仕組みだ。各エージェントの実行完了後に別のグレーダーエージェントが起動し、「十分に良い仕事ができたか? できていなければ続けろ」と評価して反復させる。新機能のデプロイメントでは「毎晩ドライバー安全チェックを自動実行する」ようなスケジュール運用が可能になった。さらにドリーミングにより、エージェントは実行のたびに過去のセッションを振り返り、次回に向けた学習をメモリに書き込む。
「エージェントはほとんどの場合ゼロから始まる。ドリーミングがあることで、実行を重ねるごとに品質が自律的に上がっていく」とLesse氏は説明した。アウトカム、スケジュール、デプロイメント、ドリーミングの4機能はすべて本日のClaudeプラットフォームで利用できる。
Claude Codeで実現した前年比90%の向上
「Claude Codeのミッションはアイデアと出荷可能な製品の差を埋めることだ」。Claude Code プロダクト責任者のCat Wu氏はそう言い、平均的な開発者が週20時間をClaudeとともに過ごしている現状を示した。CLIのテキストインターフェースから始まったClaude Codeは、IDE拡張、フルスクリーンのClaude Desktopアプリ、CLIのエージェンシービューの4形態に拡充され、複数のClaude Codeを並列で動かす「マルチクローディング」を支援する体制が整った。
機能の充実も著しい。PRの重大なバグをエージェントチームが自動検出するコードレビュー製品は何千もの企業が毎日使用しており、Anthropicのすべてのチームにもすでにデプロイされている。iOSとAndroidでのリモートコントロールにより、外出先でもコーディングが可能になった。ルーティンではスケジュール・Webフック・APIコールで特定タスクのClaude Codeを自動起動でき、毎回人間が手動でトリガーする必要がなくなる。Claude Securityは毎晩コードベースをスキャンし、最も重要な脆弱性にフラグを立て、それぞれに対するClaude Codeセッションを起動できる。
今回の目玉機能Dynamic Workflowsは、数十から数百のエージェントを並列実行して大規模タスクを確定的な構造で処理する仕組みだ。デモでは12言語のWebサイトローカライズを1プロンプトで実行。1言語あたり約3分かかる作業が、翻訳と検証合わせて24エージェントの同時稼働により1アクションで完結した。「従来は12個の個別タスクが必要だったが、今は1つのプロンプトだけで処理できる」とWu氏は言い、ワークフローはJavaScriptコードとして保存して将来の翻訳でも再利用できると付け加えた。
実際の成果は数字が証明している。SpotifyはClaude Agent SDKを用いてバックグラウンドエージェントを構築し、月1,000件以上のマイグレーションPRを本番にマージ、作業時間を90%削減した。メルカリは全エンジニアチームにClaude Codeを展開し、エンジニアリングアウトプットが前年比90%向上している。Anthropic社内でも、チームの規模が大幅に拡大したにもかかわらず、エンジニアが平均して過去の8倍以上のコードを出荷している。「まだ誰も完全にマッピングしていない地形を、皆さんと一緒に登る登山家のように自分たちを捉えている。高まるAI能力とともに成長し、新しい課題のナビゲーションを支援していく」——Wu氏のその言葉が、今日の基調講演全体の精神を示していた。
