AIの「実用化ギャップ」を超えた楽天とCanvaの事例
モデルの性能向上の背景に、Lesse氏が「実用化ギャップ」と呼ぶ問題がある。「モデルの能力が指数関数的に向上しているにもかかわらず、ビジネスでの実活用は依然として線形的な伸びにとどまっている。そのギャップを埋めることが、私たちの共通の機会だ」。
1年前のCode with Claudeで話題の中心は「Claudeが単独で一機能を実装できること」だった。6カ月前にはエージェントが一晩中自律的にタスクを実行できるようになり、2カ月前にはClaudeがVS Codeのオープンソース全ソースツリーを読み込み、ほぼ30年にわたって人間のレビューをかいくぐり続けてきた、27年前の脆弱性を発見している。こうした飛躍が加速し続けるなかで、その知性を実際のビジネス成果に変えることが次の課題だと位置づけた。
その問題をすでに克服している事例として、楽天とCanvaが紹介された。楽天のチームはClaude Codeを使って開発を加速させることから始め、Claude Managed Agentsを活用してエンジニアリング・製品・セールス・ファイナンスにまたがる社内エージェントをカスタムで動かすまでになった。「複数のエージェントを束ねる司令塔役のエージェントが、まるでプロジェクトマネージャーのように他のエージェントへ指示を出して全体を調整している」とLesse氏は語り、以前は四半期に一度だった大規模リリースが2週間ごとに行われるようになった事実を添えた。
数億人が利用するCanvaでは、コードを書いたことがないユーザーでも、地図や電卓、ウィジェットの作成を依頼するだけで、Claudeがそれをページにそのまま組み込める状態で作り上げる。「世界中で、以前は誰も作れなかった新しいシステムやアプリがClaudeで構築されている。昨日は不可能だったことが、今日は可能になっている」とLesse氏は語った。
エージェントを動かすハーネス・コンテキスト・インフラ
Claude Platform プロダクトマネジメント責任者のAngela Jiang氏は、Managed Agentsの設計思想を説明するにあたり、一つのシナリオを描いた。
「昨夜、私たちが眠っている間に、どこかの製品がバグを検知した。バグレポートを調べ、バグを見つけ、修正し、すべてのユーザーに展開した。チームが起きた頃には問題は解決しており、変更ログはすでに出来上がっていた。スタンドアップもなく、チケットもなく」
これがネイティブAI企業の姿であり、仕事そのものがAIの基盤の上で動き、人間が成果を決める世界だとJiang氏は言う。
この状態を実現する3要素がハーネス・コンテキスト・インフラだ。ハーネスはClaudeモデルに実際に仕事をする能力を与えるもので、ツール・環境・行動する許可からなる。Managed Agentsでは思考部分と実行部分を分離したエージェント型ハーネスを提供し、成果が達成されるまで反復し続ける「アウトカムベースの実行」が可能だ。コンテキストは100万トークンのウィンドウ、過去を記憶するメモリ機能、知識のギャップを補うスキルの読み書き、そして「ドリーミング」で構成される。
ドリーミングとは、エージェントが実行終了後に自動的に過去のセッションを振り返り、改善点や学習をメモリに書き込む仕組みだ。エージェントは通常セッションをまたいだコンテキストを持たずゼロから起動するが、ドリーミングがあることで実行を重ねるたびに品質が自律的に向上していく。インフラとしてはサンドボックスの自動スケールと複数エージェント群の動的生成が、長時間稼働する自律エージェントの信頼性を担保する。
AsanaはManaged Agentsを活用し、プロジェクト内で人間と並走して動くAIチームメイトを構築した。「エージェント型システムを従来の10倍速く構築できた企業が多い」とJiang氏は語った。
