AIエージェント「Devin」で“10人分”の開発生産性を実現できるか
ULSコンサルティングの山河氏は、金融系の低レイテンシ開発や分散処理を得意とするエンジニアであり、Apache Geodeコミッターとしても知られる。現在はAIエージェント活用に強い関心を寄せており、「Devin×GitHub Copilotで10人分の仕事は可能か」という挑戦的なテーマを掲げて登壇した。
発端は、短納期で大量の画面・APIを構築せよという“無茶振り”案件だった。依頼側は「Copilotがあればできるよね?」と軽いトーンだった。しかし山河氏は概要を聞いた段階で「10人規模の工数が必要だ」と直感した。そこでまずはCopilotによる自動化を徹底検証したが、Git操作、テスト、デバッグなど、人が手を動かす工程が多く、支援型AIではブレークスルーにならないことがわかった。
そんな状況を一変させたのは、AIソフトウェアエンジニア「Devin」だった。山河氏はCopilotとDevinの違いについて、「決定的なのは自律性」と話す。Slackで指示するだけで、Devinは裏でVMを立ち上げ、git clone、コード理解、実装、修正、PR作成までを一貫して自動実行する。まさに人間のエンジニアと同じ振る舞いをする点で、従来の補助AIとは根本的に異なるのだ。
もっとも、Devinの挙動はかなり人間離れしている。キャッチアップはゼロ秒、1タスクを5〜15分で処理し、コードの質も高い。ドキュメント読解や既存コード調査の手間がなく、たとえ出力が期待と違っても、高速ゆえに「捨ててやり直せば良い」と割り切れる。「世界レベルのコーディングを迷いなく実行する知識量も強みだ」と山河氏は評価する。
では、本当に10人分働くのか。山河氏は「鍵となるのは役割分担と並列化」と述べる。複数Devinにコード生成・テスト・デバッグを同時実行させ、人間はタスク分割、環境整備、レビュー観点の設定に集中する。AI側にはナレッジや設計思想、コーディング規約を読み込ませて品質を安定させる。つまり、AIが働きやすい現場を人が設計するわけだ。
山河氏によると、Devin活用には人間側のマインド醸成も不可欠だという。山河氏はあえて「10人分働くつもりでDevinを使え」という厳しい目標を掲げ、内部的に“Devin使いレベル”を設定。2人分働ける人は“2でびん”、5人なら“5でびん”、10人なら“10でびん”と、ゲーム性のある呼称で生産性を可視化した。
興味深いのは、ACU(Devinの使用量)に対する考え方だ。世間では「貴重なリソースを無駄遣いするな」という意見もあるが、山河氏の「むしろ大量に消費すべき」と正反対の立場を取る。「ACUの使用量は、Devinがたくさん働き、品質向上や新機能追加を実現している証拠」と、ポジティブな構えを崩さなかった。
加えて、運用上のテクニックとして、Devinを並列で切れ目なく動かす仕組みが紹介された。「人間が関われるのは指示・レビュー・テストのみ。その狭い接点の負荷を最小化するため、タスク管理も含めてDevinに担わせるべきだ」と説く。むろん、レビューの自動化も徹底。人間が書いたコードはDevinがレビューし、Devinが書いたコードは別のDevinがレビューする。テストで不具合が起票されれば、Devinが即座に修正に取りかかる仕組みも構築したという。
こうした一連の仕組み化と自動化の結果、山河氏は合計10人分の開発力を実現した。「なんとか働けた」と控えめに述べたものの、その経験談には、AIエージェントによる本格的な開発変革への手応えがにじんでいた。
