生成AIによって「代替」されていく世界
初めに深澤氏は、GPTの出現によって、エンジニアリングだけでなくさまざまなオペレーションが「代替」され始めている現状について整理した。
たとえばある機能を持った関数を作成したいときや、既存のコードはあるものの、それぞれの会社の「お作法」に合わせて細部を調整したいときなど、「分かりきった内容ではあるけれども、自分で書くのは面倒くさい」ときにChatGPTの手を借りるのが深澤氏のやり方だ。加えて、新しい技術・ツールへのキャッチアップにおいても、「手っ取り早く動くコードが得られる」点で有用性を感じているという。
「自分は競技プログラミングを趣味としており、コードを書くのは得意なほうです。それでもChatGPTには、慣れない言語でも、どんなサブルーチンでもパッと結果を出してくれる便利さがあります。これなら積極的に頼るべき、というのが現時点での所感です」。
続けて深澤氏は、「少々インパクトがあるが」と前置きをし、ある画像を提示した。AppBrew社がGPT-APIにかけた先月の費用、なんと10,976.88ドル(日本円にして約160万円)だ。
「OpenAI社への支払いだけで1万ドルを超えていると聞くと、かなり高い印象を持たれるかもしれません。しかし、ChatGPTを本格的な業務フローに落とし込めば、自然とこのコストに達してしまうのではないでしょうか。さらに言えば、自分はこの金額を高いとは思っていません。煩わしい業務の大半を置き換えたことで、コストに見合った恩恵を受けられているからです」。
具体的には、どのような業務を置き換えたのだろうか。同氏がAppBrew社で展開している「LIPS」は、化粧品やメイクのTips、口コミをユーザーが投稿できる美容プラットフォームだ。業務の性質上、大量の画像データを保有している。
かつてのオペレーションでは、これらの画像データに対して、どのようなものが「良い」と判断される写真か、公序良俗や薬機法、広告規制に反していないかなどを、1件ずつ人力でチェックしていたという。これは手間と時間がかかることに加え、人力ゆえのミスが発生しやすいなど、オペレーション上の課題も多かった。
こうした課題の解決策として、思い浮かぶのはやはり機械学習だ。ただしこれは決して楽な方法ではないと深澤氏は語る。
まずは『どのような基準を満たしていれば正解か』を定義し、既存の画像をOK/NGに振り分けて、教師データと画像のセットを作る。このモデルをもとに他のデータを分類してみて、評価・調整を行う。そしてある程度のモデルが完成したら、インフラにデプロイし、継続的に更新できるよう運用を行う。まさに気が遠くなるようなプロセスだ。
しかも、こうして出来上がったシステムの精度が必ずしも希望の精度に到達するかは分からない。開発の煩雑さ、そして結果の不確実さゆえに、実際の現場では「『コスト効率が見合わない』『これなら人にお願いしたほうが確実だ』という結論に辿りつきがち」と深澤氏は話す。
ところがGPTの登場により、状況は大きく変化した。マルチモーダル化したGPT-APIを活用すれば、「質」を定義するだけでモデルを運用できるようになったのである。
たとえば「LIPS」の場合、「被写体が綺麗に写っていれば1点」「ライティングで全体がはっきり照らされていれば1点」といった形で具体的な採点基準を作り、画像とプロンプトをGPT-APIに投げるだけで、かなりの精度の採点が行われる。
深澤氏によれば、得られた結果をヒストグラムに起こすとなだらかな曲線を描いたといい、きちんと採点されていることが証明された。これにより分類器が必要なくなり、時間と手間をかけることなくオペレーション品質が向上したのである。