「うまい棒1本分」のコストで1年3か月分の科目処理が可能に
当初、近藤氏のクラウド連結会計プロダクトでは、勘定科目のレコメンドに「BERT」モデルを使用していたという。BERTは日本語の科目変換で50~60%の精度を達成していたが、精度向上が課題であった。そんな中でEmbeddings APIに出会い、早速精度検証を行ったところ、BERTと比較して日本語のレコメンド精度が20%向上し、多言語対応では約1.8倍のスコアを記録。この結果を受けて、Embeddings APIの本格導入を決定した。

プロダクトの内部処理としては、子会社がアップロードした残高試算表の勘定科目と親会社の連結科目をそれぞれベクトル化し、コサイン類似度を用いて類似度が高い順にレコメンドを行っている。ここでの工夫として、近藤氏は「Redisによるベクトルキャッシュを実装した」ことを挙げた。Embeddings APIが同じ入力に対して一貫した出力を返す特性を利用し、キャッシュを活用することでレスポンス速度を高速化し、APIコストの削減も実現したのだ。
近藤氏はEmbeddings APIの導入効果について、「2000万件以上の科目処理を行った1年3か月間のベクトル算出にかかった費用は、驚くべきことに『うまい棒1本分』よりも低いレベルで済んだ。また、当初予定していたPythonベースのAIモデルサーバーを撤廃したため、インフラコストの大幅な削減も実現した」と語る。
また、今回の取り組みを他プロダクトに組み込む展望もあるそうだ。例えば、経費精算に必要な領収書データをテキスト化し、ベクトル化したデータベースに保存。ユーザーが検索ワードを入力すると、関連する領収書データを迅速にレコメンドする仕組みを構築することで、利便性とコスト削減の両立を図ることも考えられるという。

このように、テキスト化可能なデータであれば、どのようなケースにも適用できることもEmbeddings APIの大きな利点だ。ChatGPT APIによって画像のテキスト変換も容易になっている現状、Embeddings APIを活用すれば、あらゆるデータに対して高精度なレコメンド機能を構築できるという。
最後に近藤氏は「Embeddings APIを活用することで、機械学習エンジニアが不在でも、リリース間近のプロダクトでも、高精度なAI機能を低コストで迅速に実現できる。また、連結会計やクラウド経費での事例のように、レコメンドや異常検出、テキスト分類といった多様な機能を通して、プロダクト価値の向上とユーザー体験の改善も可能だ。今回発表した内容を持ち帰り、自身のプロダクトの価値向上に繋げて欲しい」と会場に呼び掛け、講演を締めくくった。