複雑な会計用語の関係性を数値化する
株式会社マネーフォワードの近藤氏は、同社クラウド連結会計プロダクトにAIレコメンド機能を導入し、2023年8月にリリースした。この機能はOpenAI Embeddings APIを活用し、勘定科目の類似性に基づき、親会社と子会社の科目差異を補完する仕組みだ。経理担当者が効率的に科目を選択できるよう支援することを目的としている。

近藤氏は、「子会社が残高試算書をアップロードすると、AIがその勘定科目に類似する親会社の連結科目を3件レコメンドし、経理担当者が適切な勘定科目を選択できるよう支援する機能だ」と説明する。勘定科目とは、各取引を記録するための「家賃」や「売上」などの会計上の分類項目を指す。連結会計においては、これらを親会社の連結科目に集約する必要があり、異なる名称や言語であっても「意味的な類似性」に基づいて正確に対応させなければならない。

従来は、経理担当者が名称の異なる連結科目を手作業で補完しており、特に海外子会社を含む場合は、言語や名称の違いにより単なる一致検索では不十分だった。そこで、科目の名称に依存せず、その「意味的近さ」をベースに、連結科目を自動でレコメンドする必要が生じたのである。
しかし、レコメンド機能開発当初は、プロダクトリリース直後で学習データが不足しており、さらに独自の機械学習モデル構築には高額なコストや専門人材が必要という課題もあった。そのため、リソースを抑えながらも高精度のレコメンドを実現できる方法として、近藤氏が目をつけたのがOpenAI Embeddings APIだった。
このサービスの利用にあたり前提知識として必要になるのが、文章ベクトルと分散表現(Embedding/Word2Vec)だ。テキストデータを数値化し、機械学習モデルで扱いやすい形に変換する技法を指す。Embeddings APIは、この文章ベクトルと分散表現技術をAPI経由で提供することで、テキストの意味を捉えたレコメンドや分類を可能にしている。
文章ベクトルは、複数の浮動小数点の配列で構成される。ここで言う浮動小数点の配列とは、座標として表現できるものを指す。例えば、「現金」と「負債」のように意味が異なる2つの科目があった場合、それぞれをベクトル化することで数値的に区別され、空間上では離れた位置にプロットされる。これにより、2つの異なる単語の関係性が数値的に表現され、名称が異なっても意味がどの程度類似しているかを把握できるということだ。
