現場の知見を分析精度の向上に活かす
2つめの事例は、与信リスク推定の分析事例だ。
本案件のエンドユーザーは、400以上の顧客を持つ南米の農業用品の卸売販売を行う事業会社だ。農業資材等を購入した農家は作物の収穫期に合わせた後払いで購入代金を支払うことができるが、商習慣も影響して売掛債権の回収にはたびたび遅延が発生している。そこで、与信リスク管理の高度化を目的とした支払い遅延日数区分の予測モデルを開発することになった。
本事例の特色は、事業会社の支援部隊のデータハンドリング技術が高く、分析上の試行錯誤を自分たちで行いたいという強い意向を持っていたことだ。また、業務ドメインに基づく仮説やアイディアも豊富で、これを分析に活かすことができれば強みになる。そう考えたInsight Edgeは、部門横断組織DX Centerとともに支援部隊の分析の後方支援を開始した。
まず、支援部隊は非エンジニアでも扱いやすいAutoMLツール「AMATERAS RAY」を現場に導入。これにより運用開始後も現場側で予測モデルの柔軟な再学習が可能になる。また、データの前処理工程ではユーザが使い慣れたMicrosoft ExcelやMicrosoft Accessなどを選定、現場が自走できる運用デザインを組んだ。
だが、実際に分析を始めると、まだ見えていなかった課題が次々と明らかになった。そのひとつは、データが少なすぎる問題だ。
「まず、債権残の多様性に対して変数の説明力が弱かった。普段はきちんと支払う顧客でも状況の悪化で突然遅延することがある。そういった状況の変化をそれぞれの請求単位で説明できる内部データの変数が限られていた。外部データで補えないかと考えたが、有効な外部データを機械的に探索するために数年分の債権残データでは少なすぎた」Insight Edgeのリードデータサイエンティスト、梶原悠氏はそう明かす。
データが少なすぎる問題を解決するため、梶原氏たちが取り入れたのは仮説ベースの分析だ。たとえば、支払い遅延に影響しうる外部データとして為替がある。為替変動と支払い遅延の関係について現場の仮説をヒアリングし、仮説を表現する特徴量を作り込む。現場の知見を活用することで有効な特徴量がいくつも見つかった。
課題への対処を繰り返し、開発フェーズの終わりまでに、AUC(ROC曲線をベースとした評価指標)での予測精度がベースラインから12%ほど改善した。事業会社側が与信リスク管理業務への導入条件とする精度にはまだ届いていないが、現状の予測モデルを活かす形で梶原氏たちは次の一手に出た。それは、現状の精度でも予測を実務に活用できる運用方法を考えることだ。
「訪問して催促をすれば、かなりの顧客がすぐに支払うことがわかっている。しかしすべての顧客に対して催促を行えば業務負荷や顧客満足度を悪化させてしまう。そこでモデルの予測から遅延日数が長期化しそうな顧客に絞って支払催促をかける運用を提案することにした。これはまだ現在進行形のプロジェクトだが、試験的なモニタリング評価期間を設けて、客観的な導入判断を行う方向で調整を進めている。将来的には、貸倒防止と運転資本の改善に役立てることが期待されている」(梶原氏)
最後に新見氏は、データを分析、改善する良いサイクルを現場とともに作り上げる上で大切にしていることを3つ挙げた。
1つは、現場がデータ分析できるよう支援することだ。「データ分析技術はどんどんコモディティ化しており、非エンジニアでも使える分析ツールがたくさんでてきている。ドメインの知識がある現場の方が分析した方が良い結果が出ることも多い。加えて、毎回データサイエンティストに依頼する手間や時間も削減できる」(新見氏)
2つめは、解決すべき本当の課題から逆算して、分析アプローチを設計することだ。現場の課題感レベルを起点にして分析を始めてしまうと、結果として施策に繋がらなかったり、効果が低くなったりするといったことが生じてしまう。現場との対話を通じて議論を重ねながら、解決すべき課題を抽出することが重要である。不動産の事例では、予測モデルを使って不動産買取再販ビジネスの収益性の評価を行なった。
そして3つめは、「現場の信頼できるパートナー」であり続けることだ。「私たちは同じ船に乗る仲間同士。案件ごとの短期的な関係ではなく、ビジネス成功を長期的に支援する、信頼できるパートナーであるべきだ。そのためにも現場の期待以上の成果を出して信頼を獲得し、案件を継続的に支援する関係性を構築することを目指す。そうすれば、結果的に長期的な支援につながり、ビジネス成功に貢献できる」(新見氏)