CodeZine(コードジン)

特集ページ一覧

Insight Edgeの事例で学ぶ、現場に寄り添うデータ分析&活用の進め方【デブサミ2021夏】

【B-5】Insight Edge的 現場とともに進める住友商事DX

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2021/09/09 12:00

 金属や建機、インフラ、メディア、不動産、資源など幅広い分野で事業を手がけ、81か国に1,000社近くの連結対象会社を展開する総合商社の住友商事。そんな同社のビジネス課題をアジャイル開発やデータ分析などを通じて解決し、DXの推進や価値創造を支援するのが、内製エンジニア集団のInsight Edgeだ。幅広い分野でさまざまな案件を手がけてきた同社が目指すのは、信頼できるパートナーとして現場に寄り添いながら、現場自らがデータ分析できるソリューションを提供すること。同社が実際に手がけた不動産価格予測モデル開発と与信リスク推定分析の実例を見ながら、DXにつながるデータ分析ソリューションを開発するヒントを探る。

左から:株式会社Insight Edge Lead Data Scientist 梶原悠氏、株式会社Insight Edge Lead Data Scientist 新見佳祐氏
左から:株式会社Insight Edge Lead Data Scientist 梶原悠氏、株式会社Insight Edge Lead Data Scientist 新見佳祐氏

現場自らがデータ分析してビジネス課題の解決ができるよう支援

 ビジネス課題を最も理解しているのは、現場担当者。同じく、デジタル技術やデータ分析を一番理解しているのは、データサイエンティストなどのエンジニアたち。DXは、そんな異なる領域のプロがタッグを組み、互いの強みを掛け合わせることで実現する。Insight Edgeのリードデータサイエンティスト、新見佳祐氏はそう述べる。

 Insight Edgeは、親会社である住友商事のDX案件を技術面から支援するエンジニア部隊。これまでも商社ならではの幅広い領域でビジネス課題の解決に貢献してきた。

 DX案件は、「現状分析」「課題設定」「PoC検証」「運用」の4段階に分けて進められる。最初の段階では、現場がInsight Edgeと課題を共有して互いに理解を深める。続く段階で、課題感やボトルネックを洗い出してから、Insight Edgeが技術的な実現可能性を検証、過去の事例などを調査して現場にフィードバックし、課題解決した場合の期待効果を見積もる。期待効果が十分大きいと判断された場合は、PoC検証の段階に進む。ここではInsight Edgeによる分析とそれに対する現場のフィードバックを繰り返す形で商用化の可能性を探る。そして、晴れて商用化にGoサインが出たら、運用段階に移行。現場はInsight Edgeから提供されたツールを使って分析を実施し、要望などをフィードバック。Insight Edgeはそれを受けて調整を加えながら、分析レベルのアップデートや進化に取り組む。

 具体的にどのように進めているのだろうか。2つの実例で見てみよう。

 1つめは、不動産価格予測の分析事例だ。近年アメリカでは、仲介業に変わって不動産会社が中古不動産を売り手から直接購入、販売する買取再販事業が急成長している。ポイントは、物件価格の査定にAIモデルを採用していることだ。これまで物件の査定や売り手・買い手探しを人が行っていたところをAIモデルで支援することにより、売却プロセスを大幅に短縮することが可能という。マンションブランドを展開する住友商事の不動産事業部は、こうした価格査定の高速化や、国内におけるAIベースの買取再販ビジネスの可能性を検証したいと考え、Insight Edgeに相談を持ちかけた。

 正解に近い価格を予測できるのか。価格を決める地域の特徴はあるのか。予測モデルの精度と収益の関係を導くことはできるのか。これら課題の解決を前提に、都内の高価格帯のマンションが集積する地域を分析対象に設定。約5年分のデータを用いて、対象区別に予測モデルを構築した。予測モデルには、CatBoostを使用。GridSearchCVでハイパーパラメータを最適化してから、再度訓練データ全体でモデルを学習させて、評価データに対する予測値を算出した。

 新見氏たちはまず、2020年のデータでモデル評価を行った。結果、成約価格予測に対する平均絶対誤差率(MAPE)において、良い結果の区と悪い結果の区に分かれた。

 「この結果について、事業部から精度の悪い物件を除くことで精度は上がるのかという相談があり、特徴量ごとに精度を見比べながら理由を探ったが、うまく見つけられなかった。そこで、CatBoostのモデルから計算される不確実性に基づき、ワースト10%と20%の物件を検証対象から除外し、精度評価を行った。結果、MAPEは改善したことが分かった。ただ、対象となる物件数が減るため、やりすぎには注意する必要がある」(新見氏)

 もうひとつ、事業部からフィードバックがあった。それは、予測精度と収益の関係性が結びつかず、収益の計算ができないという相談だった。早速、新見氏たちは予測モデルの結果を活用し、買取再販事業の収益シミュレーションを作ることにした。

 収益シミュレーションは、予測価格が正解の価格に近い場合(転売がうまくいってマージンが確保できる)、低すぎる場合(誰も物件を売ろうとしないので買取もできない)、高すぎる場合(転売先が見つからず、最終的には適切な成約価格まで値下げして販売する)の3つのシナリオで利益を概算した上で作成した。ツールは、現場が最も使い慣れているエクセルで作成。担当者が自分たちでパラメーターを調整しながら利益の概算を見積もれるようにした。このツールにより、どの程度のマージンを設定すれば利益が確保できるか等のビジネスモデルの検証が可能になった。

不動産価格予測事例の収益シミュレーション
不動産価格予測事例の収益シミュレーション

 新見氏たちが心がけたのは、途中経過を週単位で報告するなど、現場への迅速なフィードバックだ。これにより、現場は都度説明を受けることで、分析内容を深く理解できるようになり、満足感が上昇。データサイエンティスト側も、細かく現場の意見を取り込めることで分析の方向性にずれが生じにくくなり、不要な手戻りが減って効率が上がったという。

 また、現場の関心に寄り添うことも大切と新見氏は言う。

 「データサイエンティストは概ね、精度を重視する。その結果、どれくらい精度を上げられるかに夢中になってしまいがちだ。しかし、現場は精度そのものにはそれほど関心がない。彼らが関心のあるのは、導入した分析モデルがビジネスに対してどれほど貢献できるかだ。本件では、分析のKPIである精度をビジネスのKPIである収益に翻訳するツールを提供し、現場の担当者が予測結果を基にビジネスモデルの検証をすることが可能になった」(新見氏)

現場の知見を分析精度の向上に活かす

 2つめの事例は、与信リスク推定の分析事例だ。

 本案件のエンドユーザーは、400以上の顧客を持つ南米の農業用品の卸売販売を行う事業会社だ。農業資材等を購入した農家は作物の収穫期に合わせた後払いで購入代金を支払うことができるが、商習慣も影響して売掛債権の回収にはたびたび遅延が発生している。そこで、与信リスク管理の高度化を目的とした支払い遅延日数区分の予測モデルを開発することになった。

 本事例の特色は、事業会社の支援部隊のデータハンドリング技術が高く、分析上の試行錯誤を自分たちで行いたいという強い意向を持っていたことだ。また、業務ドメインに基づく仮説やアイディアも豊富で、これを分析に活かすことができれば強みになる。そう考えたInsight Edgeは、部門横断組織DX Centerとともに支援部隊の分析の後方支援を開始した。

 まず、支援部隊は非エンジニアでも扱いやすいAutoMLツール「AMATERAS RAY」を現場に導入。これにより運用開始後も現場側で予測モデルの柔軟な再学習が可能になる。また、データの前処理工程ではユーザが使い慣れたMicrosoft ExcelやMicrosoft Accessなどを選定、現場が自走できる運用デザインを組んだ。

 だが、実際に分析を始めると、まだ見えていなかった課題が次々と明らかになった。そのひとつは、データが少なすぎる問題だ。

 「まず、債権残の多様性に対して変数の説明力が弱かった。普段はきちんと支払う顧客でも状況の悪化で突然遅延することがある。そういった状況の変化をそれぞれの請求単位で説明できる内部データの変数が限られていた。外部データで補えないかと考えたが、有効な外部データを機械的に探索するために数年分の債権残データでは少なすぎた」Insight Edgeのリードデータサイエンティスト、梶原悠氏はそう明かす。

 データが少なすぎる問題を解決するため、梶原氏たちが取り入れたのは仮説ベースの分析だ。たとえば、支払い遅延に影響しうる外部データとして為替がある。為替変動と支払い遅延の関係について現場の仮説をヒアリングし、仮説を表現する特徴量を作り込む。現場の知見を活用することで有効な特徴量がいくつも見つかった。

 課題への対処を繰り返し、開発フェーズの終わりまでに、AUC(ROC曲線をベースとした評価指標)での予測精度がベースラインから12%ほど改善した。事業会社側が与信リスク管理業務への導入条件とする精度にはまだ届いていないが、現状の予測モデルを活かす形で梶原氏たちは次の一手に出た。それは、現状の精度でも予測を実務に活用できる運用方法を考えることだ。

 「訪問して催促をすれば、かなりの顧客がすぐに支払うことがわかっている。しかしすべての顧客に対して催促を行えば業務負荷や顧客満足度を悪化させてしまう。そこでモデルの予測から遅延日数が長期化しそうな顧客に絞って支払催促をかける運用を提案することにした。これはまだ現在進行形のプロジェクトだが、試験的なモニタリング評価期間を設けて、客観的な導入判断を行う方向で調整を進めている。将来的には、貸倒防止と運転資本の改善に役立てることが期待されている」(梶原氏)

予測モデルを現場で活用してもらうための取り組み
予測モデルを現場で活用してもらうための取り組み

 最後に新見氏は、データを分析、改善する良いサイクルを現場とともに作り上げる上で大切にしていることを3つ挙げた。

 1つは、現場がデータ分析できるよう支援することだ。「データ分析技術はどんどんコモディティ化しており、非エンジニアでも使える分析ツールがたくさんでてきている。ドメインの知識がある現場の方が分析した方が良い結果が出ることも多い。加えて、毎回データサイエンティストに依頼する手間や時間も削減できる」(新見氏)

 2つめは、解決すべき本当の課題から逆算して、分析アプローチを設計することだ。現場の課題感レベルを起点にして分析を始めてしまうと、結果として施策に繋がらなかったり、効果が低くなったりするといったことが生じてしまう。現場との対話を通じて議論を重ねながら、解決すべき課題を抽出することが重要である。不動産の事例では、予測モデルを使って不動産買取再販ビジネスの収益性の評価を行なった。

 そして3つめは、「現場の信頼できるパートナー」であり続けることだ。「私たちは同じ船に乗る仲間同士。案件ごとの短期的な関係ではなく、ビジネス成功を長期的に支援する、信頼できるパートナーであるべきだ。そのためにも現場の期待以上の成果を出して信頼を獲得し、案件を継続的に支援する関係性を構築することを目指す。そうすれば、結果的に長期的な支援につながり、ビジネス成功に貢献できる」(新見氏)

関連リンク

  • LINEで送る
  • このエントリーをはてなブックマークに追加

著者プロフィール

  • 谷崎 朋子(タニザキ トモコ)

     エンタープライズIT向け雑誌の編集を経てフリーランスに。IT系ニュースサイトを中心に記事を執筆。セキュリティ、DevOpsあたりが最近は多めですが、基本は雑食。テクノロジーを楽しいエクスペリエンスに変えるような話が好きです。

All contents copyright © 2005-2022 Shoeisha Co., Ltd. All rights reserved. ver.1.5