対象読者
- SQLの基本は理解しているが、より実践的な分析に取り組みたい方
サンプルの動作確認環境
- PostgreSQL
- CentOS6.7
データの準備
本稿で用いるサンプルデータとして、購買履歴のテーブルを準備しました。
サンプルデータの作成ためのSQLを、以下に示しておきます。
create table sales_history( item_name char(12), (商品名) item_category char(12 ), (商品カテゴリ) date date, (購買日) place char(8), (購買地域・場所) user_id char(8), (顧客コード) price int (料金) );
insert into sales_history values ('鮭','food','2017/5/29','AB Store','UID0001','250'), ('豆乳','food','2017/5/29','AB Store','UID0001','250'), ('豆乳','food','2017/5/30','AB Store','UID0001','200'), ('鮭','food','2017/5/30','AB Store','UID0001','350'), ('卵','food','2017/5/30','AB Store','UID0001','200'), ('鮭','food','2017/5/30','AB Store','UID0001','350'), ('牛肉','food','2017/6/1','AB Store','UID0001','450'), ('牛肉','food','2017/6/2','AB Store','UID0001','450'), ('深皿','zakka','2017/6/3','AB Store','UID0002','980'), ('卵','food','2017/6/4','AB Store','UID0001','250'), ('豆乳','food','2017/6/4','AB Store','UID0003','250'), ('卵','food','2017/6/5','AB Store','UID0001','250'), ('卵','food','2017/6/6','AB Store','UID0001','250'), ('鮭','food','2017/6/7','AB Store','UID0001','250'), ('鮭','food','2017/6/8','AB Store','UID0001','250'), ('卵','food','2017/6/9','AB Store','UID0001','250'), ('豆乳','food','2017/6/10','AB Store','UID0001','250'), ('卵','food','2017/6/10','AB Store','UID0001','250'), ('鮭','food','2017/6/10','AB Store','UID0004','250'), ('卵','food','2017/6/12','AB Store','UID0001','250'), ('卵','food','2017/6/12','AB Store','UID0001','250'), ('鮭','food','2017/6/13','AB Store','UID0001','250'), ('豆乳','food','2017/6/13','AB Store','UID0001','250'), ('深皿','zakka','2017/6/14','AB Store','UID0003','980'), ('深皿','zakka','2017/6/14','AB Store','UID0003','780') ;
RFM分析とは
RFM分析とは、顧客の購買行動をRecency(最新購買日)、Frequency(購買頻度)、Monetary(購買金額)の3つの指標で分類し分析する手法です。
第1回で取り上げたデシル分析は一つの指標での分析でしたが、RFM分析は複数の指標の分析となるため、顧客をより詳しく分析したい場合に用いられる手法です。
RFM分析でもそれぞれの指標をランク分けします。この際、デシル分析のように10段階にしてもいいですが、3指標のため10×10×10=1000通りの分類になります。あまり多くても分析結果が分かりにくいため、3~5程度のランクに分けるのが一般的なようです。
図1はRFM分析による顧客分類のイメージです。頻度が高いと常連、低いと新規、購買合計金額が多いと優良、といった分類をします。
顧客が現在どのような状態か観測するため、また今後どのように変化すよう施策を打つべきか検討するため分析に利用します。
集計したデータは活用のため、3指標のうちシンプルに2指標のみを使って2次元データで分析する方法もよく用いられます。今回は3指標の集計と2指標の集計を解説します。