全文連結:http://tecdat.cn/?p=30330
最近我們被客戶要求撰寫關於RFM、決策樹模型的研究報告,包括一些圖形和統計輸出。
團隊需要分析一個來自在線零售商的數據
該數據包含了78周的購買歷史。該數據文件中的每條記錄包括四個欄位。客戶的ID(從1到2357不等),交易日期,購買的書籍數量,以及價值。我們被要求建立一個模型來預測消費者每周的購買頻率、書籍的購買單位和購買價值。
RFM模型
RFM是一個用於營銷分析的模型,它通過購買模式或習慣來細分公司的消費者群體。特別是,它評估了客戶的回顧性(他們多久前進行過一次購買)、頻率(他們購買的頻率)和價值(他們花多少錢)。
然後,通過測量和分析消費習慣,RFM被用來識別一個公司或組織的最佳客戶,以改善低分客戶並保持高分客戶。
關鍵要點
經常性、頻率、價值(RFM)是一種營銷分析工具,用於根據客戶消費習慣的性質來確定公司的最佳客戶。一個RFM分析通過對客戶和顧客的三個類別進行打分來評估他們:他們最近有多大的購買行為,他們購買的頻率,以及他們購買的規模。RFM模型為這三個類別中的每一個客戶打出1-5分(從最差到最好)的分數。RFM分析幫助企業合理地預測哪些客戶有可能再次購買他們的產品,有多少收入來自於新客戶(相對於老客戶),以及如何將偶爾購買的買家變成習慣購買的買家。
####計算用戶最近一次的購買
R_table$R <- as.numeric(NOW - ParsedDate)
###計算用戶的購買頻率
aggregate(FUN=length) # Calculate F
###計算用戶的購買金額
aggregate(FUN=sum) # Calculate M
得到每個用戶的RFM值,利用RFM三個值的四分位數來對用戶進行分類
多元線性回歸模型
查看回歸模型結果
得到對r值的線性擬合模型的結果,可以看到RFM三個分類值都與r值有顯著的關係,Rsquare值達到了0.8以上,說明擬合效果較好。
得到對r值的線性擬合模型的結果,可以看到RFM三個分類值都與f值有顯著的關係,Rsquare值達到早0.4左右,說明擬合效果一般。
得到對r值的線性擬合模型的結果,可以看到出了M分類值以外,FM的分類值都與f值有顯著的關係,Rsquare值達到了0.4左右,說明擬合效果一般。
點擊標題查閱往期內容
數據分享|R語言用主成分PCA、 邏輯回歸、決策樹、隨機森林分析心臟病數據並高維可視化
左右滑動查看更多
01
02
03
04
對測試集做預測
線性回歸模型預測值和擬合值比較
預測擬合值的圖中,紅點表示實際樣本點,可以看到F和M值的預測相對接近實際樣本點,預測效果較好。然而,誤差仍然比較大,因此嘗試採用決策樹模型進行預測。
決策樹模型預測
ct <- rpart.control(xval=10, minsplit=20, cp=0.1)
繪製決策樹
rpart.plot(fitR, branch=1, branch.type=2, type=1,
border.col="blue", split.col="red",
從結果圖來看,決策樹對f值和m值的擬合程度更好。
從三個模型的結果里來看,rel error和xerror都較小,因此模型預測擬合效果較好。
因此,模型的整體效果相對線性模型得到了提升。
點擊文末 「閱讀原文」
獲取全文完整代碼數據資料。
本文選自《R語言用RFM、決策樹模型顧客購書行為的數據預測》。
點擊標題查閱往期內容
數據分享|Python決策樹、隨機森林、樸素貝葉斯、KNN(K-最近鄰居)分類分析銀行拉新活動挖掘潛在貸款客戶
PYTHON銀行機器學習:回歸、隨機森林、KNN近鄰、決策樹、高斯樸素貝葉斯、支持向量機SVM分析營銷活動數據|數據分享
用PyTorch機器學習神經網絡分類預測銀行客戶流失模型
R語言用FNN-LSTM假近鄰長短期記憶人工神經網絡模型進行時間序列深度學習預測4個案例
Python中TensorFlow的長短期記憶神經網絡(LSTM)、指數移動平均法預測股票市場和可視化
R語言KERAS用RNN、雙向RNNS遞歸神經網絡、LSTM分析預測溫度時間序列、 IMDB電影評分情感
Python用Keras神經網絡序列模型回歸擬合預測、準確度檢查和結果可視化
Python用LSTM長短期記憶神經網絡對不穩定降雨量時間序列進行預測分析
R語言中的神經網絡預測時間序列:多層感知器(MLP)和極限學習機(ELM)數據分析報告
R語言深度學習:用keras神經網絡回歸模型預測時間序列數據
Matlab用深度學習長短期記憶(LSTM)神經網絡對文本數據進行分類
R語言KERAS深度學習CNN卷積神經網絡分類識別手寫數字圖像數據(MNIST)
MATLAB中用BP神經網絡預測人體脂肪百分比數據
Python中用PyTorch機器學習神經網絡分類預測銀行客戶流失模型
R語言實現CNN(卷積神經網絡)模型進行回歸數據分析Python使用神經網絡進行簡單文本分類
R語言用神經網絡改進Nelson-Siegel模型擬合收益率曲線分析
R語言基於遞歸神經網絡RNN的溫度時間序列預測
R語言神經網絡模型預測車輛數量時間序列
R語言中的BP神經網絡模型分析學生成績
matlab使用長短期記憶(LSTM)神經網絡對序列數據進行分類
R語言實現擬合神經網絡預測和結果可視化
用R語言實現神經網絡預測股票實例
使用PYTHON中KERAS的LSTM遞歸神經網絡進行時間序列預測
python用於NLP的seq2seq模型實例:用Keras實現神經網絡機器翻譯
用於NLP的Python:使用Keras的多標籤文本LSTM神經網絡分類