數據分享|R語言用RFM、決策樹模型顧客購書行為的數據預測|附代碼數據

2023-04-12     tecdat拓端

原標題:數據分享|R語言用RFM、決策樹模型顧客購書行為的數據預測|附代碼數據

全文連結:http://tecdat.cn/?p=30330

最近我們被客戶要求撰寫關於RFM、決策樹模型的研究報告,包括一些圖形和統計輸出。

團隊需要分析一個來自在線零售商的數據

該數據包含了78周的購買歷史。該數據文件中的每條記錄包括四個欄位。客戶的ID(從1到2357不等),交易日期,購買的書籍數量,以及價值。我們被要求建立一個模型來預測消費者每周的購買頻率、書籍的購買單位和購買價值。

RFM模型

RFM是一個用於營銷分析的模型,它通過購買模式或習慣來細分公司的消費者群體。特別是,它評估了客戶的回顧性(他們多久前進行過一次購買)、頻率(他們購買的頻率)和價值(他們花多少錢)。

然後,通過測量和分析消費習慣,RFM被用來識別一個公司或組織的最佳客戶,以改善低分客戶並保持高分客戶。

關鍵要點

經常性、頻率、價值(RFM)是一種營銷分析工具,用於根據客戶消費習慣的性質來確定公司的最佳客戶。一個RFM分析通過對客戶和顧客的三個類別進行打分來評估他們:他們最近有多大的購買行為,他們購買的頻率,以及他們購買的規模。RFM模型為這三個類別中的每一個客戶打出1-5分(從最差到最好)的分數。RFM分析幫助企業合理地預測哪些客戶有可能再次購買他們的產品,有多少收入來自於新客戶(相對於老客戶),以及如何將偶爾購買的買家變成習慣購買的買家。

####計算用戶最近一次的購買

R_table$R <- as.numeric(NOW - ParsedDate)

###計算用戶的購買頻率

aggregate(FUN=length) # Calculate F

###計算用戶的購買金額

aggregate(FUN=sum) # Calculate M

得到每個用戶的RFM值,利用RFM三個值的四分位數來對用戶進行分類

多元線性回歸模型

查看回歸模型結果

得到對r值的線性擬合模型的結果,可以看到RFM三個分類值都與r值有顯著的關係,Rsquare值達到了0.8以上,說明擬合效果較好。

得到對r值的線性擬合模型的結果,可以看到RFM三個分類值都與f值有顯著的關係,Rsquare值達到早0.4左右,說明擬合效果一般。

得到對r值的線性擬合模型的結果,可以看到出了M分類值以外,FM的分類值都與f值有顯著的關係,Rsquare值達到了0.4左右,說明擬合效果一般。

點擊標題查閱往期內容

數據分享|R語言用主成分PCA、 邏輯回歸、決策樹、隨機森林分析心臟病數據並高維可視化

左右滑動查看更多

01

02

03

04

對測試集做預測

線性回歸模型預測值和擬合值比較

預測擬合值的圖中,紅點表示實際樣本點,可以看到F和M值的預測相對接近實際樣本點,預測效果較好。然而,誤差仍然比較大,因此嘗試採用決策樹模型進行預測。

決策樹模型預測

ct <- rpart.control(xval=10, minsplit=20, cp=0.1)

繪製決策樹

rpart.plot(fitR, branch=1, branch.type=2, type=1,

border.col="blue", split.col="red",

從結果圖來看,決策樹對f值和m值的擬合程度更好。

從三個模型的結果里來看,rel error和xerror都較小,因此模型預測擬合效果較好。

因此,模型的整體效果相對線性模型得到了提升。

點擊文末 「閱讀原文」

獲取全文完整代碼數據資料。

本文選自《R語言用RFM、決策樹模型顧客購書行為的數據預測》。

點擊標題查閱往期內容

數據分享|Python決策樹、隨機森林、樸素貝葉斯、KNN(K-最近鄰居)分類分析銀行拉新活動挖掘潛在貸款客戶

PYTHON銀行機器學習:回歸、隨機森林、KNN近鄰、決策樹、高斯樸素貝葉斯、支持向量機SVM分析營銷活動數據|數據分享

用PyTorch機器學習神經網絡分類預測銀行客戶流失模型

R語言用FNN-LSTM假近鄰長短期記憶人工神經網絡模型進行時間序列深度學習預測4個案例

Python中TensorFlow的長短期記憶神經網絡(LSTM)、指數移動平均法預測股票市場和可視化

R語言KERAS用RNN、雙向RNNS遞歸神經網絡、LSTM分析預測溫度時間序列、 IMDB電影評分情感

Python用Keras神經網絡序列模型回歸擬合預測、準確度檢查和結果可視化

Python用LSTM長短期記憶神經網絡對不穩定降雨量時間序列進行預測分析

R語言中的神經網絡預測時間序列:多層感知器(MLP)和極限學習機(ELM)數據分析報告

R語言深度學習:用keras神經網絡回歸模型預測時間序列數據

Matlab用深度學習長短期記憶(LSTM)神經網絡對文本數據進行分類

R語言KERAS深度學習CNN卷積神經網絡分類識別手寫數字圖像數據(MNIST)

MATLAB中用BP神經網絡預測人體脂肪百分比數據

Python中用PyTorch機器學習神經網絡分類預測銀行客戶流失模型

R語言實現CNN(卷積神經網絡)模型進行回歸數據分析Python使用神經網絡進行簡單文本分類

R語言用神經網絡改進Nelson-Siegel模型擬合收益率曲線分析

R語言基於遞歸神經網絡RNN的溫度時間序列預測

R語言神經網絡模型預測車輛數量時間序列

R語言中的BP神經網絡模型分析學生成績

matlab使用長短期記憶(LSTM)神經網絡對序列數據進行分類

R語言實現擬合神經網絡預測和結果可視化

用R語言實現神經網絡預測股票實例

使用PYTHON中KERAS的LSTM遞歸神經網絡進行時間序列預測

python用於NLP的seq2seq模型實例:用Keras實現神經網絡機器翻譯

用於NLP的Python:使用Keras的多標籤文本LSTM神經網絡分類

文章來源: https://twgreatdaily.com/zh-hk/c07aa4d32c0c7bef95d46b81d5051aff.html