Python進行多輸出(多因變量)回歸:集成學習梯度提升決策樹|附代碼數據

2023-05-31   tecdat拓端

原標題:Python進行多輸出(多因變量)回歸:集成學習梯度提升決策樹|附代碼數據

原文連結: http://tecdat.cn/?p=25939

最近我們被客戶要求撰寫關於多輸出(多因變量)回歸的研究報告,包括一些圖形和統計輸出。

在之前的文章中,我們研究了許多使用 多輸出回歸分析的方法。在本教程中,我們將學習如何使用梯度提升決策樹GRADIENT BOOSTING REGRESSOR擬合和預測多輸出回歸數據。對於給定的 x 輸入數據,多輸出數據包含多個目標標籤。本教程涵蓋:

  • 準備數據
  • 定義模型
  • 預測和可視化結果

我們將從加載本教程所需的庫開始。

拓端

,贊30

拓端

,贊16

準備數據

首先,我們將為本教程創建一個多輸出數據集。它是隨機生成的數據,具有以下一些規則。該數據集中有三個輸入和兩個輸出。我們將繪製生成的數據以直觀地檢查它。

f = plt.figure()

f.add_subplot(1,2,1)

plt.title("Xs 輸入數據")

plt.plot(X)

接下來,我們將數據集拆分為訓練和測試部分並檢查數據形狀。

print("xtrain:", xtrain.shape, "ytrian:", ytrain.shape)

點擊標題查閱往期內容

R語言樣條曲線、決策樹、Adaboost、梯度提升(GBM)算法進行回歸、分類和動態可視化

左右滑動查看更多

01

02

03

04

定義模型

我們將定義模型。作為估計,我們將使用默認參數實現。可以通過 print 命令查看模型的參數。

model = MutRer(es=gbr)

print(model )

現在,我們可以用訓練數據擬合模型並檢查訓練結果。

fit(xtrain, ytrain)

score(xtrain, ytrain)

預測和可視化結果

我們將使用經過訓練的模型預測測試數據,並檢查 y1 和 y2 輸出的 MSE 率。

predict

最後,我們將在圖中可視化結果並直觀地檢查它們。

xax = range(len)

plt.plot

plt.legend

在本教程中,我們簡要學習了如何在 Python 中訓練了多輸出數據集和預測的測試數據。

本文摘選 Python進行多輸出(多因變量)回歸:集成學習梯度提升決策樹GRADIENT BOOSTING REGRESSOR回歸訓練和預測可視化 ,點擊「閱讀原文」獲取全文完整資料。

點擊標題查閱往期內容

樣條曲線、決策樹、Adaboost、梯度提升(GBM)算法進行回歸、分類和動態可視化

PYTHON集成學習:自己編寫構建ADABOOST分類模型可視化決策邊界及SKLEARN包調用比較

PYTHON用戶流失數據挖掘:建立邏輯回歸、XGBOOST、隨機森林、決策樹、支持向量機、樸素貝葉斯和KMEANS聚類用戶畫像

PYTHON集成機器學習:用ADABOOST、決策樹、邏輯回歸集成模型分類和回歸和網格搜索超參數優化

R語言集成模型:提升樹boosting、隨機森林、約束最小二乘法加權平均模型融合分析時間序列數據Python對商店數據進行lstm和xgboost銷售量時間序列建模預測分析

R語言用主成分PCA、 邏輯回歸、決策樹、隨機森林分析心臟病數據並高維可視化

R語言基於樹的方法:決策樹,隨機森林,Bagging,增強樹

R語言用邏輯回歸、決策樹和隨機森林對信貸數據集進行分類預測

spss modeler用決策樹神經網絡預測ST的股票

R語言中使用線性模型、回歸決策樹自動組合特徵因子水平

R語言中自編基尼係數的CART回歸決策樹的實現

R語言用rle,svm和rpart決策樹進行時間序列預測

python在Scikit-learn中用決策樹和隨機森林預測NBA獲勝者

python中使用scikit-learn和pandas決策樹進行iris鳶尾花數據分類建模和交叉驗證

R語言里的非線性模型:多項式回歸、局部樣條、平滑樣條、 廣義相加模型GAM分析

R語言用標準最小二乘OLS,廣義相加模型GAM ,樣條函數進行邏輯回歸LOGISTIC分類

R語言ISLR工資數據進行多項式回歸和樣條回歸分析

R語言中的多項式回歸、局部回歸、核平滑和平滑樣條回歸模型

R語言用泊松Poisson回歸、GAM樣條曲線模型預測騎自行車者的數量

R語言分位數回歸、GAM樣條曲線、指數平滑和SARIMA對電力負荷時間序列預測