最近我們被客戶要求撰寫關於多輸出(多因變量)回歸的研究報告,包括一些圖形和統計輸出。
在之前的文章中,我們研究了許多使用 多輸出回歸分析的方法。在本教程中,我們將學習如何使用梯度提升決策樹GRADIENT BOOSTING REGRESSOR擬合和預測多輸出回歸數據。對於給定的 x 輸入數據,多輸出數據包含多個目標標籤。本教程涵蓋:
我們將從加載本教程所需的庫開始。
拓端
,贊30
拓端
,贊16
首先,我們將為本教程創建一個多輸出數據集。它是隨機生成的數據,具有以下一些規則。該數據集中有三個輸入和兩個輸出。我們將繪製生成的數據以直觀地檢查它。
f = plt.figure()
f.add_subplot(1,2,1)
plt.title("Xs 輸入數據")
plt.plot(X)
接下來,我們將數據集拆分為訓練和測試部分並檢查數據形狀。
print("xtrain:", xtrain.shape, "ytrian:", ytrain.shape)
點擊標題查閱往期內容
R語言樣條曲線、決策樹、Adaboost、梯度提升(GBM)算法進行回歸、分類和動態可視化
左右滑動查看更多
01
02
03
04
我們將定義模型。作為估計,我們將使用默認參數實現。可以通過 print 命令查看模型的參數。
model = MutRer(es=gbr)
print(model )
現在,我們可以用訓練數據擬合模型並檢查訓練結果。
fit(xtrain, ytrain)
score(xtrain, ytrain)
我們將使用經過訓練的模型預測測試數據,並檢查 y1 和 y2 輸出的 MSE 率。
predict
最後,我們將在圖中可視化結果並直觀地檢查它們。
xax = range(len)
plt.plot
plt.legend
在本教程中,我們簡要學習了如何在 Python 中訓練了多輸出數據集和預測的測試數據。
本文摘選 《 Python進行多輸出(多因變量)回歸:集成學習梯度提升決策樹GRADIENT BOOSTING REGRESSOR回歸訓練和預測可視化 》 ,點擊「閱讀原文」獲取全文完整資料。
點擊標題查閱往期內容
樣條曲線、決策樹、Adaboost、梯度提升(GBM)算法進行回歸、分類和動態可視化
PYTHON集成學習:自己編寫構建ADABOOST分類模型可視化決策邊界及SKLEARN包調用比較
PYTHON用戶流失數據挖掘:建立邏輯回歸、XGBOOST、隨機森林、決策樹、支持向量機、樸素貝葉斯和KMEANS聚類用戶畫像
PYTHON集成機器學習:用ADABOOST、決策樹、邏輯回歸集成模型分類和回歸和網格搜索超參數優化
R語言集成模型:提升樹boosting、隨機森林、約束最小二乘法加權平均模型融合分析時間序列數據Python對商店數據進行lstm和xgboost銷售量時間序列建模預測分析
R語言用主成分PCA、 邏輯回歸、決策樹、隨機森林分析心臟病數據並高維可視化
R語言基於樹的方法:決策樹,隨機森林,Bagging,增強樹
R語言用邏輯回歸、決策樹和隨機森林對信貸數據集進行分類預測
spss modeler用決策樹神經網絡預測ST的股票
R語言中使用線性模型、回歸決策樹自動組合特徵因子水平
R語言中自編基尼係數的CART回歸決策樹的實現
R語言用rle,svm和rpart決策樹進行時間序列預測
python在Scikit-learn中用決策樹和隨機森林預測NBA獲勝者
python中使用scikit-learn和pandas決策樹進行iris鳶尾花數據分類建模和交叉驗證
R語言里的非線性模型:多項式回歸、局部樣條、平滑樣條、 廣義相加模型GAM分析
R語言用標準最小二乘OLS,廣義相加模型GAM ,樣條函數進行邏輯回歸LOGISTIC分類
R語言ISLR工資數據進行多項式回歸和樣條回歸分析
R語言中的多項式回歸、局部回歸、核平滑和平滑樣條回歸模型
R語言用泊松Poisson回歸、GAM樣條曲線模型預測騎自行車者的數量
R語言分位數回歸、GAM樣條曲線、指數平滑和SARIMA對電力負荷時間序列預測