Python进行多输出(多因变量)回归:集成学习梯度提升决策树|附代码数据

2023-05-31   tecdat拓端

原标题:Python进行多输出(多因变量)回归:集成学习梯度提升决策树|附代码数据

原文链接: http://tecdat.cn/?p=25939

最近我们被客户要求撰写关于多输出(多因变量)回归的研究报告,包括一些图形和统计输出。

在之前的文章中,我们研究了许多使用 多输出回归分析的方法。在本教程中,我们将学习如何使用梯度提升决策树GRADIENT BOOSTING REGRESSOR拟合和预测多输出回归数据。对于给定的 x 输入数据,多输出数据包含多个目标标签。本教程涵盖:

  • 准备数据
  • 定义模型
  • 预测和可视化结果

我们将从加载本教程所需的库开始。

拓端

,赞30

拓端

,赞16

准备数据

首先,我们将为本教程创建一个多输出数据集。它是随机生成的数据,具有以下一些规则。该数据集中有三个输入和两个输出。我们将绘制生成的数据以直观地检查它。

f = plt.figure()

f.add_subplot(1,2,1)

plt.title("Xs 输入数据")

plt.plot(X)

接下来,我们将数据集拆分为训练和测试部分并检查数据形状。

print("xtrain:", xtrain.shape, "ytrian:", ytrain.shape)

点击标题查阅往期内容

R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化

左右滑动查看更多

01

02

03

04

定义模型

我们将定义模型。作为估计,我们将使用默认参数实现。可以通过 print 命令查看模型的参数。

model = MutRer(es=gbr)

print(model )

现在,我们可以用训练数据拟合模型并检查训练结果。

fit(xtrain, ytrain)

score(xtrain, ytrain)

预测和可视化结果

我们将使用经过训练的模型预测测试数据,并检查 y1 和 y2 输出的 MSE 率。

predict

最后,我们将在图中可视化结果并直观地检查它们。

xax = range(len)

plt.plot

plt.legend

在本教程中,我们简要学习了如何在 Python 中训练了多输出数据集和预测的测试数据。

本文摘选 Python进行多输出(多因变量)回归:集成学习梯度提升决策树GRADIENT BOOSTING REGRESSOR回归训练和预测可视化 ,点击“阅读原文”获取全文完整资料。

点击标题查阅往期内容

样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化

PYTHON集成学习:自己编写构建ADABOOST分类模型可视化决策边界及SKLEARN包调用比较

PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像

PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化

R语言集成模型:提升树boosting、随机森林、约束最小二乘法加权平均模型融合分析时间序列数据Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析

R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

R语言基于树的方法:决策树,随机森林,Bagging,增强树

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

spss modeler用决策树神经网络预测ST的股票

R语言中使用线性模型、回归决策树自动组合特征因子水平

R语言中自编基尼系数的CART回归决策树的实现

R语言用rle,svm和rpart决策树进行时间序列预测

python在Scikit-learn中用决策树和随机森林预测NBA获胜者

python中使用scikit-learn和pandas决策树进行iris鸢尾花数据分类建模和交叉验证

R语言里的非线性模型:多项式回归、局部样条、平滑样条、 广义相加模型GAM分析

R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类

R语言ISLR工资数据进行多项式回归和样条回归分析

R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型

R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量

R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测