"GradientBoostedTrees" (机器学习方法)

详细信息与子选项

  • 梯度提升是一种用于回归和分类问题的机器学习技术,其产生树的集合形式的预测模型. 树是根据补偿之前树的弱点的目标依次进行培训. 当前的实现在后端使用 LightGBM 框架.
  • 可以给出以下选项:
  • MaxTrainingRounds 50增强的回合数
    "BoostingMethod" "Gradient"使用的方法
    "L1Regularization"0L1 正则化参数
    "L2Regularization"0L2 正则化参数
    "LeafSize" Automatic一片叶子上数据样板的最小数
    "LearningRate"Automatic用于梯度下降的学习率
    "LeavesNumber" Automatic一棵树上叶子的最小树
    "MaxDepth" 6每棵树的最大深度
  • "BoostingMethod" 的可能设置包括 "Gradient""GradientOneSideSampling""DART"(例如,Dropouts 符合多个加法回归树).

范例

打开所有单元关闭所有单元

基本范例  (2)

在标记的范例上培训预测器函数:

获取关于预测器的信息:

预测一个新范例:

产生某些数据并可视化:

在上面培训预测器函数:

比较数据和预测值,查看标准差:

选项  (8)

"BoostingMethod"  (1)

使用不同的 "BoostingMethod""WineQuality" 培训集上培训两个分类器并比较培训时间:

比较测试集的精确度:

"LeafSize"  (2)

使用 "LeafSize" 选项培训预测器函数:

通过改变 "LeafSize" 值培训 "Titanic"数据集上的两个分类器:

查看性能是如何增加的:

"LeavesNumber"  (1)

产生有标签的培训集:

使用不同的 "LeavesNumber" 培训两个预测器:

比较性能:

"MaxDepth"  (2)

使用 "MaxDepth" 选项培训分类器:

使用 "BostonHomes" 培训集培训具有不同 "MaxDepth" 的两个预测器:

比较测试集上的"ComparisonPlot"

MaxTrainingRounds  (2)

使用 MaxTrainingRounds 选项培训分类器:

通过改变 MaxTrainingRounds 的值培训"Mushroom" 数据集上的两个分类器:

查看如何提升性能: