决策树总结
ID3 迭代树3代
核心是信息熵
存在的问题
信息度量不合理:倾向于选择取值多的字段
输入类型单一:离散型
不做剪枝,容易过拟合
C4.5和ID3的相比
用信息增益率代替信息增益
能对连续属性进行离散化,对不完整数据进行处理
C50:c4.5
使用了Boosting
前修剪和后修剪
CART(Classification and Regression Tree)
核心是基尼系数
分类是二叉树
支持连续值和离散值
后剪枝进行修建
支持回归,可以预测连续值
决策树总结
ID3 迭代树3代
核心是信息熵
存在的问题
信息度量不合理:倾向于选择取值多的字段
输入类型单一:离散型
不做剪枝,容易过拟合
C4.5和ID3的相比
用信息增益率代替信息增益
能对连续属性进行离散化,对不完整数据进行处理
C50:c4.5
使用了Boosting
前修剪和后修剪
CART(Classification and Regression Tree)
核心是基尼系数
分类是二叉树
支持连续值和离散值
后剪枝进行修建
支持回归,可以预测连续值