决策树
主要 follw 教程:https://datawhale.feishu.cn/docs/doccndJC2sbSfdziNcahCYCx70W#
机器学习三要素
- 模型:根据具体问题,确定假设空间
- 策略:根据评价标准,确定选取最优模型的策略(通常会产出一个“损失函数”)
- 算法:求解损失函数,确定最优模型
算法原理
- 从逻辑角度,就是一堆 if else 语句的组合
- 从几何角度,根据某种准则划分特征空间
- 最终目的:将样本越分越“纯”
策略
决策树建树算法有三种ID3、C4.5、CART,每个算法主要考虑的事情主要有三个问题:
- 如何选择最优划分属性?
- 条件判断的属性值是什么?
- 什么时候停止分裂,达到我们需要的决策?