1.有监督 vs 无监督学习
2.预测问题:分类 vs 数值预测
3.分类:模型构建 模型使用
4.决策树归纳分类
什么是决策树
决策树的生成有两个阶段组成 : 决策树构建、树剪枝
决策树的使用:对未知样本进行分类
决策树归纳的算法 : 贪心算法 终止划分的条件
5.属性选择度量:三种度量,信息增益、增益率、Gini指标,数学符号zhezhi
信息增益的计算方式:
增益率的计算 :
具有最大增益率的属性选为分裂属性
比较属性选择度量:其他属性选择度量
6.过拟合与数剪枝
7,决策树归纳的增强
8.大型数据库的分类
9.贝叶斯算法
贝叶斯理论
10.基于规则的分类分类
11.顺序覆盖算法的规则归纳
12.模型评价与选择
训练数据集数值