决策树: 分类树 和回归树..
分类:要有ID吗,目标字段 必须是 类别字段。输入字段不必是这样
回归:目标字段必须是数值字段。
训练阶段
测试阶段: 命中率,捕捉率,F值
分类树的种类:字段选择,选择正确率会提高的字段
砍树:砍掉末端枝条,因为希望测试数据的正确率比较高。末端样本少,代表性不高。避免过度拟合
决策树: 分类树 和回归树..
分类:要有ID吗,目标字段 必须是 类别字段。输入字段不必是这样
回归:目标字段必须是数值字段。
训练阶段
测试阶段: 命中率,捕捉率,F值
分类树的种类:字段选择,选择正确率会提高的字段
砍树:砍掉末端枝条,因为希望测试数据的正确率比较高。末端样本少,代表性不高。避免过度拟合