决策树的剪枝
剪枝是决策树停止分支的方法之一,剪枝有分预先剪枝和后剪枝两种。预先剪枝是在树的生长过程中设定一个指标,当达到该指标时就停止生长,这样做容易产生“视界局限”,就是一旦停止分支,使得节点N成为叶节点,就断绝了其后继节点进行“好”的分支操作的任何可能性。不严格的说这会已停止的分支会误导学习算法,导致产生的树不纯度降差最大的地方过分靠近根节点。后剪枝中树首先要充分生长,直到叶节点都有最小的不纯度值为止,因而可以克服“视界局限”。然后对所有相邻的成对叶节点考虑是否消去它们,如果消去能引起令人满意的不纯度增长,那么执行消去,并令它们的公共父节点成为新的叶节点。这种“合并”叶节点的做法和节点分支的过程恰好相反,经过剪枝后叶节点常常会分布在很宽的层次上,树也变得非平衡。后剪枝技术的优点是克服了“视界局限”效应,而且无需保留部分样本用于交叉验证,所以可以充分利用全部训练集的信息。但后剪枝的计算量代价比预剪枝方法大得多,特别是在大样本集中,不过对于小样本的情况,后剪枝方法还是优于预剪枝方法的。
由决策树扩展为决策图
在决策树中所有从根到叶节点的路径都是通过“与”(AND)运算连接。在决策图中可以使用“或”来连接多于一个的路径。
决策树的剪枝
实用工具
会计科目汇编
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
个人所得税
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
工资,薪金所得计算
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
劳务报酬所得计算
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
印花计算税
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
税款滞纳金计算
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
金额大小写转换
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
按揭计算器(车贷房贷)
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
发票查询
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
应税货物或劳务
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
应税服务
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
车船税
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
房屋出租税收
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
社保费
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。
滞纳金计算
收入是指企业在销售商品、提供劳务及让渡资产使用权等日常活动中所形成的经济利益的总流入。