首页 > 电子期刊 > J > 计算机时代

SPSS Clementine决策树建模在图书馆中的应用

试样本的对比矩阵见表4。该矩阵记录了得到的决策树模型对不同属性取值的分类结果和所占总样本的比例等信息。例如表4,对于测试样本中原来标注为“High”的记录,决策树准确地将其中的203条记录归类为“High”,占所有标为“High”的样本数的60.237%,占总样本数的16.009%。在所有被决策树归类为“High”的记录中,正确归类的这432条占其中的59.882%。2.4 模型优化在创建决策树过程中,训练样本可能存在噪声和离群点,形成异常分支,异常分枝在训练模型中表现好,但会对预测带来不良影响。因此通常需对决策树剪枝,使树的复杂度降低,更易理解,预测分类时更快更好。在SPSS Clementine中,C5.0模型通过“修剪严重性”指标控制对决策树的修剪程度,取值为0到100,该指标值越小剪枝越少;值越大剪枝越多。为保证模型精度,并使构建的决策树简单。笔者对“修剪严重性”指标进行了不同设置和反复测试,测试结果见表5。从表5看出,当“修剪严重性”在50-85间变化时,测试样本准确率和训练样本自
<<上一页  下一页>>

首页 > 电子期刊 > J > 计算机时代

广州市越秀区图书馆版权所有。
联系电话:020-87673002

本站访问人数: