首页 > 电子期刊 > J > 计算机时代

SPSS Clementine决策树建模在图书馆中的应用

具体到各系和各行政部门,将该字段统一归为“教职工”。“源单位”字段中,学生的单位具体到班级,将其概化到年级。将“索书号”字段概化为索书号头一位。将预处理后的数据导入到Microsoft Access数据库中,表名命名为,它共包含国关4366名读者09-10学年的借书统计数据,见表3。2.3 模型构建利用数据挖掘工具SPSS Clementine(版本11.1)中的C5.0建模节点构建决策树模型。将预处理后的Access数据库表文件作为数据源节点,先后连接工具中的“选择节点”、“抽样节点”和“C5.0节点”,形成如图3所示的读者借阅频度挖掘训练流程图。将得到的分类模型加入到流程取代“借阅频度类别”建模节点,链接相关输出节点,检验训练样本的自检正确率。之后再用原样本剩下的30%做测试,具体流程如图7所示。其中测试路径抽样节点的配置跟图6基本相同,除了将单选按钮“包含”改为“丢弃。执行图7流程,得到模型测试结果,其中训练样本上的测试正确率为69.1%,测试样本上的正确率为67.2%。模型分类结果与测
<<上一页  下一页>>

首页 > 电子期刊 > J > 计算机时代

广州市越秀区图书馆版权所有。
联系电话:020-87673002

本站访问人数: