SPSS Clementine决策树建模在图书馆中的应用
给出针对国关图书馆读者的借阅权限建议。具体技术思路如图1所示。2 具体的实现方案2.1 数据源数据源于国关图书馆金盘系统Oracle数据库,主要涉及原始数据库三个表:、、。其中流通日志表记录读者每次到馆的一项事务。笔者利用这三张表进行连接,从流通日志表抽取2009-2010完整一学年的数据,抽取后的数据存储在Excel表中,命名为 (格式见表2),该表共包含记录109609条,字段8个。其中操作类型为事务类型,如J:借书/H:还书/S:赔书等;读者级别为读者身份,如本科生、研究生、信科教职工等;源单位具体到班级,如:信科0601/国经0702/国政研二等。2.2 数据预处理⑴ 数据筛选取出流通事务记录表中操作类型为“J”(借书)的全部记录。⑵ 分组计数取出的记录集按读者条码分组,统计每个读者出现的次数,将此数值记为读者在一学年中的“借书数”。将此属性添加到中具有相同读者条码的记录中。未在流通事务记录表中出现的读者条码的借书数记为0。⑶ 空缺值的处理一些记录在“单位”字
<<上一页 下一页>>
广州市越秀区图书馆版权所有。
联系电话:020-87673002
本站访问人数: