首页 > 电子期刊 > J > 计算机时代

SPSS Clementine决策树建模在图书馆中的应用

段上取值为空,用“资料不全”填充空缺值。⑷ “借书数”区间化对“借书数”这一数值属性,在建模前对其区间化,把它划分为几个等级来描述读者的借阅频度,并让其作为输出属性,为读者建立分类决策树。该字段原先的数值分布如图2所示。在4366个读者中,一年中读者借书数最多的为174本,平均约12本,最少的为0本(约占50%,即一般读者该年没有借过书)。借过书的读者按照其累计借书量的增加,人数基本呈递减模式。对“借书数”区间化时,先将没借过书的读者单分一个区间,即借书数等于0,记为“Null”。其余读者尽量按照等频,即相等人数的原则,分为高(high)、低(Low)两个区间,经过统计分析,发现“17”为较好的分界点,区间划分规则为:0为记录区间化后的借阅频度,为读者库表添加列“借阅频度”,来储存每位读者的年借阅量,处理后的借阅频度属性不同区间的样本数量分布为:Null:2187;Low:1103;High:1076;总计:4366。⑸ 其他字段的概化“读者级别”字段中,教职人员
<<上一页  下一页>>

首页 > 电子期刊 > J > 计算机时代

广州市越秀区图书馆版权所有。
联系电话:020-87673002

本站访问人数: