规范化序列模式在读者借阅行为模式挖掘的应用研究
  局部频繁项集结合得到频繁序列。Step4:继续将得到的频繁序列作为前缀,挖掘该前缀的投影数据库得到局部频繁项集,结合得到频繁序列。重复该步骤直至不能发现更长的频繁序列,算法停止。2 序列模式规范化处理如何有效使用挖掘出来的序列模式成为序列模式应用的关键。目前大部分使用的方法是按长度降序排列,长度越长的越有用;也有按支持度降序排列,支持度越高的序列模式越有用。这两种方法各有利弊,第1种方法序列模式支持度不够大而不具有非常的普遍性,第2种方法序列模式太短而起到的指导作用小。为兼顾支持度和长度的重要性,我们提出各自占50%的比例来计算序列模式的权值,但是各自的计量单位不同,支持度为百分比而长度为整数,所以必须进行数据变换,在此选择规范化[4]处理,使支持度和长度值变换后均在[0-1]范围。规范化处理是数据挖掘前的数据预处理方法,本文应用于数据挖掘后结果处理是一种新的尝试。规范化是将数据按比例缩放使之落入一个特定区间,有三
<<上一页  下一页>>
 
 广州市越秀区图书馆版权所有。
 联系电话:020-87673002
 
本站访问人数: