首页 > 电子期刊 > J > 计算机时代

基于糊模ID3算法的高校学生流失数据挖掘研究

误差。这是采用决策树ID3算法的一个缺点,所以对于模糊数据,采用糊糊决策树算法是比较科学。本文的原始数据是我校2006级到2010级学生的成绩和相关一些基本情况信息,主要包括学生的姓名、性别、身份证号、地址、民族、籍贯、各门功课的成绩、技能成绩等。收集数据后,把各门功课的成绩求出平均值作为学生的专业课成绩,抽取了一部分作为训练集,同时根据分析学生流失原因的需要,去掉了学生的民族、籍贯和地址等一些与流失不太相关的属性,并对数据进行了模糊化处理,处理后得到数据如表1所示。表1 模糊处理后的训练集(学生信息表)[编号\&性别\&专业成绩\&专业技能\&文理科\&是否流失\&男\&女\&优\&良\&中\&差\&强\&中\&弱\&文\&理\&是\&否\&1\&0\&0\&0.7\&0.2\&0.1\&0\&0.1\&0.6\&0.3\&0\&1\&0\&1\&2\&1\&0\&0.1\&0.7\&0.2\&0.1\&0.7\&0.1\&0.2\&1\&0\&0\&1\&3\&1\&0\&0.8\&0.1\&0.1\&0\&0.3\&0.6\&0.1\&1\&0\&0\&1\&4\&0\&1\&0.8\&0.1\&0\&0.1\&0
<<上一页  下一页>>

首页 > 电子期刊 > J > 计算机时代

广州市越秀区图书馆版权所有。
联系电话:020-87673002

本站访问人数: