The process includes making sure the Data Mining target,collecting the data, preprocessing data,classifying and generating the classification rule. ID3 is used to generate a decision tree and post-pruning method is used to pruning the tree.
本课题以烟台南山学院教务管理软件中的学生成绩信息分析为例,完整地实现了数据分类挖掘的全过程,包括:确定数据挖掘对象及目标;采集数据;采用数据集成、数据清理、数据转换、数据消减等数据预处理技术;数据分类挖掘中使用ID3决策树算法生成决策树,并利用事后修剪法对决策树进行修剪;最后由决策树产生分类规则,完成了成绩分析决策树模型的建立。
参考来源 - 数据挖掘分类算法在学生信息中的应用研究·2,447,543篇论文数据,部分数据来源于NoteExpress
应用推荐