当前位置: 首页 > 科技观察

数据挖掘领域十大经典算法

时间:2023-03-19 00:30:24 科技观察

国际权威学术组织IEEE数据挖掘国际会议(ICDM)此前评选出数据挖掘领域十大经典算法:C4.5、k-均值、SVM、Apriori、EM、PageRank、AdaBoost、kNN、朴素贝叶斯和CART。不仅是评选的前十名算法,实际上参与评选的18个算法,其实任何一个都可以称为经典算法。在数据挖掘领域产生了非常深远的影响。1.C4.5C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。C4.5算法继承了ID3算法的优点,在以下几个方面改进了ID3算法:1)使用信息增益率来选择属性,克服了使用信息增益时选择取值较多的属性的缺点;2)树构建过程中的修剪;3)可以完成连续属性处理的离散化;4)能够处理不完整的数据。C4.5算法具有以下优点:生成的分类规则简单易懂,准确率高。其缺点是在构建树的过程中,需要对数据集进行多次顺序扫描和排序,导致算法效率低下。2.k-means算法就是K-Means算法。k-means算法是一种聚类算法,将n个对象根据其属性划分为k段,k