导读:今天我们将讨论的是数据挖掘中的十大经典算法,这是从十八种候选算法中选出来的,希望对大家有所帮助。 初探数据挖掘中的十大经典算法...
企业软件热点文章
Java语言与C++语言在作用域上的差异 如何开发Oracle存储过程
以下就是从参加评选的18种候选算法中,最终决选出来的十大经典算法:
一、C4.5
C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。
C4.5相比于ID3改进的地方有:
1、用信息增益率来选择属性。
ID3选择属性用的是子树的信息增益,这里