C4.5
属于决策树算法,既可以解决分类问题,也可以解决回归问题,属于有监督算法。
现在基本不用这个算法了。
K-Means
属于聚类算法,属于无监督算法
SVM(*)
支持向量机。
曾经一度认为是分类效果最好的算法。
现在说某个分类算法好不好,通常也会跟这个SVM算法做比较
SVM是一个统计学算法,背后有一套非常深厚,非常严谨的推导过程。
所以这个算法不仅表现效果好,而且背后还有一套完整的理论去解释它,所以就非常被大家认可。
这些年,SVM被深度学习的热度盖过去了。
Apriori
关联分析算法,已经被淘汰,因为会多次扫描数据库。
后来有个FP-Growth可以替代Apriori,FP-Growth只需要对数据库做两遍扫描。
现在也不用FP-Growth了,有更多其他的推荐算法
EM
EM算法是一个抽象的算法,并不是解决一类特定问题的。
EM其实是一个总的算法框架,在很多其他算法中也能看到EM算法的身影。
K-Means算法,本质上也属于EM算法。
PageRank
谷歌的一套算法,特别著名。
AdaBoost(*)
AdaBoost本质就是一个决策树,只不过对决策树做了改进。
AdaBoost属于有监督学习。
大部分人脸识别,都是基于AdaBoost算法做的。
与SVM相比,AdaBoost效果好,但理论解释不清楚
KNN
一个简答的分类算法,属于有监督的学习
Naive Bayes(*)
朴素贝叶斯算法,垃圾邮件识别就用的这个算法。
CART
属于决策树算法,既可以解决分类问题,也可以解决回归问题,属于有监督算法。
现在基本不用这个算法了。
FP-Growth
Apriori算法的升级版,美籍华人发明的。
逻辑回归
百度,谷歌对于搜索结果的排序,用的就是这个算法
RF、GBDT
和AdaBoost一样,这两个算法都属于决策树算法的改进。
推荐算法(*)
各大电商网站用的推荐功能
LDA
文本分析算法,做自然语言处理,有一定难度
Word2Vector
文本挖掘基本都会用这个Word2Vector
深度学习(*)
图像识别用的