机器学习ML极简指南

机器学习是现代AI的核心，从推荐系统到自动驾驶，无处不在。但每个智能应用背后，都离不开那些奠基性的模型。本文用最简练的方式拆解核心机器学习模型，助你面试时对答如流，稳如老G。

线性回归

线性回归试图通过"最佳拟合线"（让所有数据点到直线的距离平方和最小，即最小二乘法）来寻找自变量和因变量的关系。比如下图绿线比蓝线更优，因为它离所有数据点更近。在这里插入图片描述

Lasso回归 (L1)

Lasso回归通过添加"绝对值惩罚项"（lambda × 斜率绝对值）来防止模型过拟合，堪称机器学习界的防沉迷系统。lambda越大，惩罚越狠——就像你妈发现你熬夜写代码时的怒气值。

None

图2：Lasso回归成本函数

当特征多到能绕地球三圈时，L1会无情抛弃那些不重要的变量，堪称特征选择界的灭霸。

Ridge回归 (L2)

Ridge和Lasso是亲兄弟，区别在于惩罚项改用"平方惩罚"（lambda × 斜率²）。当特征们勾肩搭背搞多重共线性时，L2会让所有系数雨露均沾地趋向零——堪称机器学习界的端水大师。

None

图4：Ridge回归成本函数

弹性网络回归

这位端水大师Pro Max版同时采用L1和L2惩罚，效果堪比机器学习界的鸳鸯锅——辣度自由调节，总有一款适合你。

多项式回归

当数据扭成麻花时，线性回归就懵圈了。这时多项式回归祭出***k.xⁿ***大法，用曲线拟合数据，堪称机器学习界的灵魂画手。

None

图6：线性回归 vs 多项式回归的降维打击

逻辑回归

虽然名字带"回归"，实则是分类界的扛把子。用sigmoid函数把输出压缩到0-1之间（比如预测你秃头的概率），找最佳曲线时用的是最大似然估计法——就像S命先生掐指一算S。

在这里插入图片描述

图7：线性回归 vs 逻辑回归的跨界PK

K近邻算法 (KNN)

KNN是分类界的懒汉代表：平时不训练，来新数据才临时抱佛脚找最近的K个邻居投票。K太小会误把异类当知己，K太大又会忽视小众群体——堪称机器学习界的社交恐惧症患者。

None

图8：KNN施展魔法前后对比

朴素贝叶斯

基于贝叶斯定理的文本分类专家，天真地认为所有特征都互不相关（就像觉得程序员只穿格子衫）。公式长这样：

$\frac{P(B|A)P(A)}{P(B)}$

支持向量机 (SVM)

在n维空间找最佳超平面分割数据，就像用激光刀切蛋糕。支持向量是靠近切割线的数据点，它们决定了超平面的位置——堪称机器学习界的边界感大师。
None

图10：SVM在线性可分数据上的表演

决策树

用if-else语句组成的树状结构，活像《龙与地下城》的选择剧情书。节点是特征，分支是条件，叶节点是结局——堪称机器学习界的《命运之门》游戏。

CART (基尼系数)
1. 概率表
2. 计算各属性值的基尼指数：1 - (P/P+N)² -(N/P+N)²
3. 计算属性的基尼指数：各属性值占比×其基尼指数的和ID3 (信息增益与熵)
1. 计算总信息熵
2. 计算各属性值熵：-[P/P+N] * log[p/P+N] - [N/P+N * log[N/P+N]
3. 计算属性信息增益：总熵 - 各属性值熵的加权和