平均绝对误差(Mean Absolute Error,简称 MAE)是回归模型中最常用的评估指标和损失函数之一。它衡量模型预测值与实际观测值之间的平均绝对差异,反映了预测误差的平均大小。
1. 定义与公式
2.主要特点
- 直观易懂:MAE 的值与原始数据具有相同的量纲,可以直接解释为平均的误差大小。
- 线性惩罚:MAE 采用绝对值而不是平方来处理误差,这意味着大的误差和小的误差受到的惩罚是成线性比例的。
- 对异常值鲁棒:由于采用线性惩罚,MAE 对数据中的极端异常值(outliers)相对不那么敏感。相比之下,均方误差(MSE)会平方误差,从而放大异常值的影响。
- 不可导性:MAE 函数在误差为零的点上是不可导的(尖点)。这在某些优化算法中可能会带来挑战,但通常可以通过使用次梯度下降法(Subgradient Descent)或特定的优化技巧来解决。
3. 应用场景
MAE 主要用于评估回归模型的性能,特别是当数据集包含异常值时,MAE 是一个比均方误差(MSE)或均方根误差(RMSE)更稳健(鲁棒)的选择。