线性回归
线性回归是一种统计方法,用于发现变量之间的关系。在机器学习背景下,线性回归可找出特征(Feature)与标签(Lable)之间的关系。
例如,假设我们想要根据汽车的重量预测汽车的每加仑汽油行驶里程(mpg),并且我们有以下数据集:
线性回归方程 Linear regression equation
具有多个特征的模型
损失 Loss
损失是一个数值指标,用于描述模型的预测有多不准确。损失函数用于衡量模型预测与实际标签之间的距离。训练模型的目标是尽可能降低损失,将其降至最低值。
下图中,损失可视化为从数据点指向模型的箭头。箭头表示模型的预测结果与实际值之间的差距。
丢失距离
在统计学和机器学习中,损失函数用于衡量预测值与实际值之间的差异。
损失函数侧重于值之间的距离,而不是方向。因此可以说,损失距离是一个标量
,而非矢量
因此,所有用于计算损失的方法都会移除符号。移除此标记的两种最常用方法如下:
- 计算实际值与预测值之间的差值的绝对值。
- 计算实际值与预测值之间的差值的平方。
计算损失
在上述预测汽车车重与油耗的例子中,我们得到最佳拟合线,其中,权重和偏差分别为:
- Weight:-0.36
- Bias:30
根据最优拟合线,模型预测 2,370 磅的汽车每加仑可行驶 21.5 英里;但实际上,每加仑可行驶 24 英里,我们将按如下方式计算 L2 损失: