深度学习篇---模型训练评估参数

文章目录

前言
一、Precision（精确率）
- 1.1定义
- 1.2意义
- 1.3数值接近1
- 1.4数值再0.5左右
- 1.5数值接近0
二、Recall（召回率）
- 2.1定义
- 2.2意义
- 2.3数值接近1
- 2.4数值在0.5左右
- 2.5数值接近0
三、Accuracy（准确率）
- 3.1定义
- 3.2意义
- 3.3数值接近1
- 3.4数值接近0.5左右
- 3.5数值接近0
四、F1 值
- 4.1定义
- 4.2意义
- 4.3数值接近1
- 4.4数值0.5左右
- 4.5数值接近0
五、ROC 曲线与 AUC
- 5.1ROC曲线
- 5.2AUC
- 5.3AUC接近1
- 5.4AUC接近0.5
- 5.5AUC小于0.5
六、平均绝对误差（MAE）
- 6.1定义
- 6.2意义
- 6.3数值接近0
- 6.4数值较大
七、均方误差（MSE）
- 7.1定义
- 7.2意义
- 7.3数值接近0
- 7.4数值较大

前言

本文简单介绍了深度学习中模型训练好坏的评估参数。

一、Precision（精确率）

1.1定义

定义：预测为正例的样本中，真正为正例的比例。计算公式为：
Precision= TP/（TP+FP）
其中TP（True Positive）表示真正例，即实际为正例且被预测为正例的样本数量；FP（False Positive）表示假正例，即实际为负例但被预测为正例的样本数量。

1.2意义

意义：精确率反映了模型预测出的正例中真正正确的比例，用于衡量模型预测正例的准确性。例如，在垃圾邮件分类中，精确率高意味着模型预测为垃圾邮件的邮件中，确实是垃圾邮件的比例较高，可减少将正常邮件误判为垃圾邮件的情况。

1.3数值接近1

数值接近 1：说明模型预测为正例的样本中，真正为正例的比例很高。例如在文本分类任务中，若精确率达到 0.9 以上，表明模型预测为某一类别的文本，绝大部分确实属于该类别，模型在识别正例时具有较高的准确性，误判为正例的情况很少。

1.4数值再0.5左右

数值在 0.5 左右：表示模型预测正例的准确性一般，有一半左右预测为正例的样本可能是错误的判断。这意味着模型在区分正例和负例时，存在较大的混淆，可能需要进一步调整模型参数或特征工程，以提高其对正例的精确识别能力。

1.5数值接近0

数值接近 0：说明模型几乎无法准确识别正例，预测为正例的样本中大部分是错误的，模型在正例识别方面表现很差，可能存在严重的过拟合或欠拟合问题，或者数据集中存在噪声干扰等因素影响了模型的判断。

二、Recall（召回率）

2.1定义

定义：实际为正例的样本中，被预测为正例的比例。计算公式为：
Recall= TP/（TP+FN），其中FN（False Negative）表示假反例，即实际为正例但被预测为负例的样本数量。

2.2意义

意义：召回率体现了模型能够正确识别出的正例的能力。在一些场景中，如疾病检测，希望尽可能多地检测出真正患病的人，即使可能会有一些误判，此时召回率就非常重要。较高的召回率表示模型能够找到大部分实际为正例的样本，不会遗漏太多真正的正例。

2.3数值接近1

数值接近 1：表明模型能够几乎找出所有实际为正例的样本。例如在疾病检测场景中，召回率接近 1 意味着几乎所有患病的样本都被模型检测出来了，很少有漏检的情况，模型在捕捉正例方面具有很强的能力。

2.4数值在0.5左右

数值在 0.5 左右：说明模型只能识别出一半左右的实际正例样本，存在较多的漏检情况。这可能是因为模型对正例的特征学习不够充分，或者正例样本在数据集中分布不均衡，导致模型未能很好地学习到正例的各种特征，从而无法准确识别所有正例。

2.5数值接近0

数值接近 0：表示模型几乎无法找到实际的正例样本，漏检情况非常严重。模型可能根本没有学习到正例的有效特征，或者模型过于保守，将大量正例错误地判断为负例，需要对模型进行重新训练或调整，以提高其对正例的捕捉能力。

三、Accuracy（准确率）

3.1定义

定义：预测正确的样本数占总样本数的比例。计算公式为：
Accuracy= TP+TN/（TP+TN+FP+FN），其中TN（True Negative）表示真反例，即实际为负例且被预测为负例的样本数量。

3.2意义

意义：准确率是一个较为直观的指标，用于衡量模型整体的预测正确程度。但当数据集中正负样本比例不均衡时，准确率可能会产生误导。例如，在一个正负样本比例为 9:1 的数据集上，即使模型将所有样本都预测为正例，也能获得 90% 的准确率，但实际上模型并没有很好地学习到负例的特征。

3.3数值接近1

数值接近 1：表示模型整体的预测准确性很高，无论是正例还是负例，模型都能准确地进行分类。在数据分布较为均衡的情况下，准确率高说明模型对数据的拟合效果好，能够学习到数据中的有效特征，从而做出准确的预测。

3.4数值接近0.5左右

数值在 0.5 左右：说明模型的预测结果与随机猜测差不多，模型可能没有学习到数据中的任何有效信息，无法对样本进行准确分类。这可能是由于数据特征与目标变量之间没有明显的关联，或者模型过于简单，无法捕捉到数据中的复杂模式。

3.5数值接近0

数值接近 0：表示模型的预测结果几乎都是错误的，这是一种极端情况，通常是由于模型存在严重的问题，如模型结构错误、数据预处理不当、训练过程出现异常等，导致模型完全无法对数据进行正确的分类。

四、F1 值

4.1定义

定义：精确率和召回率的调和平均数，计算公式为：
F1= 2×Precision×Recall/（Precision+Recall）。

4.2意义

意义：F1 值综合了精确率和召回率两个指标，能够更全面地反映模型的性能。当精确率和召回率都较高时，F1 值也会较高。在实际应用中，F1 值常用于平衡精确率和召回率，特别是在两者之间存在权衡时，F1 值可以作为一个综合的评估指标来选择最优的模型。

4.3数值接近1

数值接近 1：说明模型在精确率和召回率上都表现出色，能够在准确识别正例的同时，尽可能地找出所有正例，模型的综合性能优秀。例如在信息检索系统中，F1 值接近 1 表示系统既能准确地返回相关的检索结果（精确率高），又能涵盖大部分相关的信息（召回率高），能够很好地满足用户的需求。

4.4数值0.5左右

数值在 0.5 左右：意味着模型在精确率和召回率之间存在一定的平衡，但整体性能一般。可能是精确率和召回率其中一个指标较高，而另一个指标较低，导致两者的调和平均数不高。此时需要分析具体是哪个指标拖了后腿，进而针对性地改进模型，以提高 F1 值。

4.5数值接近0

数值接近 0：表明模型在精确率和召回率方面的表现都很差，可能存在严重的分类错误或对正例的识别能力不足，模型需要进行全面的优化和调整，包括重新选择特征、调整模型结构、优化训练参数等，以提高精确率和召回率，进而提升 F1 值。

五、ROC 曲线与 AUC

5.1ROC曲线

ROC 曲线： Receiver Operating Characteristic 曲线，以假正率（FPR）为横坐标，真正率（TPR）为纵坐标绘制的曲线。其中
FPR= FP/（FP+TN），TPR= TP/（TP+FN）。ROC 曲线展示了模型在不同阈值下的分类性能，曲线越靠近左上角，说明模型的性能越好。

5.2AUC

AUC： Area Under the Curve，即 ROC 曲线下的面积。AUC 的值介于 0 到 1 之间，AUC 越大，说明模型的性能越好。AUC 为 1 表示模型能够完美地将正负样本区分开，AUC 为 0.5 表示模型的预测结果与随机猜测相当。

5.3AUC接近1

AUC 接近 1：说明 ROC 曲线靠近左上角，模型具有很强的区分正负样本的能力。在不同的阈值下，模型都能较好地将正例和负例区分开来，很少出现将正例误判为负例或负例误判为正例的情况，模型的性能非常优秀。
AUC 在 0.5 到 0.8 之间：表示模型具有一定的区分正负样本的能力，但性能一般。ROC 曲线位于对角线（AUC = 0.5）上方，说明模型的预测结果优于随机猜测，但还有较大的提升空间。可能需要进一步优化模型，调整特征或参数，以提高模型的性能。

5.4AUC接近0.5

AUC 接近 0.5：说明模型的区分能力与随机猜测相当，ROC 曲线接近对角线。这意味着模型可能没有学习到有效的特征来区分正负样本，需要重新审视数据和模型，查找问题所在，可能需要重新进行特征工程或选择更合适的模型。

5.5AUC小于0.5

AUC 小于 0.5：这种情况比较罕见，通常表示模型存在严重问题，其预测结果甚至不如随机猜测。可能是模型训练过程出现错误，或者数据存在严重的偏差或噪声，导致模型学到了错误的模式，需要对整个建模过程进行全面检查和修正。

六、平均绝对误差（MAE）

6.1定义

定义：预测值与真实值之间绝对误差的平均值。

6.2意义

意义：MAE 直观地反映了模型预测值与真实值之间的平均误差大小，其值越小，说明模型的预测结果越接近真实值，预测精度越高。

6.3数值接近0

数值接近 0：表示模型的预测值与真实值之间的平均差异非常小，模型能够准确地预测出目标值，预测精度很高。例如在预测股票价格走势时，MAE 接近 0 说明模型能够准确地预测出股票的实际价格，误差在可接受的范围内，模型具有很强的预测能力。

6.4数值较大

数值较大：说明模型的预测值与真实值之间存在较大的平均差异。例如在房价预测中，如果 MAE 较大，意味着模型预测的房价与实际房价有较大的偏差，可能是模型没有充分考虑到影响房价的各种因素，或者数据中存在一些异常值影响了模型的准确性，需要对模型进行改进或对数据进行进一步的处理。

七、均方误差（MSE）

7.1定义

定义：预测值与真实值之间误差平方的平均值。

7.2意义

意义：MSE 也用于衡量模型预测值与真实值之间的差异程度。由于对误差进行了平方运算，MSE 会对较大的误差给予更大的权重，因此对异常值更为敏感。MSE 越小，模型的性能越好。在一些优化问题中，常以最小化 MSE 为目标来训练模型。

7.3数值接近0

数值接近 0：表明模型的预测值与真实值之间的误差平方和很小，模型的预测效果非常好。与 MAE 类似，MSE 接近 0 表示模型能够准确地拟合数据，对目标值的预测精度高，在各种预测任务中都属于理想的状态。

7.4数值较大

数值较大：由于 MSE 对误差进行了平方运算，所以较大的 MSE 值说明模型存在较大的误差，而且对较大的误差给予了更大的权重。这可能是因为模型过于简单，无法捕捉到数据中的复杂关系，或者存在过拟合现象，导致在训练集上表现良好，但在测试集上误差较大。需要对模型进行调整，如增加模型的复杂度、采用正则化方法等，以降低 MSE 值，提高模型的性能。