L1 Loss、L2 Loss、Cross-Entropy Loss

news/2025/11/21 14:12:00/文章来源:https://www.cnblogs.com/lidadudu/p/19252626

深度学习中常用的三种主要损失函数:L1 Loss (平均绝对误差)L2 Loss (均方误差)Cross-Entropy Loss (交叉熵损失)

这三种损失函数各有特点,并适用于不同的任务和场景。


1. L1 Loss (平均绝对误差 / Mean Absolute Error, MAE)

📐 公式

image

✨ 特点与用途

特点 描述
导数 导数是常数(在 0 点不连续)。这意味着模型对所有误差的惩罚力度是相同的。
鲁棒性 离群点(Outliers)具有更强的鲁棒性。因为对大误差的惩罚是线性的,不会像 L2 Loss 那样被平方放大。
收敛 梯度恒定,收敛速度稳定,但由于 $0$ 点梯度不连续,可能导致最终收敛时在最小值附近震荡
用途 主要用于回归任务,尤其是在数据中包含较多离群点时。

2. L2 Loss (均方误差 / Mean Squared Error, MSE)

📐 公式

image

✨ 特点与用途

特点 描述
导数 导数与误差大小成线性关系image。误差越大,梯度越大,惩罚越重。
鲁棒性 对离群点不鲁棒。大的误差会被平方放大,导致模型会过度关注并试图修正这些离群点。
收敛 导数连续且平滑,收敛过程稳定。误差接近 0 时,梯度变小,有助于模型精确收敛
用途 主要用于回归任务。是理论上最常用的损失函数,在要求高精度、对离群点不敏感的场景使用。

3. Cross-Entropy Loss (交叉熵损失)

📐 公式

交叉熵损失主要用于分类任务

image

✨ 特点与用途

特点 描述
适用任务 分类任务(将输入映射到离散的类别标签)。
惩罚机制 惩罚与模型预测概率的置信度相关。当模型对正确类别的预测概率很低时,损失会急剧增大。
优化目标 鼓励模型对正确类别给出接近 1 的高概率预测。
用途 二分类(常用于 Sigmoid 激活),多分类(常用于 Softmax 激活)。

💡 总结选择原则

  • 回归任务(连续值预测):
    • L2 Loss (MSE): 如果对离群点不敏感,且追求收敛的平滑性。
    • L1 Loss (MAE): 如果数据中离群点较多,且需要更好的鲁棒性。
  • 分类任务(离散标签预测):
    • Cross-Entropy Loss: 标准选择,用于评估预测概率分布与真实标签之间的差异。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/972102.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Day3:2025年9月24日,星期三,上班。

今天上班,本来以为可以很休闲的,结果值班那天的小情侣纠纷又来要求我们依法处理,不愿意接受调解,你说你们这是何苦呢?最终不也落得个两败俱伤吗?两个人在一起,是缘份,分开了也是缘份,只是这种缘份浅了,浅到无…

2025旗舰级项目管理平台优中选优(10大),匹配主流业务场景需求​

本文将为你详细解析10款旗舰级项目管理平台——禅道、伙伴智慧、筑程通、数智工坊、优企办、智联研发、快建通、云启协同、易趋、泛微e-cology,它们精准匹配2025年主流业务场景需求,是各行业团队数字化转型的核心助力…

ARM AXI-stream、ACE-Lite 与 CMN 的区别解析 - ENGINEER

ARM AXI-stream、ACE-Lite 与 CMN 的区别解析 在 ARM 架构中,AXI-stream、ACE-Lite​ 和 CMN(Coherent Memory Network)是三种不同的总线协议或一致性管理机制,分别针对不同场景设计。以下是它们的核心区别与适用…

Calculus Review

Trivial things...Chapter 0. The requirement of our college is that the process should be written in English... The content of this essay is very very trivial, so should you find yourself with some leis…

2025 最新酸菜厂家推荐!优质酸菜厂家权威排行榜,传统工艺与现代标准兼具的靠谱品牌全解析切丝酸菜/正宗东北酸菜/酸菜丝/酸菜芯/酸菜馅/大缸酸菜/老式酸菜公司推荐

引言 酸菜作为极具地域特色的经典农产品,凭借酸香醇厚的风味、脆嫩爽口的口感,不仅成为日常饮食中不可或缺的食材,更广泛应用于连锁餐饮、预制菜加工等多元领域。然而行业快速发展中,部分品牌存在原料筛选宽松、发…

Linux系统云服务器被入侵如何排查解决?

当 Linux 系统的云服务器被入侵时,及时排查和解决问题是防止更大损失的关键。以下是一个系统化的排查和解决步骤,包括入侵检测、分析取证、修复系统和加强安全防护。1. 确认入侵迹象 首先,需要判断服务器是否真的被…

跨节点协同、合规可控:隐语SecretFlow在运营商架构中的应用解析

在数字化深入推进的当下,政企和运营商行业正面临越来越复杂的数据协同需求:一方面,分支机构众多、系统各有不同,横向数据难以打通;另一方面,监管趋严、数据敏感性强,使得数据出域的风险和门槛持续升高。 如何通…

2025年江苏厨房橱柜厂家全面评测与行业趋势分析

摘要 2025年江苏厨房橱柜行业正迎来智能化、定制化浪潮,随着消费者对家居品质要求的提升,厨房橱柜不再仅是储物工具,而是融合设计、环保与科技的生活空间核心。本文基于行业数据和用户反馈,深度评测江苏地区顶级厨…

2025年江苏全屋定制行业深度解析与权威厂家推荐榜单

摘要 随着消费升级和个性化需求增长,2025年江苏全屋定制行业迎来快速发展期,市场规模预计突破百亿。现代家庭更注重空间利用率和风格统一性,全屋定制成为解决户型差异化和收纳需求的优选方案。本文基于行业数据、技…

Day2:2025年9月23日,星期二,休息。

值完班的第二天就可以休息了,暂时没有什么事情可以处理,就完成了谈心谈话和心得体会。借此机会吐露了很多心里的想法,主要就是表达自己的一些诉求吧,反正我表达过,采不采纳无所谓,表达与否就很重要了。晚上继续健…

2025年三网通信号放大器生产厂家权威推荐榜单:车载信号放大器/电梯手机信号放大器/手机信号放大器源头厂商精选

在移动互联网时代,信号覆盖质量直接关系到通信体验,三网通信号放大器市场正以每年超过12%的速度快速增长,成为解决信号盲区、提升通信质量的关键设备。 本文将基于技术实力、产品性能、市场反馈、服务能力四大维度,…

1 - Java概述 / 变量 / 运算符 / 控制结构 / 数组 / 面向对象编程基础 / IDEA部分操作使用

第二章节:Java概述 2.1 JAVA的重要特点是OOP(Object Oriented Programming, 面向对象)的是跨平台的 即编译好的.class文件可以在多个系统下由JVM运行,这种特性称为跨平台 所以实际上跨平台性是由.class和JVM实现的是…

2025年高效沸腾干燥机供货厂家权威推荐榜单:沸腾流化床干燥机/立式沸腾干燥机/流化床干燥设备源头厂商精选

在制药、化工、新能源等行业提质增效的背景下,高效沸腾干燥机作为物料干燥的关键设备,其技术性能和可靠性直接影响到生产效率和产品质量,这一细分市场正随着产业升级而稳步增长。 高效沸腾干燥机是利用热风使湿物料…

Gemini 3 Pro 太强了,我整理了使用 Gemini 3 Pro 的 8 个官方入口(建议收藏!!)

大家好,我是R哥。 昨天 Gemini 3 发布就全网刷屏了,各种测评数据吊打其他大模型,Gemini 3 简直杀疯了……昨天也有很多朋友在后台问我:“Gemini 3 到底在哪里用?”。 其实在《杀疯了!Google 推出 AI 编程工具:A…

GEO优化公司推荐:步思GEO引领AI语义网络新纪元

在信息过载的数字化时代,如何让您的品牌内容精准触达目标用户?GEO优化通过构建智能语义网络,让您的企业在AI搜索新生态中占据领先地位。本文将为您推荐市场上表现卓越的GEO优化公司,并重点介绍步思GEO如何通过创新…

logo设计公司推荐 | 橙乐视觉:战略LOGO设计、品牌全案与VI系统创建专家

在品牌竞争日益激烈的今天,一个出色的Logo能成为企业最直观的身份象征。在众多logo设计公司中,北京橙乐视觉广告有限公司凭借其战略性的设计思维和众多国内外权威奖项的认可,已成为许多企业打造品牌符号时的优先选择…

gcc for arm linux

如果你想要在 ARM 架构的 Linux 系统上编译 C 程序,可以使用 gcc(GNU Compiler Collection)来编译,但需要注意以下几点:? 一、前提条件安装 ARM 架构支持的 GCC:在大多数 ARM Linux 发行版(如 Ubuntu、Debian、…

gbk linux

在 Linux 系统中,gbk 是一种 GBK 编码(也称为 GB2312),是一种常用的中文字符编码标准。它主要用于支持中文字符的显示和存储。一、GBK 编码在 Linux 中的使用1. 查看当前系统使用的编码你可以使用以下命令查看当前…

g linux 下载

在 Linux 系统中,下载文件通常使用 wget 或 curl 命令。以下是常见方式的详细说明:? 1. 使用 wget 下载文件wget https://example.com/file.txtwget 是一个命令行下载工具,支持 HTTP、HTTPS、FTP 等协议。https://…

IntelliJ IDEA新建文件配置作者信息、日期和描述等(windows)

参考连接:IntelliJ IDEA新建文件配置作者信息、日期和描述等1、进入 File -> Settings(Windows/Linux) 2、导航到 Editor -> File and Code Templates   3、单击 Includes 4、贴如如下代码:/*** @auth…