pytorch深度学习笔记12

目录

摘要

输出层的反向传播和实现


摘要

本篇文章继续学习尚硅谷深度学习教程,学习内容是输出层的反向传播和代码实现

输出层的反向传播和实现

在输出层,我们一般使用Softmax作为激活函数。

对于Softmax函数:

其偏导数为:

而对于输出层,一般会直接将结果代入损失函数的计算。对于我们之前介绍的分类问题,这里选择交叉熵误差(Cross Entropy Error)作为损失函数,就可以得到一个Softmax-with-Loss层,它包含了Softmax和Cross Entropy Loss两部分。

导数的计算会比较复杂,可以用计算图表示如下:

简化得:

在代码中可以实现为一个类 SoftmaxWithLoss:

class SoftmaxWithLoss: def __init__(self): self.loss = None self.y = None # softmax的输出 self.t = None # 监督数据 def forward(self, x, t): self.t = t self.y = softmax(x) self.loss = cross_entropy_error(self.y, self.t) return self.loss def backward(self, dout=1): batch_size = self.t.shape[0] if self.t.size == self.y.size: # 监督数据是one-hot-vector的情况 dx = (self.y - self.t) / batch_size else: dx = self.y.copy() dx[np.arange(batch_size), self.t] -= 1 dx = dx / batch_size return dx

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1136008.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开发一款APP费用是多少?影响价格的几大核心因素

开发 APP 的费用没有标准答案,核心由功能模块的复杂程度、开发的具体模式、技术栈的选用、开发团队的专业配置等因素决定,整体费用从几万到数百万元不等。下文将依据APP的类型划分,为你呈现对应的费用参考,助力精准把控成本范围&a…

DUT功能验证中的断言使用技巧:实战经验分享

断言实战指南:如何用SVA为DUT验证装上“雷达眼”你有没有遇到过这样的场景?一个复杂的SoC设计在仿真中跑了整整一晚,第二天打开波形一看——数据错乱、协议违规、状态跳转异常……但问题到底出在哪一拍?是驱动没对齐,还…

T触发器时序行为深度剖析:建立与保持时间详解

T触发器时序行为深度剖析:建立与保持时间详解在数字电路的世界里,一个看似简单的“翻转”动作背后,往往藏着极为严苛的时序规则。T触发器(Toggle Flip-Flop)就是这样一个典型例子——它逻辑简洁、应用广泛,…

T触发器时序行为深度剖析:建立与保持时间详解

T触发器时序行为深度剖析:建立与保持时间详解在数字电路的世界里,一个看似简单的“翻转”动作背后,往往藏着极为严苛的时序规则。T触发器(Toggle Flip-Flop)就是这样一个典型例子——它逻辑简洁、应用广泛,…

Elasticsearch资源隔离配置教程

Elasticsearch资源隔离实战:从JVM到索引的全链路稳定性保障 你有没有遇到过这样的场景? 凌晨三点,线上告警突然炸了——搜索接口大面积超时,监控平台图表一片红色。排查发现,并不是核心业务出了问题,而是某…

入驻爱发电

我的爱发电地址:https://afdian.com/a/xiangyu

图解说明:PyTorch推荐系统中的Embedding层设计

深入理解PyTorch中的Embedding层:推荐系统的“向量引擎”如何工作?你有没有想过,当你在抖音刷到一个恰好合口味的视频,或是在淘宝看到“怎么这么懂我”的商品推荐时,背后是谁在默默计算你的“数字画像”?答…

一文搞懂RLHF (基于人类反馈的强化学习)

一、先搞懂:RLHF的核心逻辑与基础概念 在深入步骤前,我们需要先理清几个关键概念,避免被术语绕晕: 1. RLHF的核心目标 简单说,RLHF的目标是让模型的输出“对齐人类意图” ——这里的“对齐”包含三层含义: …

利用udev规则屏蔽工业Linux系统中的未知USB设备(设备描述)

如何用udev规则给工业Linux系统加一道“USB防火墙”?你有没有遇到过这样的场景:一台部署在工厂车间的工控机,平时跑得好好的,结果某天突然宕机、数据异常,排查半天发现是有人插了个U盘拷走了生产日志?更糟的…

三维动态避障路径规划:基于融合DWA的部落竞争与成员合作算法(CTCM)求解无人机三维动态避障路径规划研究,MATLAB代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f34…

OpenAI推出ChatGPT Health医疗问答功能

OpenAI集团今日预览了ChatGPT Health功能,这是一项即将推出的新特性,旨在帮助聊天机器人用户获取医疗信息。ChatGPT Health以ChatGPT界面中的新版块形式出现。据OpenAI介绍,当用户在主聊天框中输入医疗相关问题时,聊天机器人会自动…

AI 赋能学术:paperxie 毕业论文写作功能,让硕士 3 万字论文从选题到成稿更高效

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/aippt https://www.paperxie.cn/ai/dissertationhttps://www.paperxie.cn/ai/dissertation 对于硕士阶段的学术研究者而言,一篇 3 万字的毕业论文,往往需要经历选题、文献梳理、数…

丘成桐数学科学领军人才培养计划毕业后安排和薪资

丘成桐数学科学领军人才培养计划采用“323”八年制本博贯通培养,不设本科毕业环节、不发本科毕业证与学位证,达到博士学位要求后授予数学理学博士学位;未达博士要求但完成前5年培养可申请理学学士学位;前5年不适应可转入数学系本科…

完整回放|上海创智/TileAI/华为/先进编译实验室/AI9Stars深度拆解 AI 编译器技术实践

在持续演进的 AI 编译器技术浪潮中,越来越多的探索正在发生、沉淀与交汇。12 月 27 日,Meet AI Compiler 第八期正是在这样的背景下与大家如期相见。 本期活动,我们邀请了来自上海创智学院、TileAI 社区、华为海思、先进编译实验室、AI9Stars…

新手教程:如何正确驱动无源蜂鸣器发声

为什么你的无源蜂鸣器接上电源却不响?真相在这里你有没有遇到过这样的情况:把无源蜂鸣器往电路板上一焊,通电后却发现——它一声不吭?明明是有源蜂鸣器“滴”一下就响,怎么换成无源的,连个动静都没有&#…

Anthropic寻求3500亿美元估值融资100亿美元

据报道,距离上一轮融资不到两个月,Anthropic PBC正在与投资者洽谈再融资100亿美元。据《华尔街日报》今日消息,Coatue Management和GIC将牵头此轮融资。报道称,这将使Anthropic的融资前估值达到3500亿美元,几乎是9月份…

工业控制场景下QSPI协议通信稳定性深度剖析

工业控制场景下QSPI通信稳定性实战解析:从信号完整性到系统鲁棒性你有没有遇到过这样的问题?一台工业HMI设备,在实验室里跑得好好的,一搬到工厂现场就频繁“启动失败”?日志显示QSPI读取超时,Flash无法识别…

打卡信奥刷题(2666)用C++实现信奥题 P2863 [USACO06JAN] The Cow Prom S

P2863 [USACO06JAN] The Cow Prom S 题目描述 有一个 nnn 个点,mmm 条边的有向图,请求出这个图点数大于 111 的强连通分量个数。 输入格式 第一行为两个整数 nnn 和 mmm。 第二行至 m1m1m1 行,每一行有两个整数 aaa 和 bbb,表示有…

DDOIProxy.dll文件丢失找不到问题 免费下载方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

LeetCode 470 用 Rand7() 实现 Rand10()

文章目录摘要描述题解答案题解代码分析第一步:为什么是 (rand7() - 1) * 7 rand7()第二步:为什么只取 [1,40]第三步:为什么不会死循环示例测试及结果时间复杂度空间复杂度总结摘要 LeetCode 470 这道题乍一看像是“随机数题”,但…