深入解析:人工智能学习:什么是LSTM模型

news/2025/9/20 10:20:15/文章来源:https://www.cnblogs.com/yfceshi/p/19102054

一、LSTM介绍

LSTM(Long Short-Term Memory)也称为长短期记忆网络,是一种改进的循环神经网络(RNN),专门设计用于解决传统RNN的梯度消失问题长程依赖困难。LSTM通过引入门机制细胞状态,能够更好地捕捉长序列数据中的长期依赖关系。

它的核心思想是凭借引入门机制(输入门、遗忘门、输出门)和细胞状态(Cell State)来控制信息的流动,从而决定哪些信息得保留、哪些信息需要丢弃。

1、内部结构

1749048674326

遗忘门:决定了哪些信息应该被丢弃(即遗忘)。它读取当前输入和前一时刻的隐藏状态,之后输出一个0到1之间的数值,表示当前时刻的信息应当保留或丢弃的比例。

输入门:决定了哪些信息得被存储到当前的单元状态中。通过这个门来更新单元状态的记忆。

细胞状态:可以将其视为一条贯穿整个网络的”传送带”,携带长期记忆;信息通过细胞状态传递,并由各个门控机制选择性地修改。

输出门:控制从单元状态到隐藏状态的信息流出,决定当前的隐藏状态输出多少细胞状态的内容。

① 细胞状态(Cell State)

  • 作用:细胞状态Ct是LSTM核心,用于存储长期信息
  • 特点
    • 细胞状态在整个时间步中传递,只有少量的线性交互
    • 通过门机制更新细胞状态

② 遗忘门(Forget Gate)

  • 作用:决定哪些信息从细胞状态中丢弃

  • 公式

    ft=σ(Wf⋅[ht−1,xt]+bf)​

    • ft:遗忘门的输出(0表示完全丢弃,1表示完全保留)
    • Wf,bf:权重矩阵和偏置项
    • σ​:Sigmoid​激活函数

③ 输入门(Input Gate)

  • 作用:决定哪些新信息存储到细胞状态中

  • 公式

    it=σ(Wi⋅[ht−1,xt]+bi)

    • it:输入门的输出(0 到 1 之间的值)
    • Wi,bi:权重矩阵和偏置项
    • σ:Sigmoid激活函数

④ 候选细胞状态(Candidate Cell State)

  • 作用:生成新的候选值,用于更新细胞状态

  • 公式

    C~t=tanh⁡(WC⋅[ht−1,xt]+bC)

    • C~t:候选细胞状态
    • WC,bC:权重矩阵和偏置项
    • tanh⁡:双曲正切激活函数

⑤ 更新细胞状态

  • 作用:细胞状态 Ct 是LSTM的记忆,结合遗忘门和输入门,更新细胞状态

  • 公式

    Ct=ft⋅Ct−1+it⋅C~t

    • Ct:更新后的细胞状态
    • 遗忘门ft: 决定了上一时刻的细胞状态 Ct−1 中保留多少信息
    • 输入门it: 决定了当前时刻输入 xt 中有多少新信息被添加到细胞状态中

⑥ 输出门(Output Gate)

  • 作用:决定细胞状态的哪些部分输出到隐藏状态

  • 公式

    ot=σ(Wo⋅[ht−1,xt]+bo)

    • ot:输出门的输出(0 到 1 之间的值)
    • Wo,bo:权重矩阵和偏置项
    • σ:Sigmoid激活函数

⑦ 隐藏状态(Hidden State)

  • 作用:作为LSTM的输出,传递到下一个时间步

  • 公式

    ht=ot⋅tanh⁡(Ct)

    • ht:当前时间步的隐藏状态
    • Ct:是当前时刻的细胞状态

二、LSTM的内部结构图

  • 结构解释图:

    1737642357744

    1737642365890

1、遗忘门

  • 遗忘门部分结构图与计算公式:

  • 遗忘门结构分析:

    与传统RNN的内部结构计算极其相似,第一将当前时间步输入xt与上一个时间步隐藏状态ht−1拼接,得到[xt,ht−1],然后通过一个全连接层做变换,最后通过sigmoid函数进行激活得到ft。我们可以将ft看作是门值,好比一扇门开合的大小程度,门值都将作用在借助

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/908253.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

直播软件搭建,如何实现伪分布式平台部署? - 云豹科技

直播软件搭建,如何实现伪分布式平台部署?大数据平台搭建合集–伪分布式平台部署0.更改主机名并配置hosts映射# 更改主机名 hostnamectl set-hostname master # 配置hosts映射 vi /etc/hosts [填当前机器真是ip] mast…

初步研究vivio的互传的备份数据格式

初步研究vivio的互传的备份数据格式一般来说最大的那个文件是apk, 下面是我的分析,先进入db文件夹,找到000003.log 形如下图的就是apk文件。重命名加上.apk就能单独提取,文件名是hash函数计算过的。 形如下图的就是…

完整教程:C#.NetCore NPOI 导出excel 单元格内容换行

完整教程:C#.NetCore NPOI 导出excel 单元格内容换行pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas&qu…

resultMap和resultType

resultMap 和 resultType好的,这是一个非常核心的MyBatis面试题和日常开发中的关键知识点。resultMap 和 resultType 都用于指定SQL查询结果的返回类型,但它们的用法和能力有本质区别。 下面我用一个清晰的对比和示例…

RabbitMQ 幂等性, 顺序性 和 消息积压 - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

直播软件怎么开发,自适应两栏布局方式 - 云豹科技

直播软件怎么开发,自适应两栏布局方式html结构<body><div class="wrapper"><div class="left"></div><div class="right"></div></div><…

基于SpringBoot的足球论坛系统+论文示例参考 - 指南

基于SpringBoot的足球论坛系统+论文示例参考 - 指南2025-09-20 10:01 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; disp…

resultMap和自定义映射结果形式(ResultMapManage)以及ResultMap Vs ResultType

resultMap和自定义映射结果形式(ResultMapManage)以及ResultMap Vs ResultType<resultMap id="ResultMapManage" type="com.javapandeng.po.Manage"><result property="id" …

嵌入式设备不能正常上网问题

问题描述 设置静态IP和默认网关,设备无法上网。尝试ping baidu.com 也无法ping通 解决方案 1.默认网关IP设置错了 默认网关IP = 路由器IP 当设备在当前的链路中找不到baidu的IP时,会把IP传输到路由器,路由器通过查找…

2、论文固定模板(背景过度结尾)

1、论文字数分配2、以上仅供参考,如有疑问,留言联系

go: 图片文件上传

一,代码 go //上传页面 func (ic *MediaController) Upload(c *gin.Context) {c.HTML(200, "upload.html", nil) }//接收上传,多张图片 func (ic *MediaController) Uploaded(c *gin.Context) {//得到form…

go: 生成缩略图

一,安装第三方库 $ go get -u github.com/disintegration/imaging go: downloading golang.org/x/image v0.0.0-20191009234506-e7c1f5e7dbb8 go: downloading golang.org/x/image v0.31.0 go: added github.com/disi…

git: 报错: fatal: 协议错误:错误的行长度字符串:This 或 fatal: protocol error: bad line length character: This

一,报错信息: fatal: 协议错误:错误的行长度字符串:This 或 fatal: protocol error: bad line length character: This 二,出现的原因: 我修改了git项目的remote地址,是因为gitolite服务换了一台服务器,报错的原…

jquery: Justified gallery

一,官网 官网: https://miromannino.github.io/Justified-Gallery/ github: https://github.com/miromannino/Justified-Gallery二,使用 引入: <link rel="stylesheet" href="/static/justified/j…

安装crmeb

一,官网: https://www.crmeb.com/xiazai 代码站: https://gitee.com/ZhongBangKeJi/CRMEB 安装参考文档地址: https://doc.crmeb.com/single_open/open_v54/20389 二,下载 用git命令下载 $ git clone https://gitee.…

gin: 打包模板文件、静态文件到二进制文件中

一,默认html模板不会打包到二进制文件中 如果二进制文件的当前目录下不包含html模板文件路径,会报错如下 $ ./mediabank [GIN-debug] [WARNING] Creating an Engine instance with the Logger and Recovery middlew…

gin: 判断是否ajax请求

一,代码 controller: //得到用户信息 func (ic *MediaController) User(c *gin.Context) {if c.Request.Header.Get("X-Requested-With") == "XMLHttpRequest" {c.JSON(http.StatusOK, gin.H{&qu…

gin: 静态文件

一,下载jquery 官网: https://jquery.com/ 从命令行下载: $ wget https://code.jquery.com/jquery-3.7.1.min.js 二,代码: 目录结构routes package routesimport ("github.com/gin-gonic/gin""mediab…

详细介绍:【论文精读】基于YOLOv3算法的高速公路火灾检测

详细介绍:【论文精读】基于YOLOv3算法的高速公路火灾检测pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consola…

产品设计

产品设计2025-09-20 在设计tab时,如果数据没有加载出来,要么不切tab高亮,如果想切tab高亮,就先显示空白(因为还没拿到数据),或者旧的数据(依据产品性质)。 为了避免因为网络卡,或者没卡,没找到数据时,tab切…