湖北省两学一做网站方象科技的企业愿景

news/2025/10/8 5:37:11/文章来源:
湖北省两学一做网站,方象科技的企业愿景,企业网站优化技巧,wordpress 注册 中文前置知识#xff1a;RNN#xff0c;LSTM/GRU 提出背景 Attention模型是基于Encoder-Decoder框架提出的。Encoder-Decoder框架#xff0c;也就是编码-解码框架#xff0c;主要被用来处理序列-序列问题。 Encoder#xff1a;编码器#xff0c;将输入的序列x1,x2,x3……前置知识RNNLSTM/GRU 提出背景 Attention模型是基于Encoder-Decoder框架提出的。Encoder-Decoder框架也就是编码-解码框架主要被用来处理序列-序列问题。 Encoder编码器将输入的序列x1,x2,x3…xn编码使其转化为一个语义编码C这个C中就储存了序列x1,x2,x3…xn的信息。 Decoder解码器根据输入的语义编码C然后将其解码成序列数据 编码方式有很多种在文本处理领域主要有RNN、LSTM、GRU、BiRNN、BiLSTM、BiGRU等。解码方式主要有两种 [论文1]Cho et al., 2014 . Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. [论文2]Sutskever et al., 2014. Sequence to Sequence Learning with Neural Networks. 论文1中指出因为语义编码C包含了整个输入序列的信息所以在解码的每一步都引入C。文中Ecoder-Decoder均是使用RNN在计算每一时刻的输出yt时都应该输入语义编码C即htf(ht-1,yt-1,C)p(yt)f(ht,yt−1,C)。 问题在于语义编码C是由输入序列X的每个单词经过Encoder 编码产生的这意味着不论是生成哪个单词y1,y2还是y3其实输入序列X中任意单词对生成某个目标单词yi来说影响力都是相同的其实如果Encoder是RNN的话理论上越是后输入的单词影响越大并非等权 论文2中的方式相对简单只在Decoder的初始输入引入语义编码C将语义编码C作为隐藏层状态值h0的初始值p(yt)f(ht,yt−1)。 问题在于将整个序列的信息压缩在了一个语义编码C中用一个语义编码C来记录整个序列的信息如果序列是长序列那么只用一个语义编码C来表示整个序列的信息肯定会产生大量损失且容易出现梯度消失的问题。 Attention原理 当一个语义编码C无法有效解决问题时就尝试引入多个C。对于不同的预测Yi注意力会集中在不同的C上即由固定的中间语义C换成了根据当前输出单词来调整为加入注意力模型变化的Ci。 Yi是Decoder的当前输出单词Ci是Decoder的当前注意力向量。Ci是根据Decoder的上一时刻的输出单词Yi-1和隐藏层Si-1计算出来的它表示了Decoder对Encoder的输入序列的不同部分的关注程度。 在下文中H和S都表示RNN隐藏层的值H表示Encoder的第i个隐藏层的值S表示Decoder的第i个隐藏层的值。 Yi是根据Ci和Si-1生成的它表示了Decoder根据注意力向量选择合适的输入单词进行翻译的结果。 Si是根据Decoder的第i-1个隐藏层的值Si-1和第i-1个输出单词Yi-1计算出来的。具体的计算方法取决于Decoder使用的RNN的类型比如LSTM或GRU。 为了体现出输入序列中不同单词对当前预测的影响程度不同对于每一个预测输出YiAttention模型中都会给出一个概率分布 其中f(xj)即为对应隐藏层的值hj用αi[αi1,αi2,…,αin]表示注意力分配概率向量即αijpj使得 在Attention机制中Decoder的每个隐藏层Si都会与Encoder的所有隐藏层Hi进行相关性计算得到一个注意力分配概率分布αi。然后根据这个概率分布对Encoder的隐藏层H进行加权求和得到一个注意力向量Ci。这个向量就是Decoder的当前输出Yi所关注的Encoder的输入序列的语义表示。 求得语义编码Ci的关键在于计算Attention模型所需要的输入句子的单词注意力分配概率值即α。 Decoder上一时刻的输出值Yi-1与上一时刻传入的隐藏层的值Si-1通过RNN生成Si然后计算Hi与h1h2h3…hm的相关性得到相关性评分[f1,f2,f3…fm]然后对fj使用softmax激活就得到注意力分配αij。 此处使用的是Soft Attention所有的数据都会注意并计算出相应的注意力权值不会设置筛选条件。 还有一种Hard Attention会在生成注意力权重后筛选掉一部分不符合条件的注意力让它的注意力权值为0。 Attention机制本质思想 事实上Attention机制并非一定基于Encoder-Decoder框架。 将Source中的构成元素想象成是由一系列的Key,Value数据对构成此时给定Target中的某个元素Query通过计算Query和各个Key的相似性或者相关性得到每个Key对应Value的权重系数再加权求和即可得最终的Attention Value。 Lx表示source的长度ρ(q,ki)的计算如下 内积 Cosine相似性 MLP网络 内积Transformer使用的方法 Cosine相似性-余弦相似度分子为点积分母为向量的L2范数各元素平方和的平方根 MLP网络不常用 在得到相关性ρ之后引入激活函数如softmax对相关性归一化即将原始计算分值整理成所有元素权重之和为1的概率分布同时利用激活函数的内在机制突出重要元素的权重。 Attention机制总结 相关性分析 归一化 加权求和 缺点 只能在Decoder阶段实现并行运算Encoder部分依旧采用的是RNN、LSTM等顺序编码的模型Encoder部分依然无法实现并行运算。 Encoder部分目前仍旧依赖于RNN对于长距离的两个词相互之间的关系没有办法很好的获取。 改进Self-Attention 在一般任务的Encoder-Decoder框架中输入Source和输出Target内容是不一样的比如对于英-中机器翻译来说Source是英文句子Target是对应的翻译出的中文句子Attention机制发生在Target的元素和Source中的所有元素之间。 Self-Attention是在Source内部元素或者Target内部元素之间发生的Attention机制也可以理解为TargetSource这种特殊情况下的注意力计算机制相当于是QueryKeyValue计算过程与Attention一样。 引入Self-Attention后会更容易捕获句子中长距离的相互依赖的特征Self-Attention在计算过程中会直接将句子中任意两个单词的联系通过一个计算步骤直接联系起来所以远距离依赖特征之间的距离被极大缩短有利于有效地利用这些特征。除此外Self Attention对于增加计算的并行性也有直接帮助作用。正好弥补了attention机制的两个缺点这就是为何Self Attention逐渐被广泛使用的主要原因。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/931116.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

潍坊市建设监理协会网站电子商务网站建设与管理 教案

1、了解事务吗,MySQL中事务的隔离级别有哪些? 读未提交:一个事务还没提交时,它做的变更就能被别的事务看到。读已提交:一个事务提交之后,它做的变更才能被其他事务看到。可重复读:一个事务执行过…

在建设银行网站能换美元吗株洲营销型网站建设

本篇文章,笔者将详细介绍食堂采购系统从需求分析到上线实施的完整过程,旨在为开发团队和管理者提供一个系统化的指南。 一、需求分析 1.用户需求 常见的需求包括: -采购计划管理 -供应商管理 -库存管理 -成本控制 -报表生成 2.系统功…

最好的网站模板下载网站微信上的小店微商城怎么开通

应群里同学要求,总结一下我自己的复习经历,希望对大家有所借鉴,报考国防科技大学,专业课831信号与系统140,总分410,大家以前一直认为国防科技大学时军校,从而很少关注这所军中清华,现…

网站开发是前端还是后端自己做的网站怎么发布上

近年来,区块链技术作为金融科技的中坚力量,受到了产业界的热切关注,其实验开展和应用研发正在如火如荼的进行。 在此背景下,各地涌现出一大批优秀的企业投入到区块链产业中,各类企业投融 资活动十分活跃,充…

图文网站源码北京营销策划有限公司

插入排序 1. 算法思想: 由数组下标为1 开始的数值作为判断依据,与之前的数据从后往前比较定义tmp 暂存判断的数值,若前面的数据大于tmp,则将前面的数据向后移动 : arr[j1]arr[j]若对比的数据比tmp 大,则往后移&#…

网站开发员岗位职责2017国办网站建设规范

/* 关于基本数据之间的互相转换&#xff1a;转换规则 1、八种基本数据类型中**除布尔类型之外**剩下的7种类型之间都可以互相转换2、小容量向大容量转换&#xff0c;称为自动类型转换&#xff0c;容量从小到大排序如下&#xff1a;-byte<short<int<long <float<…

wap网站cms恋月wordpress

开源鸿蒙轻量系统源码分析 作者将狼才鲸日期2024-03-28 一、前言 之前单独的LiteOS是通过Makefile编译的&#xff0c;当前的开源鸿蒙LiteOS-M和LiteOS-A是通过gn和ninja编译的。 Gitee官方只介绍了LiteOS-M的gn ninja编译的流程&#xff0c;针对M3使用Keil编译的流程可能要参…

网站建设项目单子来源网页设计与制作教程psd格式

minio客户端基本操作 桶 创建桶 如果要创建新的桶 输入名称&#xff0c;点击创建即可&#xff0c;默认权限就行 删除桶 点击要删除的桶 点击删除 修改桶 如果哪天需要修改桶的权限或者其他信息&#xff0c;还是先点击这个桶进入详情 然后点击要修改的属性&#xff0c;选择…

品牌网站建设价格天天快递qq代挂主站网站建设

对象池是一种设计模式&#xff0c;用于管理和重用对象&#xff0c;以提高性能和资源利用率。对象池的概念在许多应用程序中都有广泛应用&#xff0c;特别是在需要频繁创建和销毁对象的情况下&#xff0c;例如数据库连接、线程、HTTP连接等 对象池通过预先创建一组对象并将它们存…

wap建站模板网站qq访客 原理

与Cookie不同&#xff0c;会话数据存储在服务器上。会话是客户端登录到服务器并注销的时间间隔。需要在此会话中进行的数据存储在服务器上的临时目录中。 与每个客户端的会话分配一个会话ID。会话数据存储在cookie顶部&#xff0c;服务器以加密方式签名。对于这种加密&#xf…

电子商务网站建设是学什么酒泉地网站推广

rk3568 适配以太网——RTL8211 千兆以太网(Gigabit Ethernet)的传输速度为1 Gbps(千兆位每秒),而百兆以太网(Fast Ethernet)的传输速度为100 Mbps(百兆位每秒)。因此,在相同的网络条件下,千兆网可以提供更高的数据传输速率,比百兆网快10倍。千兆网的更高传输速度使…

有一个专门做演讲的网站会讯通2022官方下载

1.备份和还原vSphere Distributed Switch配置 1.1导出 vSphere Distributed Switch 配置 可以将 vSphere Distributed Switch 和分布式端口组配置导出到某一文件。该文件保留有效的网络配置&#xff0c;使这些配置能够传输至其他环境。 步骤&#xff1a; 1) 在 vSphere Web Cli…

佛山网站建设公司88电子商务网站建设运营

文章目录 一、简介二、基本概念三、装饰模式的结构和实现类图解析&#xff1a;装饰器的实现方式继承实现&#xff1a;组合实现&#xff1a;继承和组合对比 四、装饰模式的应用场景五、与其他模式的关系六、总结 一、简介 装饰模式是一种结构型设计模式&#xff0c;它允许动态地…

用dw做的网站怎么上线iis7部署网站

声明&#xff1a;以下这函数&#xff0c;使用场景再lambda表达式中使用 std::weak_ptr<websockets_session> weak_self() { return std::weak_ptr<websockets_session>(shared_from_this()); }

网站开发培训深圳网站设计包括哪些内容

背景 性能诊断是软件工程师在日常工作中需要经常面对和解决的问题&#xff0c;在用户体验至上的今天&#xff0c;解决好应用的性能问题能带来非常大的收益。Java 作为最流行的编程语言之一&#xff0c;其应用性能诊断一直受到业界广泛关注。可能造成 Java 应用出现性能问题的因…

北京移动端网站设计二建证书查询官网入口

编写equals()和hashCode()方法需要遵循以下原则&#xff1a; 1. equals()方法&#xff1a; - 使用instanceof关键字检查传入的对象是否为当前类的实例。 - 检查传入的对象是否为null。 - 检查传入的对象的类型是否与当前对象的类型相同。 - 比较对象的属性是否相等&#x…

电子商务网站建设 项目规划书网站优化种类

目录 一.虚拟机准备 二.基础环境配置&#xff08;各个节点都做&#xff09; 1.IP和hosts解析 2.防火墙和selinux 3.安装基本软件 4.配置时间同步 5.禁用swap分区 6.修改内核参数并重载 7.配置ipvs 三.docker环境&#xff08;各个节点都做&#xff09; 1.配置软件源并…

做资源网站怎么不封网架加工制造厂家

问题陈述&#xff1a; Fibonacci为1200年代的欧洲数学家&#xff0c;在他的著作中曾经提到&#xff1a;若有一只兔子每个月生一只小兔子&#xff0c;一个月后小兔子也开始生产。起始只有一只兔子&#xff0c;一个月后就有两只兔子&#xff0c;二个月后有三只兔子&#xff0c;三…

个人简介网站html代码深圳社保个人网页

三种情形&#xff1a; 1.执行SP时出错&#xff0c;如连接异常&#xff0c;数据库权限异常 2.SP代码中抛出异常 3.返回值/输出参数的值不符合约定 后两种情形需要在异常发生时记录传入SP的参数值&#xff1b;业务逻辑层需要捕获并重抛&#xff0c;以保证UI层提供给用户友好的错误…

网站建设与管理专业实训室辽宁建设工程信息网招标公呿

1、用定积分奇函数和偶函数的性质 2、用常用的基本不等式推出大小 3、用区间相同的情况下被积函数大的定积分大的定理