模具机械设备东莞网站建设企业营销型网站

news/2025/9/24 6:25:23/文章来源:
模具机械设备东莞网站建设,企业营销型网站,有做喜糖的网站吗,网页设计网站建设报告子词嵌入 在英语中#xff0c;“helps”“helped”和“helping”等单词都是同一个词“help”的变形形式。“dog”和“dogs”之间的关系与“cat”和“cats”之间的关系相同#xff0c;“boy”和“boyfriend”之间的关系与“girl”和“girlfriend”之间的关系相同。在法语和西…子词嵌入 在英语中“helps”“helped”和“helping”等单词都是同一个词“help”的变形形式。“dog”和“dogs”之间的关系与“cat”和“cats”之间的关系相同“boy”和“boyfriend”之间的关系与“girl”和“girlfriend”之间的关系相同。在法语和西班牙语等其他语言中许多动词有40多种变形形式而在芬兰语中名词最多可能有15种变形。在语言学中形态学研究单词形成和词汇关系。但是word2vec和GloVe都没有对词的内部结构进行探讨。 文章内容来自李沐大神的《动手学深度学习》并加以我的理解感兴趣可以去https://zh-v2.d2l.ai/查看完整书籍 文章目录 子词嵌入fastText模型字节对编码 fastText模型 回想一下词在word2vec中是如何表示的。在跳元模型和连续词袋模型中同一词的不同变形形式直接由不同的向量表示不需要共享参数。为了使用形态信息fastText模型提出了一种子词嵌入方法其中子词是一个字符 n n n-gram (Bojanowski et al., 2017)。fastText可以被认为是子词级跳元模型而非学习词级向量表示其中每个中心词由其子词级向量之和表示。 fastText是一种用于自然语言处理的词向量表示和文本分类的模型。与传统的词向量模型如word2vec不同fastText不仅考虑了单词级别的表示还考虑了子词n-grams级别的表示。这使得fastText能够更好地处理词汇中的复杂性和稀有词。 以下是fastText模型的主要特点和工作原理 子词表示fastText将每个单词表示为其字符级别n-grams的平均值。例如对于单词apple它可以表示为ap、“app”、“ppl”、ple等子词的平均向量。这样做的好处是能够捕捉到词汇的内部结构和形态信息对于处理未登录词out-of-vocabulary和稀有词具有优势。 分层SoftmaxfastText使用了分层Softmax来加速训练过程。传统的词向量模型在训练时需要计算输出层中所有词的概率而分层Softmax将词汇表划分为多个层级每个层级包含一部分词汇。这样可以减少计算量并加快训练速度。 文本分类除了词向量表示fastText还可以用于文本分类任务。它使用了基于词袋bag-of-words模型的方法将文本表示为词向量的加权和并通过softmax函数进行分类预测。 fastText是一个开源项目由Facebook AI Research团队开发。它以其快速训练速度、对稀有词的处理能力和在文本分类任务上的良好表现而受到广泛关注和应用。 让我们来说明如何以单词“where”为例获得fastText中每个中心词的子词。首先在词的开头和末尾添加特殊字符“”和“”以将前缀和后缀与其他子词区分开来。 然后从词中提取字符 n n n-gram。 例如值 n 3 n3 n3时我们将获得长度为3的所有子词 “wh”“whe”“her”“ere”“re”和特殊子词“”。 在fastText中对于任意词 w w w用 C w C_w Cw​表示其长度在3和6之间的所有子词与其特殊子词的并集。词表是所有词的子词的集合。假设 z g z_g zg​是词典中的子词 g g g的向量则跳元模型中作为中心词的词 w w w的向量 v w v_w vw​是其子词向量的和 v w ∑ g ∈ C w z g v_w\sum_{g\in C_w}z_g vw​g∈Cw​∑​zg​ fastText的其余部分与跳元模型相同。与跳元模型相比fastText的词量更大模型参数也更多。此外为了计算一个词的表示它的所有子词向量都必须求和这导致了更高的计算复杂度。然而由于具有相似结构的词之间共享来自子词的参数罕见词甚至词表外的词在fastText中可能获得更好的向量表示。 字节对编码 在fastText中所有提取的子词都必须是指定的长度例如 3 3 3到 6 6 6因此词表大小不能预定义。为了在固定大小的词表中允许可变长度的子词我们可以应用一种称为字节对编码Byte Pair EncodingBPE的压缩算法来提取子词 (Sennrich et al., 2015)。 字节对编码执行训练数据集的统计分析以发现单词内的公共符号诸如任意长度的连续字符。从长度为1的符号开始字节对编码迭代地合并最频繁的连续符号对以产生新的更长的符号。请注意为提高效率不考虑跨越单词边界的对。最后我们可以使用像子词这样的符号来切分单词。字节对编码及其变体已经用于诸如GPT-2 (Radford et al., 2019)和RoBERTa (Liu et al., 2019)等自然语言处理预训练模型中的输入表示。在下面我们将说明字节对编码是如何工作的。 首先我们将符号词表初始化为所有英文小写字符、特殊的词尾符号’_‘和特殊的未知符号’[UNK]。 import collectionssymbols [a, b, c, d, e, f, g, h, i, j, k, l, m,n, o, p, q, r, s, t, u, v, w, x, y, z,_, [UNK]]因为我们不考虑跨越词边界的符号对所以我们只需要一个字典raw_token_freqs将词映射到数据集中的频率出现次数。注意特殊符号’_被附加到每个词的尾部以便我们可以容易地从输出符号序列例如“a_all er_man”恢复单词序列例如“a_all er_man”。由于我们仅从单个字符和特殊符号的词开始合并处理所以在每个词词典token_freqs的键内的每对连续字符之间插入空格。换句话说空格是词中符号之间的分隔符。 raw_token_freqs {fast_: 4, faster_: 3, tall_: 5, taller_: 4} token_freqs {} for token, freq in raw_token_freqs.items():token_freqs[ .join(list(token))] raw_token_freqs[token] token_freqs我们定义以下get_max_freq_pair函数其返回词内最频繁的连续符号对其中词来自输入词典token_freqs的键。 def get_max_freq_pair(token_freqs):pairs collections.defaultdict(int)for token, freq in token_freqs.items():symbols token.split()for i in range(len(symbols) - 1):# “pairs”的键是两个连续符号的元组pairs[symbols[i], symbols[i 1]] freqreturn max(pairs, keypairs.get) # 具有最大值的“pairs”键作为基于连续符号频率的贪心方法字节对编码将使用以下merge_symbols函数来合并最频繁的连续符号对以产生新符号。 def merge_symbols(max_freq_pair, token_freqs, symbols):symbols.append(.join(max_freq_pair))new_token_freqs dict()for token, freq in token_freqs.items():new_token token.replace( .join(max_freq_pair),.join(max_freq_pair))new_token_freqs[new_token] token_freqs[token]return new_token_freqs解释一下new_token token.replace(’ ‘.join(max_freq_pair),’.join(max_freq_pair)) max_freq_pair 是一个元组表示最高频率的一对符号。例如假设 max_freq_pair (a, b)。 .join(max_freq_pair) 将最高频率符号对中的两个符号用空格连接起来生成一个字符串。对于上述示例结果将是 a b。 .join(max_freq_pair) 将最高频率符号对中的两个符号直接连接起来生成一个新的合并后的符号。对于上述示例结果将是 ab。 token.replace( .join(max_freq_pair), .join(max_freq_pair)) 则使用生成的字符串和新的合并后的符号对标记进行替换操作。它将标记中所有出现的最高频率符号对 a b 替换为合并后的符号 ab得到新的合并标记。 现在我们对词典token_freqs的键迭代地执行字节对编码算法。在第一次迭代中最频繁的连续符号对是’t’和’a’因此字节对编码将它们合并以产生新符号’ta’。在第二次迭代中字节对编码继续合并’ta’和’l’以产生另一个新符号’tal’。 num_merges 10 for i in range(num_merges):max_freq_pair get_max_freq_pair(token_freqs)token_freqs merge_symbols(max_freq_pair, token_freqs, symbols)print(f合并# {i1}:,max_freq_pair)在字节对编码的10次迭代之后我们可以看到列表symbols现在又包含10个从其他符号迭代合并而来的符号。 print(symbols)[a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z, _, [UNK], ta, tal, tall, fa, fas, fast, er, er_, tall_, fast_] 对于在词典raw_token_freqs的键中指定的同一数据集作为字节对编码算法的结果数据集中的每个词现在被子词“fast_”“fast”“er_”“tall_”和“tall”分割。例如单词“faster_”和“taller_”分别被分割为“fast er_”和“tall er_”。 print(list(token_freqs.keys()))请注意字节对编码的结果取决于正在使用的数据集。我们还可以使用从一个数据集学习的子词来切分另一个数据集的单词。作为一种贪心方法下面的segment_BPE函数尝试将单词从输入参数symbols分成可能最长的子词。 def segment_BPE(tokens, symbols):outputs []for token in tokens:start, end 0, len(token)cur_output []# 具有符号中可能最长子字的词元段while start len(token) and start end:if token[start: end] in symbols:cur_output.append(token[start: end])start endend len(token)else:end - 1if start len(token):cur_output.append([UNK])outputs.append( .join(cur_output))return outputs函数接受两个参数tokens 和 symbols。 tokens 是待分割的标记列表。symbols 是用于分割标记的符号列表。 函数创建一个空列表 outputs 用于存储分割后的结果。 对于每个标记 token进行以下操作 初始化两个变量 start 和 end 为 0 和标记的长度。 创建一个空列表 cur_output 用于存储当前标记的分割结果。 在一个循环中尝试从标记的起始位置开始找到最长的子字使其在符号列表 symbols 中存在。 如果从 start 到 end 的子字在 symbols 中存在则将该子字添加到 cur_output 中并更新 start 为 end将 end 重置为标记的长度。 如果子字不在 symbols 中则将 end 减小 1继续尝试找到更短的子字。 如果 start 小于标记的长度说明有未被分割的部分将其视为未知符号 [UNK]并将其添加到 cur_output 中。 将 cur_output 使用空格连接为一个字符串并将其添加到 outputs 列表中。 循环结束后返回 outputs 列表其中包含了对每个标记进行分割后的结果。 我们使用列表symbols中的子词从前面提到的数据集学习来表示另一个数据集的tokens。 tokens [tallest_, fatter_] print(segment_BPE(tokens, symbols))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/915071.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

佛山网站建设工作网站在建设中页面

一、无人机巡检的优势 1. 高效性 覆盖范围广:可快速扫描大范围区域(如电力线路、管道、农田等),尤其适合复杂地形(山区、沼泽等)。 速度快:飞行速度远高于人工巡检,缩短任务周期…

前端网站论文开个跨境电商要多少钱

Hadoop的演进从Hadoop 1到Hadoop 3主要是为了提供更高的效率、更好的资源管理、更高的可靠性以及对更多数据处理方式的支持。下面是Hadoop 1, Hadoop 2, 和 Hadoop 3之间的主要区别和演进的原因: Hadoop 1 特点: 主要包括两大核心组件:HDFS&a…

自贡 网站建设杭州旅游网站建设

文章目录 GPIO权限问题使用Root权限运行应用程序更改GPIO文件的权限使用udev规则自动设置权限监视GPIO与读写GPIO注意事项GPIO权限问题 在Linux系统中,通过sysfs接口操作GPIO时,经常会遇到权限问题,因为默认情况下,访问/sys/class/gpio目录及其文件需要root权限。这可能会…

企业网站建设cms站wordpress滑动切换

概念: 备忘录模式(Memento Pattern)是一种行为型设计模式,它允许在不暴露对象内部状态的情况下捕获和恢复对象之前的状态。该模式通过将对象的状态封装到备忘录中,并将其保存在一个管理者类中,从而实现了对…

南部网站建设和目网站

缓存数据一致性探究 缓存是一种较低成本提升系统性能的方式,自它面世第一天起就备受广大开发者的喜爱。然而正如《人月神话》中的那句经典的“没有银弹”中所说,软件工程的设计没有银弹。 就像每一次发布上线修复问题的同时,也极易引入新的问…

关于申请建设网站的请示有哪些网站软件可以做网站的原型

无刷电机控制 特点: 线圈不动,磁极转动电子换向方式消除了有刷电机的缺点单位质量/功率转矩大驱动较复杂

阜阳学网站建设网站备份 ftp

目录 一.HTML 二.CSS 1.CSS作用:美化页面 2.CSS语法 【1】CSS语法规范 【2】如何插入样式表 3.CSS选择器 4.CSS设置样式属性--设置html各种标签的属性 【1】文本属性--设置整段文字的样式 【2】字体属性--设置单个字的样式 【3】链接属性--设置链接的样式…

高端网站定制方案企业网站托管服务公司

1、问题描述 给定一个字符串(序列),求该序列的最长的回文子序列。 2、分析 需要理解的几个概念: ---回文 ---子序列 ---子串 http://www.cnblogs.com/LCCRNblog/p/4321398.html这一篇文章描述了利用动态规划求解两个序列的最长公共…

个人如何建立免费网站wordpress php mysql

uniapp小程序实现更新操作提示用户升级 引言获取小程序版本是否需要更新以及更新操作1.App.vue文件中实现获取更新方法2.在App.vue的 onShow 里面运行3.App.vue中使用到的提示框封装方法引言 小程序更新时,为了防止小程序由于热启动或者需要在登录时候添加新的缓存,无法获取…

开网站建设怎样做网站建设的程序

1.参考文章 【总结】CentoS下Oracle静默安装流程_正在启动oracle universal installer..._仲冬二三的博客-CSDN博客 https://blog.csdn.net/Liqiong_0412/article/details/126153857? unset DISPLAY 可以跳过图形化检查 这边也卡了很久 [oraclewangmengyuan database]$ .…

做公众号主页面的有哪些网站房地产网站开发公司

Apache Spark是一个强大的分布式计算框架,用于处理大规模数据。在Spark中,数据加载与保存是数据处理流程的关键步骤之一。本文将深入探讨Spark中数据加载与保存的基本概念和常见操作,包括加载不同数据源、保存数据到不同格式以及性能优化等方…

站长平台seo哪些网站是同字形网页

STL常见容器目录: 8.map/ multimap容器8.1 map基本概念8.2 map构造和赋值8.3 map大小和交换8.4 map插入和删除8.5 map查找和统计8.6 map容器排序8.6.1 内置类型排序8.6.2 自定义类型排序8.6.3 自定义和内置类型混合排序 8.map/ multimap容器 两者基本一致&#xff…

花钱做网站要多少钱企业网d1net的安全防护

MP4文件格式,全称MPEG-4 Part 14,源自MPEG(Moving Picture Experts Group)对数字媒体压缩标准的不断迭代。其产生背景主要是为了适应数字娱乐时代对更高质量、更高效压缩的需求。MP4文件格式在视频、音频和字幕等多媒体元素的集成…

jsp网站开发详细教程python创建网站

装win7的时候,我们使用U盘装系统,找不到硬盘, 或者使用光盘装系统时 会出现 缺少所需的CD/DVD驱动器设备驱动程序 然后找遍整个硬盘/光盘也找不到合适的驱动,安装无法继续。 解决方法: ACHI模式下,PE里…

做网站要写代码吗大连网站建设流程图

文章目录 项目场景:问题描述原因分析:解决方案:解决方案1解决方案2:解决方案3:此Bug解决方案总结解决方案总结**心得体会:解决连接超时问题的三种方案**项目场景: 导入Sample时遇到导入失败的情况,并提示“Failed to connect to gitee.com port 443: Time out”连接超…

设计外贸网站网站建设丨金手指谷哥14

为什么80%的码农都做不了架构师?>>> 参考文章: 使用AspectJ在Android中实现Aop 深入理解Android之AOP自动打印日志主要知识点: 主要是JPoint、pointcuts、advice以及他们之间的关系可以通过aj文件、或AspectJ注解的Java文件实现A…

安微建设厅网站手机网站模板psd

文章目录 前言一、安装环境二、使用方法总结 前言 香橙派树莓派鲁班猫安装一下调试代码还是比较方便的。 一、安装环境 假设已经安装好了miniconda3。如果还没安装可以参考我另外一篇博文,有写怎么安装。 pip install jupyter notebook # 生成Jupyter Notebook的…

国外设计类网站网站建设一般报价

Shell中可以采用while循环来实现需要进行循环的操作。 语法结构如下: while exp do command done 执行过程:while将测试exp的返回值,如果返回值为true则执行循环体的命令,返回值为false则不执行循环。循环完成后会进入下一次循环之…

企业网站推广的重要性网页制作服务的公司

本文部分内容来自网络整理,本司不为其真实性负责,如有异议或侵权请及时联系,本司将立即删除!本文为word格式,下载后可方便编辑和修改!web前端的自我介绍篇一:个人总结的web前端面试题1、自我介绍…

企业网站运维网站设计素材模板

一、结构public abstract class Filter extends Objectjava.lang.Objectandroid.widget.Filter二、概述过滤器通过过滤模式来约束数据,通常由实现了Filterable接口的子类来生成。 过滤操作是通过调用filter(CharSequence)或者filter(CharSequence, android.widget.F…