南昌建设工程质量监督网站出入库管理软件 免费

pingmian/2025/10/9 8:54:24/文章来源:
南昌建设工程质量监督网站,出入库管理软件 免费,贵州城乡和住房建设厅网站,汕头网站建设转载公众号 | DataFunSummit分享嘉宾#xff1a;周晓欢 阿里巴巴 算法专家编辑整理#xff1a;刘香妍 中南财经政法大学出品平台#xff1a;DataFunSummit导读#xff1a;实体抽取或者说命名实体识别 ( NER ) 在信息抽取中扮演着重要角色#xff0c;常见的实体抽取多是对文… 转载公众号 | DataFunSummit分享嘉宾周晓欢 阿里巴巴 算法专家编辑整理刘香妍 中南财经政法大学出品平台DataFunSummit导读实体抽取或者说命名实体识别 ( NER ) 在信息抽取中扮演着重要角色常见的实体抽取多是对文本进行子信息元素的抽取但对语音的实体抽取当前应用也比较广泛。今天很高兴邀请到来自阿里巴巴天猫精灵事业部人工智能部的周晓欢来和大家分享天猫精灵在娱乐播放助手中关于实体抽取的一些创新与实践。本次分享的主题为天猫精灵在实体抽取中的创新与实践主要内容包括① 天猫精灵业务背景介绍② 端到端的语义理解模型③ 基于内容库的端到端的实体抽取模型Speech2Slot④ 无监督语音语义预训练。01天猫精灵业务背景首先和大家分享下天猫精灵内容点播的业务背景。1. 业务背景介绍天猫精灵它作为一个智能音箱内容点播是它最重要的功能之一。当一个用户他有具体的点播意图的时候比如说他说天猫精灵我想听刘德华的忘情水。这个时候就会进入内容点播场景。2. 传统语音点播链路与问题天猫精灵的内容点播场景跟传统的搜索不一样的地方就在于用户是通过语音交互并且是以自然语言请求的方式来进行点播的。面对这种语音的并且是自然语言请求的自然语言的方式的这种请求传统的做法为pipeline式一段用户语音首先进入到语音识别ASR模块识别出相应的文本信息将文本信息送到自然语言处理NLU模块当中进行实体抽取将识别到的实体例如歌手名送入相关性搜索IR模块当中进行内容检索具体查找出用户想要得到的内容。但这种做法缺陷是每一个模块对于整个系统的性能都起着关键的作用一旦前面的某个模块出现了错误后续的模块可能就会出现连续的错误。具体而言这种方法存在的问题如下① 首先是曝光偏差的问题。NLU模型在训练的过程中基于准确的文本信息去进行训练但是在测试阶段它却是基于ASR的输出文本来进行预测的这就导致NLU模型在训练和测试过程中它面临的输入分布是不一致的这就是曝光偏差问题。曝光偏差问题会使得NLU模型在ASR结果出现错误的时候变得非常脆弱。② 其次训练目标不一致的问题。在pipeline当中各个模块它的训练目标没有办法和整个系统的训练目标保持一致例如语音识别ASR模块它的训练目标是去降低所识别文本的字错误率。但是对于整个请求的达成来说一个请求当中不同位置的字错误率对于最终请求的达成影响是不一样的比如说用户他说我想听刘德华的忘情水这个时候识别错了”我想听“和识别错”忘情水“对最终整个请求的达成影响是不一样的识别错了”忘情水“对最终整个请求的达成影响会更大一些。针对这种pipeline形式存在的问题在学术界展开了广泛的研究和讨论他们提出了构建一个端到端的语音语义理解的模型也就是说要直接基于原始的声音信号去做语义的理解。02端到端的语义理解模型端到端的语音语义理解模型主要应用在语义理解任务中的分类任务和生产任务上。1. 分类任务分类任务主要是应用在领域识别和意图识别上直接基于语音的信号构建一个端到端的语音语义理解模型训练目标就是意图理解或者是领域识别的训练目标。端到端的模型避免了之前那种pipeline形式的中间信息传递的损失从而也能得到更好的一个效果。2. 生成任务生成任务上主要是应用在实体抽取上端到端的实体抽取模型主要目前主要有两种结构形式。第一种采用的是一种流式处理的模型结构跟端到端流式处理的ASR模型的模型结构其实是一致的但是不同的地方在于它在输出的文本序列中间加入了一些特殊的标志符号去标示出它所识别的实体名称所在的位置比如左图中加了两个“$”符号去标志出歌手“刘德华”的位置以及加了“#”去标志出歌名“忘情水”所在的位置。另外一种模型结构是采用的这种encoder-decoder的翻译模型的模型结构它是直接基于的原始声音信号直接去翻译出所要抽取的实体名名称的文本序列。这里将整个端到端的实体抽取模型抽象成这样的两个过程分别是声学建模过程和语言建模过程。声学建模过程是指对原始的声音信息进行一个处理和建模而语言建模过程是指对输出的文本用一个语言模型去学习它的语法规律。在天猫精灵内容点播场景里所要识别的视频实体名称多是一些歌手名歌名等等。同时在点播内容库里存在着海量的歌手名和歌名。这些海量的歌手名和歌名对于语言模型来说要去建模是非常困难的。困难之处如下① 内容实体名称存在一音多字的情况比如雷雨心的《记念》和蔡健雅的《纪念》使得模型对于一些长尾的内容实体名称的识别并不能做得特别好。② 同时语言模型对于内容实体名称的泛化能力并不够这是主要是因为内容实体名称通常不具备有语法的约束甚至是反语言模型的毫不相关的几个字拼凑在一起都可能是一个歌名因此语言模型很难对内容实体名称去进行一个建模。③ 此外用户还经常存在口音的问题。因此针对内容实体名称存在的困难在天猫精灵的语音与一体化中不仅仅希望引入一个端到端的语音语义理解模型来减少以前的那种pipeline方式带来的信息损失还希望能够引入更多的信息来帮助模型去做好内容实体名称的识别。最直接的想法就是考虑的是引入内容库的信息。已知内容库里已经有一首陈奕迅的《圣诞结》这个时候去识别“she4ng da4n jie2”这个发音就会变得简单了很多。同时用户请求的这些歌手歌名其实都是存在于内容库里所要识别这些实体名称其实是在一个有限的集合内因此可以把实体抽取从生成问题变成一个匹配的问题做选择题总是比做填空题简单。03基于内容库的端到端的实体抽取模型Speech2Slot1. 模型的输入和输出输入的是用户请求的音素后验矩阵音素它类似于拼音的序列输出的是slot的音素序列。音素后验矩阵是ASR模型的一个中间的输出结果矩阵可以理解为是一个时间步数乘以音素词典大小的这样一个矩阵在每一个时间步上都有一个音素的概率分布。为什么要选取ASR的中间结果音素后验来作为输入这主要是因为我们认为声学建模与实体抽取任务其实是两个相对独立的任务声学建模可以认为它是一个感知层面的学习而后续的实体抽取的任务可以认为它是一个认知层面的一个学习将感知学习和认知学习进行分离对最终整个系统的效果的影响应该不会太大。另外选择音素后验矩阵作为输入然后slot的音素序列作为输出通过这种选择音素可以恰好为语音信号和文本信号提供了一个统一的编码方式使得整个模型的训练难度大大的降低。2. 模型结构我们的模型希望去建模这样一个过程首先在一段请求语音中截取实体名称所在的声音切片然后再对这个声音切片进行一个特征的抽取和处理最后基于抽取处理后的特征进行一个分类看它到底是属于内容库里的哪一个实体名称。这里需要注意的一点是实体名称在声音特征上并不具备特殊性因此在进行一个语音实体名称的声音切片的定位时还需要引入一些上下文的知识比如内容库的知识等来辅助实体名称的定位。所以最终的整个的模型结构就如下图所示主要分三部分来介绍Speech encoder、Knowledge encoder、Bright layer。① Speech encoder图中蓝色部分。我们对请求语音进行一个语音语义的理解然后生成一个memory的矩阵这里就是常规transformer结构它可以帮助捕捉到重点的语义信息。② Knowledge encoder图中橘色部分。通过预训练的方式来将内容库的知识建模在knowledge encoder当中它的预训练方式采用的是语言模型的预训练的方式训练语料是内容库中的所有的实体名称通过这种方式knowledge encoder能够提前看到内容库里都存在哪些实体名称同时去记住这些实体名称。③ Bright layer图中绿色部分。它实现的是一个实体定位和实体分类的这样一个作用。首先将的knowledge encoder每一个step的输出来对Speech encoder的memory矩阵做attention然后定位出内容实体的声音切片所在的位置同时还会对抽出来的相应的这些信息做一个处理最终输出它接下来这一帧应该输出哪一个音素。注意这里knowledge encoder的输出只去参与了attention的过程并不参与最后音素概率的计算这保证模型不过分依赖语音模型的结果。3. 引入内容库信息的方法在模型中通过以下两点来引入内容库信息Knowledge encoder用内容库中所有的内容名称进行预训练并采用Cold-fusion的方式进行Finetune。另外在推理阶段会提前的把内容库里所有的内容名称构建成一个Trie树在Beam-search过程中构建的Trie树用来约束模型输出必须指向内容库中的某一名称。4. 模型效果04无监督语音语义预训练1. 为什么要进行无监督语音语义预训练训练数据不足。语义理解能力对于整个端到端的实体抽取模型非常重要。在天猫精灵的模型中抽取实体时主要是encoder的语义理解能力以及knowledge encoder对内容库的一个匹配能力同时应用这两个能力来对实体名称进行定位的。2. 如何进行语音语义的无监督预训练具体的就是直接基于音素的后验利用大量的无标签的语音数据来进行对于语音语义理解的这一模块进行预训练之后这一个模块也能够快速地应用于语音语义理解模型里分类任务、生成任务的finetune。那么关于训练在文本领域其实已经有的大量的应用比如BERT通过随机的mask一些输入的token然后去做一个预测通过这种方式来进行预训练。那么我们的基于音素的无监督预训练也可以采用的类似的方式我们提出Phoneme-BERT一种基于音素的无监督预训练方式。3. 文本预训练和音素后验预训练的区别① 输入输出不同文本预训练模型的输入输出都是token组成的序列而在音素后验的模型当中输入输出的是概率分布矩阵音素后验矩阵。因此在mask操作时Phoneme-BERT采用的方式是选取音素后验矩阵中任意的几帧对相应帧上的整个概率分布进行mask计算loss时将预测的概率分布和原始的被mask的概率分布进行一个交叉熵计算通过这种方式来实现mask训练的过程。② token含义不同在文本预训练序列中的每一个token都是有意义的但是在音素后验矩阵当中却存在着大量无意义的静音帧。mask掉这些静音帧去做预测的话给模型的学习带来很多噪声和困难。对此我们采取的方案是通过概率分布筛选出静音帧并在mask过程中对这些静音帧进行进行排除。③ 单个token信息量不同文本预训练中每个token包含的信息量比较大这是因为不管是中文词典或者是英文词典规模都较大所以每一个token包含的信息量都会比较多。而音素后验矩阵中单个向量包含的信息量会比较少因为中文音素只有121个然后英文音素的话只有42个。由于每一帧包含的信息量较少这样随机mask后做训练的话模型并不能真正得到语义能力的学习。对此我们采用片段式的mask通过这种方式使得在每一次mask的过程中可以去掉包含更多信息量的这些帧然后使得整个无监督的预训练的效果会达到更好。4. 应用流程我们利用Phoneme-BERT对speech2slot中的speech encoder进行一个预训练通过大规模无监督语料让speech encoder具备语音语义理解能力。预训练完成之后我们再用少量标注数据对整个speech2slot进行端到端的finetune。Phoneme-BERT还可以应用于所有的端到端的语音语义理解模型分类任务/生成任务的预训练。5. 实验结果可以看到实验结果不管是哪一种预训练的方式都相比没有预训的方式能够得到更好的一个提升。同时在分类模型上也分别做了实验一个是在公开的数据集上做的一个实验先用开公开的4000多小时的英文的语音数据是对模型进行一个预训练然后之后预训练好的模型再去做一个领域分类任务可以看到的端到端的模型一开始在训练数据不足的情况下相比于baseline错误率是还提高了但是预训练之后整个模型相比于之前的模型准确率是提升的。另外在天猫精灵的数据上也是得到了像一样的验证效果。今天的分享就到这里谢谢大家。分享嘉宾OpenKGOpenKG中文开放知识图谱旨在推动以中文为核心的知识图谱数据的开放、互联及众包并促进知识图谱算法、工具及平台的开源开放。点击阅读原文进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/90408.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人才网站建站百度官网首页登陆

安科瑞 须静燕 截至2023年10月,我国5G基站总数达321.5万个,占全国通信基站总数的28.1%。然而,随着5G基站数量的快速增长,基站的能耗问题也逐渐日益凸显,基站的用电给运营商带来了巨大的电费开支压力,降低5…

从哪看出网站的建站公司wordpress 排版不正常

CSS 实现无限波浪边框卡片 效果展示 鼠标悬停效果,底部色块的边框是无限滚动的波浪 鼠标没有悬停效果 CSS 知识点 CSS 基础知识回顾使用 radial-gradient 实现波浪边框使用 anumate 属性实现波浪边框动画和控制动画运动 波浪实现原理 波浪边框的实现思路其…

网站整套模板psd网站开发类型什么意思

实验名称:实验四 递推问题(一) 实验目的:熟练掌握一些递推问题的处理方法:仔细分析,不断尝试推理,充分利用数学知识,找出问题中的内在规律,抽象出递推的数学模型。 实验…

海南建设监理协会网站做个外贸网站设计

1、还未添加到暂存区:git checkout -- filename 执行命令后,会回退到未修改之前的状态 2、已经添加到暂存区:git reset HEAD filename 执行命令后,会回退到工作区之前的状态 3、已经 commit,但是还未 push git reset…

移动互联网网站建设国外用的网站

文章目录 1 简介2 Docker安装与配置2.1 安装Docker2.2 配置Docker镜像加速器2.3 调整Docker资源限制 3 准备Elasticsearch Docker镜像3.1 下载Elasticsearch镜像3.2 自定义镜像配置3.3执行Docker Compose 4 运行Elasticsearch容器4.1 创建Elasticsearch容器4.2 修改配置文件4.3…

常见的电子商务网站推广方式网站如何做关键词seo

在Java应用程序中调度作业时,Quartz是第一个考虑的工具。 Quartz是由最流行的RDBMS支持的作业调度程序。 这真的很方便,并且很容易与spring集成。 为了创建石英模式,您必须下载石英发行版并解压缩位于crystal-2.2.3 / docs / dbTables /中的…

网站建设技术要求河南高端网站高端网站建设

vue指令-插值表达式 1、什么是插值表达式2、Vue变量声明在哪里 1、什么是插值表达式 双大括号&#xff0c;可以把vue数据变量直接显示在标签内 2、Vue变量声明在哪里 data函数返回对象上&#xff0c;用key属性声明 示例&#xff1a; <template><div id"app&…

服装网站互联网技术学什么

CF653F. Paper task 简要题面 给定括号序列SSS&#xff0c;求其中本质不同合法括号序列个数。(∣S∣≤5∗105|S|\leq 5*10^5∣S∣≤5∗105) Solution 感觉用了一个很麻烦的方法。 我们可以考虑枚举本质不同串的右端点&#xff0c;每次动态地在SAMSAMSAM里面加入末尾元素&am…

做电子手环网站需求分析丰台做网站的公司

&#x1f525; 交流讨论&#xff1a;欢迎加入我们一起学习&#xff01; &#x1f525; 资源分享&#xff1a;耗时200小时精选的「软件测试」资料包 &#x1f525; 教程推荐&#xff1a;火遍全网的《软件测试》教程 &#x1f4e2;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1…

让网站建设便宜到底北京网站页设计制作

基于TCP的本地通信&#xff08;客户机&#xff09;&#xff1a;创建流程&#xff1a;一、创建字节流式套接字&#xff08;socket函数&#xff09;&#xff1a; int sock_fd socket(AF_LOCAL,SOCK_STREAM,0);二、创建客户机和服务器的本地网络信息结构体并填充客户机和服务器本…

福州网站制作专业做专利费减是哪个网站

我们通常使用的笛卡尔坐标系统&#xff0c;角点通常在(0,0),即原点。初始边在x轴正半轴&#xff0c;终边与初始边成夹角。初始边逆时针旋转为正值&#xff0c;顺时针旋转为逆值。数学表示&#xff1a;角度&#xff1a;degreeradian*180/π 弧度&#xff1a;radiandegree*π/18…

汕头食品骏域网站建设WordPress站点添加ssl证书

20.有效的括号 题目链接&#xff1a;20.有效的括号 给定一个只包括 ‘(’&#xff0c;‘)’&#xff0c;‘{’&#xff0c;‘}’&#xff0c;‘[’&#xff0c;‘]’ 的字符串 s &#xff0c;判断字符串是否有效。 有效字符串需满足&#xff1a; 左括号必须用相同类型的右括…

蚌埠市建设学校网站电脑视频制作软件

1.top命令找到占用CPU高的Java进程PID 2.根据进程ID找到占用CPU高的线程 ps -mp pid -o THREAD,tid | sort -r ps -mp 124682 -o THREAD,tid | sort -r 3.将指定的线程ID输出为16进制格式 printf “%x\n” tid printf "%x\n" 6384 18f0 4.jstack pid |…

在线书店网站怎么做九江有没有做网站的公司

课程地址&#xff1a;https://edu.csdn.net/course/detail/39240 你将收获 游戏辅助编程 Lua基础 C/CLua联合编程 适用人群 对游戏辅助技术感兴趣的人 课程介绍 本课程以TLB*和W*W为例子&#xff0c;讲述如何通过游戏的Lua脚本来实现一个游戏的辅助。众所周知&#xff…

石家庄做网站最好的公司哪家好公司网站模板

说明通达OA漏洞在去年上半年已爆出&#xff0c;这不趁着周末没事做&#xff0c;将源码下载下来进行复现学习。文件包含测试文件包含检测&#xff0c;payload1:ip/ispirit/interface/gateway.php?json{"url":"/general/../../mysql5/my.ini"}利用文件包含访…

网站seo新手服装设计就业前景

转自&#xff1a;http://www.linuxso.com/command/fsck.html 使用权限 : 超级使用者    使用方式 : fsck [-sACVRP] [-t fstype] [--] [fsck-options] filesys [...]    说明 &#xff1a; 在Linux系统中&#xff0c;为了增加系统性能&#xff0c;通常系统默认一些数据…

特性设计的网站中国建设银行网站公积金查询余额

目录 一、BP神经网络简介 1.1 什么是BP神经网络 1.2 BP神经网络的结构 二、BP神经网络的前馈与后馈 2.1 什么是BP神经网络的前馈 2.2 什么是BP神经网络的后馈 三、BP神经网络前馈与后馈的关系 3.1 BP神经网络前馈与后馈的区别 3.2 BP神经网络前馈与后馈的意义 四、BP…

全校网站建设与管理店铺设计属于什么设计

为什么不用HAL库&#xff0c;使用HAL库捕获输入一个通道还尚可&#xff0c;多通道捕获由于HAL的回调函数不符合我的要求&#xff0c;干脆直接切换到LL库。网上找了许多&#xff0c;代码处理写的不符合我的要求&#xff0c;这里记录一下我的调试过程。 TIM2输出1路PWM信号&#…

网站子目录怎么做反向代理设置wordpress字体大小

文章目录 Servlet概述快速入门Servlet 中方法的生命周期Servlet 的体系结构GenericServletHttpServlet Servlet 3.0以后Servlet 相关配置 案例Servlet xml配置web.xmlMyServlet Servlet 注解配置 Servlet 概述 Servlet applet 运行在服务器端的小程序&#xff0c;Servlet 就是…

做网站应该注意些什么青岛响应式网站设计

联合体的定义 联合体的定义和结构体相同。 联合体成员共用存储空间&#xff0c;联合体占用的空间最大长度的数据成员的长度。 union State {char sleep;char run;int suspend;double error; }state_u;以上例子&#xff0c;State表示联合体的名字&#xff0c;它相当于声明了一…