邹平做网站wordpress 注册侧边栏

pingmian/2025/10/8 16:37:31/文章来源:
邹平做网站,wordpress 注册侧边栏,哈尔滨公共资源交易中心官网,c2c有哪些网站笔记整理 | 朱珈徵#xff0c;天津大学硕士。链接#xff1a;https://arxiv.org/pdf/2009.11692.pdf动机尽管生成式预训练语言模型在一系列文本生成任务上取得了成功#xff0c;但在生成过程中需要对基础常识知识进行推理的情况下#xff0c;它们仍然会受到影响。现有的方法… 笔记整理 | 朱珈徵天津大学硕士。链接https://arxiv.org/pdf/2009.11692.pdf动机尽管生成式预训练语言模型在一系列文本生成任务上取得了成功但在生成过程中需要对基础常识知识进行推理的情况下它们仍然会受到影响。现有的方法将常识性知识整合到预训练生成式语言模型中只是通过对个体知识三元组进行后训练来转移关系知识而忽略了知识图谱中的丰富联系。作者认为利用知识图的结构信息和语义信息有助于常识感知文本的生成。在本文中提出了基于多跳推理流的生成(Generation with Multi-Hop Reasoning Flow, GRF)使预训练模型能够对从外部常识知识图中提取的多关系路径进行动态多跳推理。实验表明本文模型在需要推理常识知识的三个文本生成任务上优于现有的基线。文中还演示了动态多跳推理模块的有效性并通过该模型推断出推理路径为生成提供了理论依据。亮点本文的亮点主要包括1提出了一种新的生成模型GRF该模型在文本生成中利用外部结构常识知识进行显式常识推理2提出了一个动态多跳推理模块该模块沿关系路径聚集证据以生成一些关键概念3 在三种常识感知文本生成任务上进行了大量的实验结果表明我们的模型优于各种基线。此外还将该模型所推断的推理路径可视化以证明多跳推理模块的有效性。概念及模型GRF以输入文本中的概念作为常识知识基础扩展出来的子图为基础首先用组合操作对多关系图进行编码以获得概念和关系的图形感知表示。然后多跳推理模块通过沿多个关系路径聚合三重证据进行动态推理生成上下文下的显著概念。最后生成分布结合了从知识图中复制概念的概率和通过门控制从标准词汇表中选择单词的概率。GRF具体由四部分构成使用预训练transformer的上下文建模。对具有非参数操作的多关系图进行编码以组合关系和概念。将来自源概念的证据沿着结构路径聚合到所有节点的多跳推理模块。门控生成分布。模型整体框架如下静态多关系图编码使用非参数合成操作将节点嵌入和关系嵌入结合起来。具体来说给定输入图G (V,E)和有LG个层GCN对于每个节点v我们通过聚合由节点u和连接关系r组成的本地邻居N(v)的信息来更新嵌入在第l1层的节点关系嵌入也通过另一个线性变换进行更新使用预训练模型的上下文建模采用GPT-2模型一个预训练的多层转换器解码器来建模文本序列的上下文依赖关系。模型的输入是源序列和目标序列的连接动态多跳推理流程为了在生成过程中对图结构进行显式推理设计了一个动态推理模块该模块利用知识图的结构模式和上下文信息在每个解码步骤中沿关系路径传播证据。具体来说该模块通过多次更新外部节点与其访问邻居的得分来广播G上的信息直到G上的所有节点都被访问为止。最初与Cx中概念对应的节点被赋予1分而其他未访问的节点被赋予0分。对于未访问节点v其节点评分ns(v)是通过聚集证据来计算的Nin(v)表示访问过的节点u及其边r直接连接v的集合R(u,r,v)是三元组相关性反映三元组(u,r,v) 在当前上下文下给出的证据的相关性。计算三元组相关性如下门控生成分布最后的生成分布用一个软的门概率gt表示是否在生成中复制某个概念以控制与复制机制类似的两个分布的权重。最终的输出分布是两个分布分别以gt和1-gt加权后的线性组合。理论分析实验作者在三个常识感知的文本生成任务上进行了实验包括故事结尾生成SEG、诱导性自然语言生成Abductive NLG和解释生成Explanation Generation。评价指标采用BLEU-4 CIDErROUGE-L和 METEOR来评估诱导性自然语言生成和解释生成任务BLEU-1/2评估结尾生成任务。从结果可以看出第一、模型在所有评价指标上都优于所有使用预训练语言模型或加入外部常识性知识的基线说明在常识性知识图中加入丰富的结构信息可以提高总体生成质量第二、在单纯的常识知识来源上进行后训练会降低这两项任务的表现。这可能是由于经过后训练的三元组语料库不能为模型提供丰富的语义来概括强调推理和解释的任务。对于故事结尾的生成文中也给出了评价结果。模型优于BLEU中的所有基线和不同的度量。作者还发现对外部常识数据进行后训练提高了预训练语言模型的生成多样性作者推测可能是由于在常识数据上进行后训练能够使模型生成与故事背景相关概念提高了文本的多样性此外还进行了消融实验以验证不同模型成分的效果。如表所示所有的组成部分都有助于最终的性能。删除动态推理模块(w/o DMRF)导致性能下降最大说明动态多跳推理在该任务中起主要作用。去掉图表示模块(w/o SMGE)也会降低性能因为它用关系信息对图结构进行编码有利于概念选择。我们还展示了使用均值聚合器的推理模块的结果观察到比起最大值聚合器有一些性能的下降。总结作者提出了基于多跳推理流的生成方法在文本生成过程中对结构化常识知识进行推理。该方法利用外部知识库的结构信息和语义信息对关系路径进行动态多跳推理。文中进行了大量的实验并通过实验证明该方法在三个文本生成任务上优于现有的将常识知识集成到预先训练的语言模型中的方法。作者还用为生成的结果提供基本原理的推断推理路径来演示此方法的可解释性。 OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/90040.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

户型图在哪个网站找燕郊医疗网站建设

全世界只有3.14 % 的人关注了青少年数学之旅(图源网络,侵权删)

麻阳住房和城乡建设局网站网络安全管理平台

Junit引入注解参数化单参数多参数方法传参 测试用例执行顺序断言测试套件 Junit引入 Junit来编写和组织自动化测试用例,使用Selenium来实际模拟用户与Web应用程序的交互。也就是使用JUnit的测试功能来管理和运行Selenium测试。常见的做法是,使用JUnit作…

读了成考好后悔啊aso排名优化

Linux C 编程一站式学习 #pragma 预处理指示供编译器实现一些非标准的特性,C 标准没有规定 #pragma 后面应该写什么以及起什么作用,由编译器自己规定。有的编译器用 #pragma 定义一些特殊功能寄存器名,有的编译器用 #pragma 定位链接地址&…

南头专业的网站建设公司网站开发前端学习

注:linux系统为vmware虚拟机,和真实工作环境可能有出入,不过正因如此我暴露了NAT转出的IP也没什么大碍 引言 postgresql与mysql目前都是非常受人欢迎的两大数据库,其各有各的优势,初学者先使用简单一张图来说明两者区…

做商城网站需要多少钱镇江网站建设推广

🌈个人主页:聆风吟 🔥系列专栏:数据结构、剑指offer每日一练 🔖少年有梦不应止于心动,更要付诸行动。 文章目录 一. ⛳️训练计划VI(题目难度:中等)1.1 题目1.2 示例1.3 …

做安居客网站需要什么浏览器网站版式设计说明

乘法和除法指令用的不多,因为效率很低 比较指令CMP (compare) •格式:CMP OPD,OPS •功能:(OPD) — (OPS),跟减法指令很像,但是不存结果 •说明:目的操作数减去源操作数,然后根据结果设置标志位,但该结…

新乡做网站网站设计 教程

一、说明 增强大型语言模型 (LLM) 安全性的追求是技术创新、道德考虑和实际应用的复杂相互作用。这项努力需要一种深入而富有洞察力的方法,将先进的数学模型与道德原则和谐地融合在一起,以确保LLM的发展不仅在技术上稳健,而且在道德上合理且对…

东兰县建设局网站注册网站建设

一、外键约束的概念 外键约束(FOREIGN KEY,缩写FK是数据库设计的一个概念,它确保在两个表之间的关系保持数据的一致性和完整性。 外键是指表中的某个字段的依赖于另一张表中某个字段的值,而被依赖的字段必须具有主键约束或者唯一约束&#…

做ppt做好的网站网站建设计算机人员招聘

第一题: 泰勒展开式求sin(x) 【问题描述】 已知sin(x)的泰勒展开式为: sin(x) x/1! - x^3/3! x^5/5! - x^7/7! …… 当某一项的绝对值小于ξ时,停止计算。 输入x及ξ的值,输出sin(x)的值,小数点后保留5位小数。…

上海响应式网站建设企业室内设计学校有哪些

当我们打印一个网页时,默认情况下,网页的背景图片是不会被打印出来的 这与我们的打印代码无关,需要设置IE便可,如下图: 转载于:https://www.cnblogs.com/blodfox777/archive/2008/08/05/1260860.html

个性化网站建设多少钱响应式网站制作流程

工作中经常要和第三方做对接,比如支付、电子合同等系统。操作成功之后,第三方会发送异步的通知,返回最终的处理结果,使用异步而不是使用同步通知,是为了加快系统响应速度,防止线程阻塞。任务处理完成后通过…

济南营销网站建设广告设计与制作的课程

dolphinscheduler运行了一段时间,忽然发现一个流程下某个任务一直在自动重跑,把工作流删了,任务删了,下线等等,都不能阻止他重复的运行,每秒1次,真是见了鬼 1、把zookeeper停掉发现不再重跑了 …

如何提网站建设需求网络服务器的分类

Flink on k8s部署日志详解及与Yarn部署时的日志生成模式对比 最近需要将flink由原先部署到Yarn集群切换到kubernetes集群,在切换之后需要熟悉flink on k8s的运行模式。在使用过程中针对日志模块发现,在k8s的容器中,flink的系统日志只有jobma…

做电影网站前途网页制作的公司哪家好

一、Thymeleaflayuijquery复选框回显基于Thymeleaf模板下的layuijquery复选框回显,主要是jquery。大致意思是:把数组转成JSON传到前台,再在前台转回数组 AJAX一般都是用JSON格式或XML格式来传递数据的JSON就是一种具有特殊格式的字符串。1.实…

学企业网站开发7a125v能插国内插座吗

1、static修饰的变量和方法,在类加载时即被初始化,可直接通过类名.变量名和类型.方法名进行调用。2、static修饰的变量,在类加载时会被分配到数据区的方法区。类的实例可共享方法区中的变量。如果static修饰的变量发生改变,那么所…

浙江网站建设工作室公司培训网站建设

html是什么?html即超文本标记语言,现在大多网页都是html的格式。而所谓的html文件是一种超文本文件,其中超文本可以是图片或音乐等非文字元素,使用很广泛。但是很多用户都不太明白html是什么文件?也不清楚html文件要如…

蝴蝶传媒网站推广湖北响应式网页建设哪家有

大家都知道&#xff0c;seo的一个很重要的一点就是要把网站做的条理清晰&#xff0c;让搜索引擎很容易的读明白&#xff0c;这个条理清晰不仅体现在网站的物理路径&#xff0c;url等地 方。在<h1><h2><h3>等方面也是这样。并不是<h1>对于关键字排名有帮…

企业新网站seo推广wordpress 微网站

原文地址&#xff1a;https://blog.csdn.net/chaishen10000/article/details/79324016 最近一段时间都在学习深度学习&#xff0c;想着在用户画像标签模型中看能不能用上&#xff0c;终于&#xff0c;用了一个多月的时间&#xff0c;结合实际的场景和数据&#xff0c;搭建了一套…

一级a做爰网站中国php 金融网站源码

实验三 一  实验名称 感知器设计 二 目的和意义 使用感知器完成线性分类任务 三 操作步骤或算法结构 数据预处理。载入数据文件&#xff08; iris.csv 文件&#xff09;中的数据&#xff0c;并将其分成样本向量矩阵X和样本分类结果向量 G \bf G G。 给 4 4 4 列向量的…

绮思网站建设qswoo高端网站制造

给定一个字符串 s&#xff0c;找到 s 中最长的回文子串。你可以假设 s 的最大长度为 1000。 示例 1&#xff1a; 输入: "babad" 输出: "bab" 注意: "aba" 也是一个有效答案。 示例 2&#xff1a; 输入: "cbbd" 输出: "bb"…