网站如何做导航条下拉菜单公司名字大全不重名

bicheng/2026/1/22 19:07:34/文章来源:
网站如何做导航条下拉菜单,公司名字大全不重名,自助建站平台网站,做毕业设计的网站近日#xff0c;阿里云人工智能平台PAI与华东师范大学数据科学与工程学院合作在自然语言处理顶级会议EMNLP2023上发表基于双曲空间和对比学习的垂直领域预训练语言模型。通过比较垂直领域和开放领域知识图谱数据结构的不同特性#xff0c;发现在垂直领域的图谱结构具有全局稀…近日阿里云人工智能平台PAI与华东师范大学数据科学与工程学院合作在自然语言处理顶级会议EMNLP2023上发表基于双曲空间和对比学习的垂直领域预训练语言模型。通过比较垂直领域和开放领域知识图谱数据结构的不同特性发现在垂直领域的图谱结构具有全局稀疏局部稠密的特点。为了补足全局稀疏特点将垂直领域中分层语义信息通过双曲空间注入到预训练模型中。为了利用局部图结构稠密特点我们利用对比学习构造图结构不同难度的正负样本来进一步加强语义稀疏的问题。 论文 Ruyao Xu, Taolin Zhang, Chengyu Wang, Zhongjie Duan, Cen Chen, Minghui Qiu, Dawei Cheng, Xiaofeng He, Weining Qian. Learning Knowledge-Enhanced Contextual Language Representations for Domain Natural Language Understanding. EMNLP 2023 背景 知识增强预训练语言模型KEPLM通过从大规模知识图KGs中注入知识事实来提高各种下游NLP任务的性能。然而由于缺乏足够的域图语义这些构建开放域KEPLM的方法很难直接迁移到垂直领域因为它们缺乏对垂直领域KGs的特性进行深入建模。如下图所示KG实体相对于纯文本的覆盖率在垂直领域中明显低于开放域表明领域知识注入存在全局稀疏现象。这意味着将检索到的少数相关三元组直接注入到PLM中对于领域来说可能是不够的。我们进一步注意到在垂直领域KGs中最大点双连通分量的比率要高得多这意味着这些KGs中同一实体类下的实体相互连接更紧密并表现出局部密度特性。因此本文研究是基于上述领域KG的数据特性提出了一个简单但有效的统一框架来学习各种垂直领域的KEPLM。 算法概述 为了解决上述垂直领域知识增强框架的问题KANGAROO模型分别通过双曲空间学习垂直领域图谱数据的分层语义信息来补充全局语义稀疏模块Hyperbolic Knowledge-aware Aggregator通过捕捉领域图谱稠密的图结构构造基于点双联通分量的对比学习模块Multi-Level Knowledge-aware Augmenter模型框架图如下所示 Hyperbolic Knowledge-aware Aggregator Learning Hyperbolic Entity Embedding 首先欧几里得空间中的嵌入算法由于嵌入空间的维度而难以对复杂模式进行建模。受庞加莱球模型的启发由于重建的有效性双曲空间对层次结构具有更强的代表能力为了弥补闭域的全局语义不足我们采用Poincaréball模型来同时学习基于层次实体类结构的结构和语义表示。两个实体eiej之间的距离为 我们定义D{reiej}是同义实体。然后我们最小化相关对象之间的距离以获得双曲嵌入 Domain Knowledge Encoder 该模块设计用于对输入token和实体进行编码并融合它们的异构嵌入包含两部分Entity Space Infusion 和 Entity Knowledge Injector。 Entity Space Infusion 为了将双曲嵌入集成到上下文表示中我们通过级联将实体类嵌入注入到实体表示中 Entity Knowledge Injector 它旨在融合实体嵌入{hej}m的异构特征。为了匹配来自领域KGs的相关实体我们采用重叠单词数量大于阈值的实体。利用M层聚合器作为知识注入器能够集成不同级别的学习融合结果。在每个聚合器中两个嵌入都被输送到多头注意力层 我们将实体嵌入注入上下文感知表示中并从混合表示中重新获取它们 Multi-Level Knowledge-aware Augmenter 它使模型能够学习注入的知识三元组的更细粒度的语义关系利用图谱局部结构特征来进一步纠正全局稀疏性问题。我们着重于通过点双连通分量子图结构构造具有多个难度级别的高质量正样本和负样本。示例构造流程如下图所示。 Positive Sample Construction 我们提取目标实体的K个相邻三元组作为正样本它们在相邻候选子图结构中最接近目标实体。这些三元组中包含的语义信息有利于增强上下文知识。为了更好地聚合目标实体和上下文标记表示将K个相邻三元组转换后拼接到一个句子中。通过共享的文本编码器例如BERT获得统一的语义表示。由于来自离散实体和关系的不同三元组的采样之间存在语义不连续性我们修改位置嵌入使相同三元组的标记共享相同的位置索引反之亦然。例如上图中输入标记的三元组位置e0re0、e1、e1均为1。为了统一表示空间我们采用[CLS]即BERT中的输入格式的token表示为正样本嵌入以表示样本序列信息。 Point-biconnected Component-based Negative Sample Construction 在领域KGs中由于具有有利于图的局部稠密性质节点与相邻节点是稠密连接的搜索。因此我们搜索大量距离目标实体更远的节点作为负样本。 第一步以起始节点Estart即e0为中心点沿着这些relation向外进行搜索我们得到了具有不同hopPGestarteend的端节点Eend其中hop·表示跳距PGeiej表示图G中实体之间的最短路径。例如路径3中的跳跃点PGe0e102路径6中的跃点数PGe0、e113我们利用跳跃距离来构建具有不同结构难度水平的负样本其中对于1级样本hop·2对于n级样本hop·n1。我们假设跳跃距离越近就越难区分三元组与起始节点之间包含的语义知识。负样本的构造模式类似于正样本正样本具有相同距离的路径被合并成句子。注意当节点对包含至少两条不相交的路径即点双连通分量时我们选择最短路径例如路径4。对于每个实体我们构建k个级别的负样本。 Training Objectives 我们模型的损失函数主要包含了两个部分一个是普通token级别的MLM掩码任务另外一个是基于点双联通分量的对比学习任务。 算法精度评测 为了评估KANGAROO模型在垂直领域预训练模型的效果我们选取了金融和医疗等领域的各种下游任务的全数据量和少样本数据量场景进行评测。 全数据量微调实验结果 少样本数据微调数据结果 为了比较不同图谱数据表示方法的效果不同我们对比了欧式距离和双曲距离之间的结果如下 为了更好地服务开源社区KANGAROO算法的源代码即将贡献在自然语言处理算法框架EasyNLP中欢迎NLP从业人员和研究者使用。 EasyNLP开源框架GitHub - alibaba/EasyNLP: EasyNLP: A Comprehensive and Easy-to-use NLP Toolkit 参考文献 Chengyu Wang, Minghui Qiu, Taolin Zhang, Tingting Liu, Lei Li, Jianing Wang, Ming Wang, Jun Huang, Wei Lin. EasyNLP: A Comprehensive and Easy-to-use Toolkit for Natural Language Processing. EMNLP 2022Zhengyan Zhang, Xu Han, Zhiyuan Liu, Xin Jiang, Maosong Sun, and Qun Liu. 2019. ERNIE: enhanced language representation with informative entities. In ACL, pages 1441–1451.Xiaozhi Wang, Tianyu Gao, Zhaocheng Zhu, Zhengyan Zhang, Zhiyuan Liu, Juanzi Li, and Jian Tang. 2021. KEPLER: A unified model for knowledge embedding and pre-trained language representation.Trans. Assoc. Comput. Linguistics, 9:176–194.Yusheng Su, Xu Han, Zhengyan Zhang, Yankai Lin, Peng Li, Zhiyuan Liu, Jie Zhou, and Maosong Sun. 2021. Cokebert: Contextual knowledge selection and embedding towards enhanced pre-trained language models. AI Open, 2:127–134 论文信息 论文标题Learning Knowledge-Enhanced Contextual Language Representations for Domain Natural Language Understanding 论文作者徐如瑶、张涛林、汪诚愚、段忠杰、陈岑、邱明辉、程大伟、何晓丰、钱卫宁 论文pdf链接https://arxiv.org/abs/2311.06761

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/87770.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站建设珠江摩尔免费商标设计网

金刚石工具就是以金刚石为增强体,以金属或聚合物为基体的一类功能复合材料。金刚石工具已经成为当今公认的、唯一有效的硬脆非金属材料加工工具,比如,只有用金刚石刀具能加工超硬的陶瓷,尚无其他代用品。金刚石工具根据其用途的不…

东方建设集团有限公司网站工程施工合同免费版

写在前面 最近想复习一下数据结构与算法相关的内容,找一些题来做一做。如有更好思路,欢迎指正。 目录 写在前面一、场景描述二、具体步骤1.环境说明2.代码 写在后面 一、场景描述 给你单链表的头节点 head ,请你反转链表,并返回反…

昆明网站建设去出发科技公司wordpress图片搬到聚合图床

unicloud 获取集合collection并请求数据库 在unicloud 云数据库概念及创建一个云数据库表并添加记录(数据)这一篇文章中,我介绍了unicloud数据库以及如何新建表数据 如果没看过的话可以去看看,然后在看这篇文章,因为这篇文章讲解的是如何获取云数据库的数据集合,要想获取,你得…

网站开发模板下载以营销型网站为主要营销方式的案例

技术介绍 本系统运用了JSP技术、SSM框架、B/S架构和myspl数据库 MySQL 介绍 MySQL是一种关系型的数据库管理系统,属于Oracle旗下的产品。MySQL的语言是非结构化的,使用的用户可以在数据上进行工作。这个数据库管理系统一经问世就受到了社会的广泛关注…

如何更新单位网站怎么做网站在网上能搜到你

目录 前言 蓝桥杯大赛历届真题(点击查看) 一、第十四届比赛题目 1.比赛原题 2.题目解读 1)任务要求 2)注意事项 二、任务实现 1.NE555读取时机的问题 1)缩短计数时间 2)实时读取 2.温度传感器读…

温州网站排名优化东莞软件开发公司

1、创建MyMutexLED目录 输入“cd /home/zgq/linux/Linux_Drivers/回车” 切换到“/home/zgq/linux/Linux_Drivers/”目录 输入“mkdir MyMutexLED回车”,创建“MyMutexLED”目录 输入“ls回车”查看“/home/zgq/linux/Linux_Drivers/”目录下的文件和文件夹 2、…

团购机票网站建设免费的网页制作软件

有一个环形的公路,上面共有n站,现在给定了顺时针第i站到第i1站之间的距离(特殊的,也给出了第n站到第1站的距离),小*想着沿着公路第x站走到第y站,她想知道最短的距离是多少? 输入描述…

wordpress数据库和网站文件下载wordpress后台开发

一、emptyDir存储卷 当Pod被分配给节点时,首先创建emptyDir卷,并且只要该Pod在该节点上运行,该卷就会存在。正如卷的名字所述,它最初是空的。Pod 中的容器可以读取和写入emptyDir卷中的相同文件,尽管该卷可以挂载到每…

怎么建设宣传网站黄冈论坛遗爱湖

一、安装目录介绍 其中:bin 目录下: 二、配置信息目录结构 这是 IDEA 的各种配置的保存目录。这个设置目录有一个特性,就是你删除掉整个目录之后,重新启动 IntelliJ IDEA 会再自动帮你生成一个全新的默认配置,所以很多…

深圳市城乡住房和建设局网站wordpress加载速度

连更!! 0 Abstract 先前的姿势引导图像合成方法简单的将人的外观与目标姿势进行对齐,这容易导致过拟合,因为缺乏对source person image的high-level semantic understanding;文章开发了一种新的训练范式:…

国内移动端网站做的最好的福田网站设计

您现在可以使用 MinIO 批处理框架执行 S3 删除操作,以通过单个 API 请求删除大量对象。借助 MinIO 批处理框架,可以快速轻松地在 MinIO 部署中执行重复或批量操作,例如批量复制和批量密钥轮换。MinIO 批处理框架处理所有手动工作,…

石家庄站列车时刻表wordpress数据库注入

RevCol:解决深度学习信息从低层(输入)传递至高层(输出)的过程中,信息会逐层丢失问题 学习解耦表示可逆列网络(RevCol)子特征1:多级可逆单元子特征2:可逆列架构…

400网站建设推广如何开一个微信公众号

本实验讲述ArcGIS Pro中人工智能深度学习应用之–汽车检测。 文章目录 一、学习效果二、工具介绍三、案例实现四、注意事项一、学习效果 采用深度学习工具,可以很快速精准的识别汽车。 案例一: 案例二: 下面讲解GIS软件实现流程。 二、工具介绍 该案例演示的是ArcGIS Pro中…

sae做的网站备份别人做的网站自己想更新

文章目录 概要背景解决方法技术细节小结 概要 关于kafka重平衡问题在实践工作的应用 背景 重平衡包括以下几种场景: 消费者组内成员发生变更,这个变更包括了增加和减少消费者。注意这里的减少有很大的可能是被动的,就是某个消费者崩溃退出了主题的分…

自己网站如何做关键词东莞免费网站制作

文章目录 引言依赖注入基础依赖注入的基本概念依赖注入的原理 依赖注入实践依赖注入注意事项 引言 Angular作为一款流行的前端框架,提供了许多优秀的功能和特性,其中之一就是依赖注入(Dependency Injection)。依赖注入是一种设计…

全栈工程师是做网站吗html网站的直播怎么做

索引类型 索引可以提升查询速度,会影响where查询,以及order by排序。MySQL索引类型如下: 从索引存储结构划分:B Tree索引、Hash索引、FULLTEXT全文索引、R Tree索引 从应用层次划分:普通索引、唯一索引、主键索引、复…

做网站建设的价格建立网站赚钱 优帮云

Title: [科普] 无刷直流电机驱动控制原理图解 文章目录 I. 引言II. 直流电机的原理1. 有刷直流电机和无刷直流电机的区别2. 有刷直流电机的运行原理3. 既是电动机又是发电机 III. 无刷直流电机的原理1. 无刷直流电机与永磁同步电机的区别2. 无刷直流电机的换向控制原理3. 无刷直…

网站制作公司北京网站建设公司哪家好拼车网站的建设雨实现

CrossOver Mac 使用特点 • 免费试用 14 天,可使用 CrossOver Mac 全部功能,• 试用过期会保留之前安装的 Windows 软件• 使 Mac 运行 Windows 程序 使用CrossOver在Mac上运行Windows软件是一个方便且无需安装完整Windows操作系统的解决方案。CrossOve…

雄县做网站的网站开发模板教务管理

ElasticSearch是广受欢迎的NoSQL数据库,其分布式架构提供了极佳的数据空间的水平扩展能力,同时保障了数据的可靠性;反向索引技术使得数据检索和查询速度非常快。更多功能参见官网介绍 https://www.elastic.co/cn/elasticsearch/ 下面简单罗列…

做外贸网站的价格高清不卡二卡三卡四卡免费下载

Chat2DB:开源多数据库客户端的AI革新 Chat2DB使用教程:Chat2DB使用教程_哔哩哔哩_bilibili 引言: 随着企业数据的快速膨胀,数据库管理的复杂性也在增加。此时,一个能够跨越数据库边界、并且集成先进的AI功能的工具,不…