查公司备案网站备案信息建站有哪些公司

diannao/2026/1/26 19:22:39/文章来源:
查公司备案网站备案信息,建站有哪些公司,姜堰区区网站建设,建网站需要费用【论文阅读】MCTformer: 弱监督语义分割的多类令牌转换器 文章目录 【论文阅读】MCTformer: 弱监督语义分割的多类令牌转换器一、介绍二、联系工作三、方法四、实验结果 Multi-class Token Transformer for Weakly Supervised Semantic Segmentation 本文提出了一种新的基于变换…【论文阅读】MCTformer: 弱监督语义分割的多类令牌转换器 文章目录 【论文阅读】MCTformer: 弱监督语义分割的多类令牌转换器一、介绍二、联系工作三、方法四、实验结果 Multi-class Token Transformer for Weakly Supervised Semantic Segmentation 本文提出了一种新的基于变换的框架来学习类特定对象定位映射作为弱监督语义分割(WSSS)的伪标签 可以利用标准视觉转换器中一个类令牌的参与区域来形成与类无关的定位映射我们研究了转换器模型是否也可以通过学习转换器中的多个类令牌来有效地捕获特定于类的注意力 提出了一个多类令牌转换器称为MCTformer它使用多个类令牌来学习类令牌和补丁令牌之间的交互 提出的MCTformer可以成功地从对应于不同token的类到patch关注生成类判别对象定位映射 我们还建议使用从patch -patch转换器注意力中提取的patch级成对亲和度来进一步细化定位图 提出的框架被证明可以完全补充类激活映射(CAM)方法 一、介绍 弱监督语义分割(WSSS)旨在通过弱监督来减轻对像素级真值标签的依赖 利用弱标签生成高质量的伪分割真值标签 图像级标签可以提供简单的弱标签其仅指示某些类的存在或不存在定位信息 来自卷积神经网络CNNs的对象定位图。尽管使用了复杂的CAM扩展策略或多个训练步骤但现有方法在定位对象的完整性和准确性方面仍然表现出有限的性能 视觉转换器ViT作为第一个专门为计算机视觉设计的转换器模型最近在多个视觉任务上取得了性能突破 ViT在大规模图像识别方面取得了最先进的性能这要归功于其强大的远程上下文建模能力    ViT还使用一个额外的cls token来聚合来自整个patch token序列的信息 最近的一项工作DINO揭示了在自监督ViT特征中存在关于图像语义分割的明确信息 在实际工作中我们探究了Class_cls, CNN_cls和Patch_cls的联系最后选择了Class_cls, CNN_cls 从类标记的注意力图中发现语义场景布局 注意力图在无监督分割任务中产生了有希望的结果 但如何将头部与正确的语义类相关联仍不清楚。也就是说这些注意力映射仍然是类不可知的    在之前的Transformer中仅使用一个cls_token红色方块来聚合来自patch_token蓝色方块的信息所提出的MCTformer使用多个类令牌来学习cls_token和patch_token之间的交互。学习的类对不同类标记的注意力进行Patch可以生成类特定的对象定位图 利用Transformer的特定类别注意力是一项挑战 现有的基于转换器的作品有一个共同的问题即仅使用一个cls_token这使得在单个图像上准确定位不同对象具有挑战性 存在的问题 cls_token设计本质上不可避免地从其他对象类别和背景中捕获上下文信息导致相当无歧视和有噪声的对象定位模型容量不足以实现有针对性的判别定位性能 一个简单的想法是利用多个cls_token它将负责学习不同对象类的表示。为此我们提出了一种多类令牌转换器MCTformer其中使用多个类特定令牌来利用类特定转换器的注意力 作用 拥有类特定令牌的目标不能通过简单地增加ViT中cls_token的数量来实现因为这些类令牌仍然没有特定的含义沿着嵌入维度对来自转换器编码器的输出类令牌应用平均池以生成cls_token这些分数由基本事实类标签直接监督学习到的类对不同类的注意力的patch可以直接用作类特定的定位图所学习的patch到patch的注意力可以作为patch级别的成对亲和力所提出的转换器框架完全补充了CAM方法。这导致类标记和补丁标记之间的高度一致性从而显著增强了它们派生的对象定位图的判别能力    贡献 建议利用类特定的转换器注意力进行弱监督语义分割提出了一个有效的转换器框架其中包括一个新的多类令牌转换器MCTformer结合类感知训练策略从类中学习特定于类的定位图以修补不同类令牌的注意力使用patch到patch的注意力作为patch级别的成对亲和力这可以显著细化特定类别的转换器注意力 二、联系工作 大多数现有的WSSS方法依赖于类激活映射来从CNN中提取对象定位图 因此无法为语义分割网络的学习提供足够的监督。为了解决这个问题已经提出了特定的分割损失 SEC损失 CRF损失 对比损失    进从CAM图中获得的伪分割标签上。这些方法可分为以下几类生成高质量的CAM映射。一些方法开发了启发式策略如“隐藏和搜索”[31]和擦除[40]应用于图像[2449]或特征图[1621]以驱动网络学习新的对象模式 子类别和跨图像语义来定位更准确的对象区域 正则化损失来引导网络发现更多的对象区域 通过引入扩张卷积来解决标准图像分类CNN的感受野有限的问题 Refining CAM maps with affinity learning Ahn等人提出了affinity 从原始CAM图的可靠种子中学习相邻像素之间的仿射关系 网络可以预测仿射矩阵以通过随机游动传播CAM映射 分割结果中的置信像素学习了成对亲和网络 直接从分类网络的特征图中学习亲和度以细化CAM图 Xu等人[44]提出了一种跨任务亲和性该亲和性是从弱监督多任务框架中的显著性和分割表示中学习的 我们提出了一种基于Transformer的模型来提取类特定的对象定位图。我们利用Transformer机制中的转换器注意图来生成对象定位图 Transformer Transformer最初设计用于对NLP领域中长序列的长程依赖性进行建模 如图像分类[10]、显著性检测[27]和语义分割[30]实现了有希望的性能 然后这些标记被转发到多个堆叠的基于自我关注[37]的层中使每个补丁都具有全局感受野 自监督方法应用于ViT并观察到类标记在补丁上的注意力包含关于场景语义布局的信息 TS-CAM使CAM模块适应ViT。然而TS-CAM只利用了ViT的类不可知注意力映射 提出的多类令牌转换器框架被证明比原始ViT更好地补充了CAM机制生成了比TS-CAM更好的对象定位图 三、方法 具体框架 新的纯基于Transformer的框架MCTformer-V1来利用变换器注意力的类特定对象定位图 输入RGB图像首先被分割成不重叠的patch然后被转换成patch标记序列 使用多个cls_token。这些类标记与嵌入patch信息的补丁标记连接以形成转换器编码器的输入标记 cls_token和patch_token。我们对最后一层的输出cls_token应用平均池来生成类分数而不是像传统的转换器那样使用多层感知MLP来进行分类预测 cls_token直接产生的类分数和基本事实类标签之间计算分类损失 聚合来自多个层的注意力图 从patch到patch的注意力中提取patch级别的成对亲和力以进一步细化类到补丁的注意 类特定的定位图被用作种子以生成伪标签来监督分割模型 Multi-class token结构设计 考虑一个输入图像它被分割成N×N个补丁patch标记序列C类标记序列C类标记与补丁标记级联并添加位置嵌入每个编码层由一个多头注意力MHA模块、一个MLP和分别应用于MHA和MLP之前的两个LayerNorm层组成 我们使用标准的自关注层来捕获令牌之间的长程依赖关系。更具体地说我们首先对输入token序列进行归一化 token到token的注意力映射At2t 全局成对注意力映射At2t 每一行表示特定class对所有patch的注意力得分 考虑到较高的层学习更多的高级判别表示而较早的层捕获更多的一般和低级视觉信息 class融合到最后K个变换器编码层的patch注意力    Amct是从所提出的MCFormer-V1的第l个变换器编码层提取的特定于类的变换器注意力。 以生成最终的class特定对象定位映射AmctRC×N×N Class-specific attention refinement 在先前的工作中经常使用成对仿射来细化对象定位图。它通常需要一个额外的网络或额外的层来学习亲和图 我们建议从所提出的MCTformer的patch匹配注意力中提取成对亲和图而无需额外的计算或监督 通过提取patch到patch的注意力Ap2pRM×M来实现的 所提取的亲和度用于进一步细化类特定的变换器注意力 细化的类特定定位图 可以获得更好的对象定位图并提高外观连续性 Class-aware training 与传统的转换器使用来自最后一层的单个cls_token通过MLP执行分类预测相比我们有多个类令牌并且我们需要确保不同的类令牌可以学习不同的类判别信息 平均值集中输出类令牌以生成类分数    我们计算类c的类得分yc与其基本事实标签之间的soft margin loss 我们将CAM模块集成到所提出的多类令牌转换器框架中 我们将其划分为输出类令牌Tout_cls RC×D和输出补丁令牌Tout_pth RN×D patch标记进行整形并将其转发到具有C个输出通道的卷积层 总损失是分别根据类标记和补丁标记在图像级基本事实标记和类预测之间计算的两个soft margin loss的总和 将PatchCAM和特定于类的转换器注意力相结合 可以从最后一个卷积层提取基于补丁标记的CAM此后称为PatchCAM图 将提取的PatchCAM映射与所提出的类特定变换器注意力映射相结合 通过逐元素乘法运算产生融合的对象定位映射 where ◦ denotes the Hadamard product    类特定的对象定位映射细化。类似于MCTformer-V1中提出的注意力细化机制 我们也可以从MCTformer-V2中提取Patch到Patch的注意力图作为Patch级别的成对亲和度以细化融合的对象定位图 其中CAM方法可以灵活而稳健地适应多标签图像 四、实验结果 数据集:PASCAL VOC 2012和MS COCO 2014 PASCAL VOC 即训练集train、验证集val和测试集每个子集分别包含1464、1449和1456个图像20个对象类和一个用于语义分割任务的背景类10582张图像的增强集以及中的额外数据进行训练 MSCOCO 80个对象类和一个背景类进行语义分割其训练集和验证集分别包含80K和40K图像 只使用了这些数据集的图像级基本事实标签 ImageNet[9]上预训练的DeiT-S主干构建了所提出的MCTformer 具体细节 遵循了中提供的数据扩充和默认训练参数训练图像的大小调整为256×256然后裁剪为224×224在测试时我们使用多尺度测试和超参数的CRF进行后处理

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/87881.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

哪里有工程做的网站产品展示网站源码php

背景介绍​ 在web开发中的应用广泛​ 在web开发中的应用广泛。随着互联网的发展,web应用越来越普遍,而Python作为一种简洁、高效的编程语言,被广泛应用于web开发领域。Python提供了丰富的库和框架,如Django、Flask等&#xff0c…

免费网站自助制作wordpress制作留言板

1、如何添加虚轴可以参考下面文章链接: 如何添加虚轴(AM400PLC)-CSDN博客文章浏览阅读2次。EtherCAT运动控制总线启用的时候,选择EtherCAT总线任务周期。选择好后,选择点击添加。https://blog.csdn.net/m0_46143730/article/details/139898985?csdn_share_tail=%7B%22type…

编程学习入门网站网页制作与设计第四版电子书

操作系统第四章习题 1.对一个将页表放在内存中的分页系统: (1) 如果访问内存需要0.2μs,有效访问时间为多少? (2) 如果加一快表,且假定在快表中找到页表的几率高达90%,则有效访问时间又是多少(假定查快表需花的时间…

wordpress 百万ip绍兴百度seo

小柏林之声音响是13个喇叭1个功放,功率是590W,对应普通音响来说,已经是上等了。像著名的哈曼卡顿音响,还是丹拿音响,或者是BOSE音响,论地位,论音质柏林之声也是名列前茅。星骏汇小许Xjh15863 升…

自己做网站切入地图电脑最常用的绘图软件有哪些

摘 要 现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本企业人事管理信息系统就是在这样的大环境下诞生,其可以帮助管理者在短时间内处理完毕庞大的数据…

哈尔滨模板建站系统如何查看自己做的网站大小

首先,需要对两门语言进行初步认识,C语言是一门通用性的编程原因,为什么说通用呢?是因为它能够做很多低级、底层的处理,同时具有良好的跨平台性,C语言可以按照一定的标准在多种计算机平台上进行编译,包含嵌…

做外贸是什么网站雄安优秀网站建设

休眠,电脑内存中的数据写入硬盘,关闭电脑。重新启动的时候重新将数据加载到内存中,恢复休眠前状态。睡眠,和休眠一个意思,98系统下叫睡眠。xp系统叫休眠。98系统睡眠时,内存数据写入虚拟内存,xp…

响应式网站模板html网站规划和网站建设

​ 文章目录 一、什么是Ajax二、全局刷新和局部刷新二、Ajax中使用XMLHttpRequest对象(Ajax核心步骤)1、创建异步对象2、给异步对象绑定事件3、异步对象的属性 readyState 表示异步对象请求的状态变化4、初始异步请求对象5、使用异步对象发送请求6、jso…

青岛建设银行股份有限公司网站首页宁波建筑信息平台

根据消息人士透露,此次人工智能洞察论坛将是一次历史性的聚会,吸引了来自科技界的许多重量级人物。与会者们将共同探讨人工智能在科技行业和社会发展中的巨大潜力以及可能带来的挑战。 埃隆马斯克,特斯拉和SpaceX的首席执行官,一直…

如何做资金盘网站地方门户类网站产品推广

文章目录 一.HarmonyOS应用开发实战—开箱即用的登录页面2【ArkTS】【鸿蒙专栏-31】1.1 项目背景1.2 ArkTS详解二.HarmonyOS应用开发实战—开箱即用的登录页面3【ArkTS】2.1 ArkTS页面源码2.2 代码解析2.3 心得一.HarmonyOS应用开发实战—开箱即用的登录页面2【ArkTS】【鸿蒙专…

seo网站分析专门做相声的网站

文章首发微信公众号,微信搜索:猿说python对于线程与线程之间的交互我们在前面的文章已经介绍了 python 互斥锁Lock / python事件Event , 今天继续介绍一种线程交互方式 – 线程条件变量Condition.一.线程条件变量Condition相关函数介绍acquire() — 线程…

网站维护是怎么回事个人 备案 多个网站吗

基于STM32单片机的汽车胎压、速度及状态监测系统设计与实现 摘要: 随着汽车电子技术的快速发展,车辆状态实时监控系统的需求日益增长。本文设计并实现了一种基于STM32单片机的汽车胎压、速度及状态监测系统。该系统能够实时监测汽车的胎压、速度以及其他…

做网站app要多少钱周口seo推广

C# 是一种强类型的编程语言,这意味着在声明变量时必须指定其数据类型。数据类型是用于定义变量可以持有的数据类型的系统。C# 支持多种内置数据类型,同时也支持用户自定义的数据类型。 变量 变量是用来存储数据的容器。在 C# 中,每个变量都有一个特定的数据类型,这决定了…

百度收录网站链接创网站

金三银四招聘季已落幕,虽说行情不是很乐观,但真正的强者从不抱怨。 在此期间,我收到众多小伙伴的宝贵反馈,整理出132道面试题,从基础到高级,有八股文,也有对某个知识点的深度解析。包括以下几部…

如何申请免费域名做网站申请带域名的免费空间

在工厂的生产加工过程中,工业视觉检测系统被广泛应用,并且起着重要的作用。它能够对不同的零部件进行多功能的视觉检测,包括尺寸和外观的缺陷。随着制造业市场竞争越来越激烈,对产品质检效率的要求不断提高,传统的人工…

黄金网站app视频wordpress存档

作者 | KITTY GUPTA 译者 | 张健欣 令开发者万分高兴的是,开发自己的测试框架的日子终于结束了。以前,开发团队接手一个项目并开始开发时,除了项目模块的实际开发之外,他们不得不为这个项目构建一个自动化测试框架。一个测试框架应…

江门有那几间公司做网站的免费域名注册 国外

1、为什么需要私服 如果在公司中多个项目模块中的的公共类用的都是一样的,那么不可能将这些一样的代码写两遍。所以将其中一个项目中的代码打包成私服,然后在另外一个模块中去进行引用。 除此之外,如果大公司中开发人员较多,大家同…

自己怎么建购物网站自己做网站好做吗

来源:生物通 斯坦福大学医学院的研究人员已经表明,大量锻炼的成年小鼠的血液对年龄相同、久坐不动的小鼠的大脑有益。运动小鼠血液中的一种蛋白质似乎是主要原因。Tony Wyss-Coray一项新的研究表明,有可能把跑马拉松的小鼠对大脑的好处转移到…

做网站网站的推广是不是犯罪的京紫元年深圳网站建设

一、完全二叉树 堆是一种完全二叉树,什么是完全二叉树? 简单的说,一棵满二叉树表示的是所有节点全部饱和,最后一层全部占满: 而完全二叉树指的是满二叉树的最后一层,所有叶子节点都从左往顺序排满&#x…

饿了么网站做要多少钱视频网站空间

前言:最近比较忙,很久没有翻看知网论文了,看了下yolo改进相关的论文发现基于YOLOv5改进的核心期刊论文还是层出不穷,并没有因为已经是2024年了YOLOv9的出现而导致论文不好发,同时YOLOv8的论文也出了不少,所…