企业网站建设会计分录杭州手机软件开发

pingmian/2025/10/9 6:32:23/文章来源:
企业网站建设会计分录,杭州手机软件开发,怎样做模具钢网站,如何提升网络营销推广One-to-Few Label Assignment for End-to-End Dense Detection阅读笔记 Abstract 一对一#xff08;o2o#xff09;标签分配对基于变换器的端到端检测起着关键作用#xff0c;最近已经被引入到全卷积检测器中#xff0c;用于端到端密集检测。然而#xff0c;o2o可能因为…One-to-Few Label Assignment for End-to-End Dense Detection阅读笔记 Abstract 一对一o2o标签分配对基于变换器的端到端检测起着关键作用最近已经被引入到全卷积检测器中用于端到端密集检测。然而o2o可能因为正样本数量有限而降低特征学习效率。尽管最近的DETRs引入了额外的正样本来缓解这个问题但解码器中的自注意力和交叉注意力计算限制了其在密集和全卷积检测器中的实际应用。在这项工作中我们提出了一种简单而有效的一对少数o2f标签分配策略用于端到端密集检测。除了为每个对象定义一个正锚点和多个负锚点之外我们还定义了几个软锚点(soft anchor)同时充当正负样本。这些软锚点的正负权重在训练过程中动态调整使它们在训练初期更多地贡献于“表示学习”在后期更多地贡献于“重复预测移除”。以这种方式训练的检测器不仅可以学习强大的特征表示还能进行端到端密集检测。在COCO和CrowdHuman数据集上的实验展示了o2f方案的有效性。代码可在以下链接获取https://github.com/strongwolf/o2f。 Introduction (仅记录一些我认为比较重要的句子) During the evolution of object detectors, one important trend is to remove the hand-crafted components to achieve end-to-end detection. One hand-crafted component in object detection is the design of training samples. However, the performance of anchor-based detectors is sensitive to the shape and size of anchor boxes. To mitigate this issue, anchor-free [19,48] and query-based [5,8,34,61] detectors have been proposed to replace anchor boxes by anchor points and learnable positional queries, respectively. Another hand-crafted component is non-maximum suppression(NMS) to remove duplicated predictions. Since NMS has hyperparameters to tune and introduces additional cost, NMS-free end-to-end object detection is highly desired. (由于NMS需要调整超参数并带来额外的成本因此非常希望实现无NMS的端到端对象检测。) With a transformer architecture, DETR [5] achieves competitive end-to-end detection performance. However, o2o can impede the training efficiency due to the limited number of positive samples. Recent studies [7, 17, 22] on DETR try to overcome this shortcoming of o2o scheme by introducing independent query groups to increase the number of positive samples. The independency between different query groups is ensured by the self-attention computed in the decoder, which is however infeasible for FCN-based detectors.最近的研究[7, 17, 22]尝试通过引入独立的查询组来增加正样本数量以克服DETR中一对一o2o方案的这一缺点。不同查询组之间的独立性由解码器中计算的自注意力来保证但这对于基于FCN的检测器来说是不可行的。 In this paper, we aim to develop an efficient FCN-based dense detector, which is NMS-free yet end-to-end trainable. 我们观察到在一对一o2o方案中将语义上类似于正样本的模糊锚点设为完全负样本是不合适的。相反这些锚点可以在训练期间同时用于计算正损失和负损失如果损失权重设计得当不会影响端到端的能力。基于上述观察我们提议为这些模糊锚点分配动态的软分类标签。如图1所示与o2o不同后者将模糊锚点锚点B或C设为完全负样本我们将每个模糊锚点标记为部分正样本和部分负样本。正负标签的程度在训练过程中自适应调整以保持“表示学习”和“重复预测移除”之间的良好平衡。特别是在训练的早期阶段我们开始以较大的正度数和较小的负度数以便网络能更有效地学习特征表示能力而在后期训练阶段我们逐渐增加模糊锚点的负度数以指导网络学习去除重复预测。我们将我们的方法命名为一对少数o2f标签分配因为一个对象可以有几个软锚点。我们将o2f LA实例化到密集检测器FCOS中我们在COCO [29]和CrowHuman [40]的实验表明它实现了与带有NMS的检测器相当甚至更好的性能。 Related Work 在过去的十年里随着深度学习技术[14, 32, 41, 49, 52, 55]的迅猛发展对象检测领域取得了巨大进展。现代对象检测器大致可以分为两种类型基于卷积神经网络CNN的检测器[1, 3, 21, 28, 31, 36-38, 48, 50]和基于变换器的检测器[5, 8, 30, 34, 53, 54, 61]。 2.1. 基于CNN的对象检测器 基于CNN的检测器可进一步划分为两阶段检测器和一阶段检测器。两阶段检测器[3, 38]在第一阶段生成区域提议在第二阶段细化这些提议的位置并预测类别而一阶段检测器[28, 31]直接在卷积特征图上预测密集锚点的类别和位置偏移。早期的检测器大多使用预定义的锚点作为训练样本。由于不同数据集的适宜设置不同必须仔细调整锚点形状和大小的超参数。为了克服这一问题提出了无锚点检测器[19, 48]以简化检测流程。FCOS [48]和CenterNet [10]用锚点替代锚框并直接使用这些点来回归目标对象。CornerNet [20]首先预测对象关键点然后使用关联嵌入将它们组合成边界框。 大多数基于CNN的检测器在训练过程中采用一对多o2m的标签分配方案。早期的检测器如Faster RCNN [38]、SSD [31]和RetinaNet [28]使用IoU作为定义正负锚点的指标。FCOS限制正锚点必须在对象的某些尺度和范围内。最近的方法[11, 18, 23, 57, 59, 60]通常考虑网络预测的质量和分布以更可靠地分配锚点的标签。然而o2m标签分配需要一个后处理步骤即非极大值抑制NMS以去除重复的预测。NMS引入了一个参数来折衷所有实例的精确度和召回率但这对于拥挤场景尤其不理想。在本文中我们的目标是去除基于CNN检测器中的手工NMS步骤实现端到端的密集检测。 2.2. 基于Transformer的对象检测器 作为先驱的基于Transformer的检测器DETR [5] 使用一套可学习的对象查询作为与图像特征互动的训练候选项。它通过使用一对一的二部匹配和全局注意力机制实现了具有竞争力的端到端检测性能。然而DETR在小物体上的性能较差收敛速度慢。许多后续工作[8, 12, 35, 56]旨在改进特征图和对象查询之间的注意力建模机制以提取更相关和精确的特征提升小物体的检测性能。最近的研究[7, 17, 22]表明正样本数量有限是导致DETR收敛缓慢的原因。因此它们引入了几个额外的解码器来增加正样本数量。然而这些方法都基于稀疏候选项其计算成本在进行密集预测时可能难以承受。与这些方法不同我们提出了一种软标签分配方案引入更多的正样本使得端到端密集检测器能够更容易地进行训练。 One-to-Few Soft Labeling 3.1. Ambiguous Anchors o2o仅选择一个anchor作为正样本分配为positive sample而o2m则选取多个anchor作为Positive sample。在o2o和o2m中除了正样本之外的其余锚点都被定义为负样本。 图2中红色为certain anchor绿色为ambiguous anchors Now we have divided the anchors into three groups: one certain positive anchor, a few ambiguous anchors, and the remaining multiple negative anchors. 第一个选项是将一对一o2o改为一对二为每个实例增加一个正样本。第二个选项是为每个模糊锚点分配一个软标签t其中0 ≤ t ≤ 1表示其正样本程度因此1 − t是其负样本程度。我们定义正锚点和负锚点的分类损失分别为−log§和−log(1 − p)其中p是预测的分类得分。那么第二个选项的分类损失将是−t × log§ − (1 − t) × log(1 − p)。在COCO数据集上的检测结果如表1所示我们可以看到即使只增加一个正样本一对二的标签分配方案也会显著降低性能。相比之下为模糊锚点分配合适的软标签可以有效提高端到端性能。软标签分配的细节将在后面的章节中讨论。 上述结果表明使一个模糊锚点同时具有正负属性可能是有效实现端到端密集检测的一个可行方案。因此我们提出了一种一对少数o2f标签分配策略它选择一个确定的锚点作为完全正样本几个模糊锚点同时作为正负样本其余锚点作为负样本。模糊锚点的正负程度在训练过程中动态调整使得网络既能保持强大的特征表征能力又能实现端到端检测能力。 3.2. Selection of Certain Positive Anchor 在我们的方法中每个实例都将选定一个确定的正锚点。之前基于一对一o2o的检测器都使用一个预测感知的选择度量考虑了分类和回归的成本来选择唯一的正样本。我们遵循这一原则并将分类得分和IoU整合进确定锚点的选择度量中其定义为 S i , j 1 [ i ∈ Ω j ] × p i , c j 1 − α × IoU ( b i , b j ) α , S_{i,j} \mathbb{1}[i \in \Omega_j] \times p_{i,c_j}^{1-\alpha} \times \text{IoU}(b_i, b_j)^\alpha, Si,j​1[i∈Ωj​]×pi,cj​1−α​×IoU(bi​,bj​)α, 其中 S_{i,j} 表示锚点i和实例j之间的匹配得分c_j 是实例j的类别标签p_{i,c_j} 是锚点i属于类别 c_j 的预测分类得分b_i 是锚点i的预测边界框坐标b_j 表示实例j的坐标而 \alpha 控制分类和回归的重要程度。当锚点i的中心点在实例j的中心区域 \Omega_j 内时空间指示器 1[i \in \Omega_j] 输出1否则输出0。这种空间先验在基于o2o和o2m的方法中被普遍使用因为观察到实例中心区域的锚点更有可能是正样本。 锚点可以根据度量 ( S_{i,j} ) 进行降序排序。之前的研究通常将正锚点选择问题构建为一个二分匹配问题并使用匈牙利算法解决。为了简化在本研究中我们直接为每个实例选择得分最高的锚点作为确定的正锚点。 3.3. Label Assignment for Ambiguous Anchors 除了确定的正锚点之外我们根据得分 S i , j S_{i,j} Si,j​选择排名前K的锚点作为模糊锚点因为它们与确定的正锚点有相似的语义上下文。为了减少重复预测的可能性我们为这些模糊锚点分配动态软标签。假设我们训练网络N个周期在第j个周期中每个模糊锚点i的分类损失定义为 l i j − t i j × log ⁡ ( p i ) − ( 1 − t i j ) × log ⁡ ( 1 − p i ) l_i^j -t_i^j \times \log(p_i) - (1 - t_i^j) \times \log(1 - p_i) lij​−tij​×log(pi​)−(1−tij​)×log(1−pi​) 除了确定的正锚点我们基于得分 (S_{i,j}) 选择排名前K的锚点作为模糊锚点因为它们与确定的正锚点有相似的语义环境。为了降低重复预测的可能性我们为这些模糊锚点分配动态软标签。假设我们训练网络进行N个周期每个模糊锚点i在第j个周期的分类损失定义为 l i j − t i j × log ⁡ ( p i ) − ( 1 − t i j ) × log ⁡ ( 1 − p i ) , l_i^j -t_i^j \times \log(p_i) - (1 - t_i^j) \times \log(1 - p_i), lij​−tij​×log(pi​)−(1−tij​)×log(1−pi​), (随着epochs的增加 l i j l_i^j lij​逐渐的就只等于 − ( 1 − t i j ) × log ⁡ ( 1 − p i ) - (1 - t_i^j) \times \log(1 - p_i) −(1−tij​)×log(1−pi​)) 其中 (p_i) 是锚点i的预测分类得分(t_i^j) 和 (1 - t_i^j) 分别是该锚点在第j个周期的正负程度即损失权重。(t_i^j) 的动态定义为 t i j p i max ⁡ k p k × T j , t_i^j \frac{p_i}{\max_k p_k} \times T_j, tij​maxk​pk​pi​​×Tj​, T j T m i n − T m a x N − 1 × j T m a x , T_j \frac{T_{min} - T_{max}}{N - 1} \times j T_{max}, Tj​N−1Tmin​−Tmax​​×jTmax​, 其中 (T_j) 是一个随时间变化的变量它在第j个周期为所有样本分配相同的值(T_{max}) 和 (T_{min}) 控制模糊锚点在第一个周期和最后一个周期的degree。我们将损失权重与分类得分呈正相关考虑到预测得分较高的锚点应该更多地贡献于正信号。直接使用 ( p_i ) 作为权重会使得在难样本上的训练变得不稳定因为这些样本的预测得分远小于简单样本的得分。因此我们使用 ( p_i ) 与最大得分的比率来规范化不同样本的权重至同一尺度。动态调整 ( T_j ) 是很重要的因为它在不同的训练阶段控制着“特征学习”与“重复预测移除”之间的平衡。 在训练的早期阶段我们设置 (T_j) 相对较大以引入更多的正监督信号以进行表示学习从而使网络能够迅速收敛到一个稳健的特征表示空间。随着训练的进行我们逐渐减少模糊锚点的正度以便网络学会去除重复的预测。 3.4. Network Structure 我们将提出的一对少数o2f标签分配策略应用到FCOS上这是一个典型的全卷积密集检测器。网络结构如图3所示。检测头由两个平行的卷积分支组成每个特征金字塔网络FPN层的输出都连接一个分支。一个分支预测大小为 ( H × W × C H \times W \times C H×W×C) 的得分图其中 (C) 是数据集中的类别数(H) 和 (W) 分别是特征图的高度和宽度。另一个分支预测大小为 ( H × W × 4 H \times W \times 4 H×W×4) 的位置偏移图和大小为 ( H × W × 1 H \times W \times 1 H×W×1) 的中心度图。我们按照之前的工作将中心度图与分类得分图相乘作为最终的分类-交并比联合得分。 Centerness map是FCOSFully Convolutional One-Stage Object Detector中用于提高检测性能的一个概念。它是一个得分用来表示一个位置相对于其目标边界框中心的偏离程度。这个得分用于在非极大抑制NMS过程中下调低质量边界框的权重以抑制这些低质量的检测结果。Centerness得分是通过与边界框回归分支平行的一个分支只有一层来预测的这个简单而有效的centerness分支能够显著提高检测性能而计算时间的增加微不足道 对于每个实例我们选择一个确定的正锚点和 (K) 个模糊锚点。其余的锚点被设置为负样本。分类分支的训练目标为每个实例定义如下 L c l s B C E ( p c , 1 ) ∑ i ∈ A B C E ( p i , t i ) ∑ i ∈ B F L ( p i , 0 ) L_{cls} BCE(p_c, 1) \sum_{i \in A} BCE(p_i, t_i) \sum_{i \in B} FL(p_i, 0) Lcls​BCE(pc​,1)∑i∈A​BCE(pi​,ti​)∑i∈B​FL(pi​,0) 其中 (p_c) 是单个确定锚点的分类得分(A) 和 (B) 分别代表模糊锚点和负锚点的集合。BCE表示二元交叉熵损失FL表示焦点损失。回归损失定义为 L r e g ∑ i ∈ B G I o U ( b i , b g t ) L_{reg} \sum_{i \in B} GIoU(b_i, b_{gt}) Lreg​∑i∈B​GIoU(bi​,bgt​) 其中GIoU损失是基于广义交并比的位置损失(b_i) 是锚点 (i) 的预测位置(b_{gt}) 是与锚点 (i) 对应的GT对象的位置。请注意我们对正锚点和模糊锚点都应用了回归损失。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/90352.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

国内外知名建设设计网站海兴县网站建设公司

点击上方亿元程序员关注和★星标 引言 大家好,我是亿元程序员,一位有着8年游戏行业经验的主程。 本系列是《和8年游戏主程一起学习设计模式》,让糟糕的代码在潜移默化中升华,欢迎大家关注分享收藏订阅。 享元模式&#xff08…

网站开发免费课程建设项目竣工环保验收公示网站

一:背景 类加载机制是在我们的真个java的运行阶段中的其中一个阶段。 二:什么是快乐星球(类加载机制) 我们编写的 Java 文件都是以.java 为后缀的文件,编译器会将我们编写的.java 的文件编译成.class 文件,简单来说类加载机制就是jvm从文件系统将一系…

网站信息建设总结网站内容有什么

NLP 一、什么是自然语言处理(NLP)二、NLP的发展三、相关理论1 语言模型2 词向量表征和语义分析3 深度学习 一、什么是自然语言处理(NLP) 什么是自然语言处理 二、NLP的发展 三、相关理论 1 语言模型 序列数据形式多样&#xf…

牡丹江哈尔滨网站建设做网站用什么ps软件

🎈 博主:一只程序猿子 🎈 博客主页:一只程序猿子 博客主页 🎈 个人介绍:爱好(bushi)编程! 🎈 创作不易:喜欢的话麻烦您点个👍和⭐! 🎈…

大学电子商务网站建设网页设计的类型有哪些

一,继承 前面我们将项目拆分成各个小模块,但是每个小模块中有很多相同的依赖于是我们创建一个父工程将模块中相同的依赖定义在父工程中,然后子工程继承父工程Maven作用:简化依赖配置,统一依赖管理,可以实现多重继承像J…

房地产网站开发毕业设计个人介绍网页

名字叫:公益大米网​​​​​​​ Freerice 这个网站是以做题的形式来记忆单词,题干是一个单词,给出4个选项,需要选出其中最接近题干单词的选项。 答对可以获得10粒大米,网站的创办者负责捐赠。如图 触发某些条件&a…

挂别人公司做网站可以吗免费网站100m

01 背包 题目描述:有n件物品和一个最多能背重量为w 的背包。第i件物品的重量是weight[i],得到的价值是value[i] 。每件物品只能用一次,求解将哪些物品装入背包里物品价值总和最大。 二维dp数组01背包: 确定dp数组以及下标的含义 …

做的好看的网站高端h5网站开发

上回我们说了下文件下载的方式有哪些,这次我们从不同的环境下简单来说说文件上传的方式有哪些。文件上传的方式Servlet2.5 方式Servlet3.0 方式SpringMVC 方式案例实操Servlet2.5 方式文件上传涉及到前台页面的编写和后台服务器端代码的编写,前台发送文件…

怎么制作营销网站福田网站建设推荐

目录 前言:一、左值引用和右值引用1.1 什么是左值和左值引用1.2 什么是右值和右值引用 二、左值引用和右值引用比较三、右值引用使用场景3.1 传值返回使用场景3.2 移动构造3.3 移动赋值3.4 STL容器接口也增加右值引用3.5 完美转发 前言: 引用是给对象取…

做网站app删除wordpress 后台

事务特点 Redis 事务可以一次执行多个命令, 并且带有以下三个重要的保证: 批量操作在发送 EXEC 命令前被放入队列缓存。 收到 EXEC 命令后进入事务执行,事务中任意命令执行失败,其余的命令依然被执行。不具备原子性。 在事务执…

北京怀柔网站制作摄影师常用的网站

C:迭代器的封装思想 list迭代器实现反向迭代器实现 本博客将通过实现list的迭代器,以及它的反向迭代器,来帮助大家理解迭代器的底层逻辑,以及封装思想。 list迭代器实现 迭代器是一个遍历容器的工具,其可以通过自增自…

网上商城网站建设方案网站分栏目怎么做

文 | sliderSun源 | 知乎NLP模型的大小不断增加,随之而来的是可用性降低,TinyBERT,MobileBERT,和DistilBERT都提出了一个独特的知识蒸馏框架,其共同目标是在保持性能的同时减小模型大小。尽管所有这些方法都以各自的方…

余姚做网站哪家好易语言 做网站

1、强引用(StrongReference) 强引用不会被GC回收,并且在java.lang.ref里也没有实际的对应类型。举个例子来说:     Object obj new Object();     这里的obj引用便是一个强引用,不会被GC回收。 2、软引用&…

改变网站字体索引擎优化 seo

嘛,说实话,现在才开始,实在是有点晚了,一不小心大学都过去1年了_(:3 」∠)_ 我在专业方面的起步也是相当晚的,身为计算机专业,编程却从大学才开始正式接触,进入大学时其他方面的能力也都约等于0…

西安机场商务宾馆百度做网站哈尔滨百度网站快速优化

总的来说就是,由两台以上的路由器组成一个HSRP组,在该组之中选举一台路由器作为Active路由器,一台路由器作为Standby路由器,其它路由器则进入Listen状态。实际工作时,是由Active路由器去转发数据,一旦Activ…

哪些网站有好的营销案例重庆市建设施工安全网

docker仓库登录及配置insecure-registries的方法 这篇文章主要介绍了docker仓库登录配置insecure-registries的方法,docker客户端如果配置中添加了insecure-registary配置,就不需要在docker 客户端配置上对应证书,如果不配置要在/etc/docker/certs.d/目…

站长号小程序赚钱的几种方法

对于需要大量翻译的数据,人工翻译太慢,此时需要使用软件进行批量翻译。1.使用360的翻译def fanyi_word_cn(string):url"https://fanyi.so.com/index/search"#db_path ./db/tasks.dbForm_Data {}#这里输入要翻译的英文Form_Data[query] string…

网站开发制作流程ppt精美模板

目录 1 问题2 问题分析3 解决过程3.1 确保Pillow库存在3.2 迷惑阶段3.3 解决问题 4 希望大佬解答 1 问题 今天做了一个使用Python写的脚本文件.py,打算把它转换成.exe文件。点击生成的exe文件时,出现了如下弹窗。 2 问题分析 根据错误描述&#xff1…

网站怎么做域名跳转青岛知名网站建设公司排名

我想从Oracle的nashorn JavaScript引擎中调用一个带有 char[] 输入参数的Java函数(非数组参数类型的函数对我来说没问题) .如果我用JavaScript字符串文字调用Java函数,nashorn balksjavax.script.ScriptException: TypeError: Can not invoke method[jdk.internal.d…

免费网站建站 知乎做二手房又做网站的

一、对于三相电源线的电动机,反转只需要任意的交换两根电源线即可 二、例如接通KM1对应正转的话,则接通KM2则对应反转 三、电机正转按钮及其对应的地址 四、电机反转按钮及其对应的地址 五、电机停止按钮及其对应的地址 六、正转的接触器线圈 七、反转的…