石家庄站列车时刻表wordpress数据库注入
石家庄站列车时刻表,wordpress数据库注入,重庆网站推广免费软件,python可以用来干什么RevCol#xff1a;解决深度学习信息从低层#xff08;输入#xff09;传递至高层#xff08;输出#xff09;的过程中#xff0c;信息会逐层丢失问题 学习解耦表示可逆列网络#xff08;RevCol#xff09;子特征1#xff1a;多级可逆单元子特征2#xff1a;可逆列架构… RevCol解决深度学习信息从低层输入传递至高层输出的过程中信息会逐层丢失问题 学习解耦表示可逆列网络RevCol子特征1多级可逆单元子特征2可逆列架构的宏观设计子特征3微观设计调整子特征4中间监督 联想 小目标涨点YOLO v5 魔改YOLO v7 魔改YOLO v8 魔改YOLO v9 魔改 论文https://arxiv.org/pdf/2212.11696.pdf
代码https://github.com/megvii-research/RevCol 传统的深度学习模型遵循信息瓶颈原则在层与层之间传递信息时会逐步压缩与目标无关的信息。
在深度学习中有一个常见的问题当我们训练模型识别图片或者处理信息时模型往往只关注于对当前任务有用的信息而忽略其他可能对将来任务有用的信息。
这就像是在读书时只记住了考试要考的知识点但对书中其他有趣或有用的内容视而不见。
虽然短期内这样做可以帮助我们通过考试但长期来看我们可能会错过很多重要的知识。
类于交通系统中的立交桥设计。在繁忙的城市中不同方向的车辆流需要高效地交织而不互相干扰。
立交桥通过不同层级的道路允许车辆在不同方向上流动从而避免了交叉路口的拥堵和潜在冲突。
同样地在深度学习网络中信息需要在不同的层级类似于不同的道路层级之间流动。
传统的神经网络结构比如简单的前馈网络就像一个没有立交桥的交通系统信息流车辆只能一层层单向传递这可能导致信息的堵塞和丢失交通拥堵。
RevCol网络中的融合模块则像是在这些层级之间建立了立交桥允许信息在高分辨率和低分辨率的层级之间自由流动车辆在不同层级间行驶从而减少了信息丢失并增加了网络对信息的处理能力。
传统的卷积神经网络CNNs在信息流动方面就类似于普通道路系统信息车辆从输入层起点一直传递到输出层终点中间的每一层只能接收到前一层的信息难以直接获取到后面层的反馈。
我们得设计一个立交桥网络允许信息不仅向前传递也可以从后续层返回到前面的层就好比车辆在立交桥中可以自由地改变方向从而提高了整个网络处理信息的灵活性和效率。 如果我们能在学习时不仅仅记住考试内容还能把书里的其他知识也整理归档那么我们就能在需要时随时取用这些知识。
目标让模型学会把信息分门别类地存储既能记住对当前任务重要的知识也能保存可能对未来任务有用的信息。
这种方法通过一个叫做可逆列网络RevCol的结构来实现。
RevCol就像一个高效的图书馆它不仅能保存书中的所有内容还能按照不同的主题将它们分类。
在这个图书馆里信息是通过一系列的“列”进行管理的每一列都负责存储一种类型的信息。
通过特殊的技术这些列之间能够互相传递信息而不会丢失任何细节。
这种方法使得模型在学习时能够更全面地理解和保存信息不仅仅局限于当前任务也为处理将来可能遇到的问题做好了准备。 图1(a)展示的是传统的单列网络比如一个普通的深度神经网络其中输入数据经过多个层Layer 1, 2, 3, …, N处理后得到输出结果。
每层都对输入数据进行某种形式的转换并且随着层级的深入通常会丢失一些信息。
图1(b)展示的是RevCol网络它包括多个列Col 1, 2, 3, …, N每个列都处理输入数据并且通过可逆连接由红色曲线标识在列之间传递信息。
这种设计试图在不同列之间保持信息确保即使在深层次也能保留低级接近输入和高级语义特征。
黄色表示低级信息蓝色表示高级语义信息。
学习解耦表示
采用可逆列网络RevCol RevCol的设计通过N个具有相同结构但权重不同的子网络列组成每个列接收输入的一个副本并生成预测从而在每个列中存储从低级到高级语义表示的多级嵌入。 通过引入可逆变换无损地将多级特征从第i列传递到第i1列从而预测输入的最终解耦表示。 为什么使用RevCol由于问题的特征在于传统深度学习模型在特征传递过程中损失了大量信息RevCol通过可逆变换保证信息无损传递同时提供从低级到高级的多级语义表示。
引入新型的可逆多级融合模块
新型可逆多级融合模块解决了传统RevNets的两个主要缺陷特征图形状的限制和最后两个特征图必须同时包含低级和高级信息的问题。为什么使用这个子解法这个新型模块能够更灵活地处理不同形状的特征图并允许更有效地优化网络避免了与信息瓶颈原则相冲突的问题。
与信息瓶颈原则下的传统深度学习模型不同这种方法不是简单地抛弃与目标无关的信息而是力图在保留尽可能多的输入信息的同时将任务相关的概念或语义词嵌入到几个分离的维度中。
这种方式更贴近于生物细胞的机制每个细胞虽然含有整个基因组的完整副本但不同细胞的基因表达强度不同类似地在计算视觉任务中也理应保留高级语义表示的同时保持其他维度中的低级信息。
可逆列网络RevCol
如何在不丢失信息的前提下实现特征的解耦和高效传递。 多级可逆单元想象把信息分成好几层每一层都处理不同类型的信息比如一层专注于颜色另一层专注于形状。我们用一种特殊的方法让这些信息层之间相互传递信息但不会丢失任何东西就像魔术一样。 可逆列架构我们把网络分成多个部分列每个部分都用上面提到的魔术方法处理信息。这样我们可以在不同的部分专注于不同的任务比如一部分识别猫另一部分保留背景信息。 微观设计调整为了让这一切工作得更好我们对网络的一些基础部件做了细微调整比如改变一些参数以确保信息在传递过程中不会被扭曲。 中间监督我们在网络的不同部分加入了额外的监督这就像是给学生额外的测验以确保他们在学习过程中没有走偏。这有助于网络更好地保留和利用信息。
可逆列网络RevCol就像是一个高效的学习机器不仅能学会识别猫和狗还能在这个过程中保留大量的其他有用信息。
这种方法让网络更加强大和灵活适用于多种不同的任务。 图2(a)展示的是RevNet中的一个可逆单元的例子这是构建RevCol网络的基础。
这里显示了如何在不丢失任何信息的情况下将输入xt通过一系列函数Ft-1, Ft-2, …, Ft-4转换为输出xt-5。
图2(b)是一个简化的多级可逆单元展示了如何在网络的不同层级Level 1, 2, 3, 4之间传递和转换信息。
图2©展示了整个可逆列网络架构的概览包括多个列和每个列的多个层级。
在不同层级上的中间监督Intermediate Supervision有助于训练过程中信息的保存和优化。 在RevCol网络中传统的可逆结构如RevNet和非可逆的多列结构如HRNet都存在限制包括严格的特征维度约束和信息损失问题。
特别是在进行多任务学习时信息的保留对于模型的泛用性非常关键。
RevCol 可逆操作的引入 融合模块的设计 中间监督的加入
子特征1多级可逆单元
实现方式通过扩展可逆变换方程实现了特征的无损解耦传递。每m个特征图分为一组通过可逆变换在组内进行信息传递确保了信息的无损。选择原因该方法可以在不同的语义层次或分辨率中使用不同形状的张量来表示特征解决了特征维度强约束的问题并易于与现有网络架构协作。
子特征2可逆列架构的宏观设计
实现方式RevCol通过多个子网络和可逆连接进行特征解耦使用多级可逆单元简化输入每个子网络处理图像分割成的非重叠块提取多级特征图进行信息传递。选择原因这种宏观设计允许在不同任务中灵活使用高级和低级特征通过可逆连接减少信息损失提升模型的泛化能力。
子特征3微观设计调整
实现方式调整了卷积块和引入融合模块以兼容宏观架构。包括修改卷积核大小采用可学习的可逆操作γ优化网络稳定性和训练速度。选择原因微观设计调整使得原始的ConvNeXt块与RevCol的宏观设计兼容提高了模型的精度和训练效率同时保持网络的稳定性。
融合模块的设计
实现方式设计了一个新型的融合模块以支持不同分辨率的特征融合同时避免了传统可逆网络的严格特征维度约束。选择原因这解决了传统结构中特征维度强制匹配的问题使得网络设计更灵活可以在不同分辨率间更好地融合特征。
引入融合模块优化信息流动 解决方案设计了一种融合模块结合了向上采样和向下采样的特点以便在不同层级间更有效地传递信息。 选择原因传统的网络在传递过程中可能会导致信息的损失尤其是在高分辨率和低分辨率特征间的转换。 融合模块通过将低分辨率的特征向上采样同时将高分辨率的特征向下采样并将它们融合以保持信息流动的连续性和完整性从而提高网络的整体性能。 这样的设计使得在深层网络中的每一级都能获得丰富的上下文信息增强了模型的表示能力。
子特征4中间监督
实现方式在网络的前几列添加额外的监督通过优化二元交叉熵重建损失和分类损失以减少信息丢失提高特征的质量和网络的性能。选择原因中间监督可以在列间迭代时维持信息减少信息在列内的丢失提升网络对输入图像和预测之间互信息的下界从而提高性能。
RevCol通过引入多级可逆单元和宏观设计调整实现了特征的无损解耦传递。
微观设计的调整和中间监督的加入进一步优化了模型的训练效率和性能。
这些设计选择都是为了解决深度学习中特征传递与学习过程中的信息损失问题确保了模型在处理不同任务时的灵活性和高效性。
联想
何时使用 - 可逆列网络RevCol当你需要一个能够在保留重要特征的同时减少信息损失的网络时RevCol是一个合适的选择。特别是在下游任务可能需要原始输入数据中不同层次信息的场景如迁移学习、多任务学习或是领域适应。
RevCol到每个子解法
可逆连接类似于解压缩算法保留所有信息即使在数据经过多个处理层后。融合模块像城市交通枢纽允许信息在不同层级间有效转换防止信息丢失。中间监督相当于考试过程中的阶段测试确保网络在学习过程中不偏离目标。
以融合模块为例如果我们考虑将其替换为注意力机制注意力机制允许模型专注于输入数据的最重要部分类似于人类在观看场景时会自然地注意到最有意义的部分。
对比分析融合模块通过物理地在网络中融合不同层级的特征来保留信息而注意力机制则是通过赋予不同特征不同的权重来实现。
融合模块可能会在保持空间信息方面更有效因为它们允许不同分辨率的特征直接合并。
另一方面注意力机制在确定哪些信息最相关时可能更加灵活和有效因为它可以根据上下文动态调整不同特征的重要性。
信息保持融合模块通过直接合并来自不同层次的特征能够保持丰富的空间信息。这是特别有用的比如在处理图像的局部细节时这些局部细节可能在高层次的抽象中丢失。信息选择注意力机制能够选择性地强调网络应该关注的信息部分。在RevCol中这可以用来动态调整网络在不同列和层级中传递的特征的权重。
结合这两个概念我们可以创建一个新的融合模块其中包含注意力机制使模型能够通过融合模块保持来自不同层的详细信息。
具体的改进点包括
加权融合在融合模块中不同层级的特征图在合并前首先通过注意力机制进行加权。
这意味着每个特征图不是简单地被物理合并而是根据其对最终任务的相关性赋予了一个权重。
这允许模型更加关注对当前任务最有用的信息类似于人类视觉系统会集中注意力于最重要的细节。
多尺度注意力设计一个可以处理来自不同尺度即分辨率的特征图的注意力机制。
这样的机制可以在更广泛的上下文中评估信息的相关性不仅仅是在单个层级内。
例如一个来自较低层的特征图较低级的特征如边缘或纹理可能对某个具体任务是至关重要的而这一点可能在高层次的抽象特征中不是那么明显。
小目标涨点
更新中…
YOLO v5 魔改
YOLO v7 魔改
YOLO v8 魔改
YOLO v9 魔改
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/87758.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!