南山网站公司石家庄p2p网站开发

news/2025/9/22 22:00:19/文章来源:
南山网站公司,石家庄p2p网站开发,做网站每天任务及实训过程,wordpress 3栏 主题1.论文介绍 MAS-SAM: Segment Any Marine Animal with Aggregated Features MAS-SAM#xff1a;利用聚合特征分割任何海洋动物 Paper Code(空的) 2.摘要 最近#xff0c;分割任何模型#xff08;SAM#xff09;在生成高质量的对象掩模和实现零拍摄图像分割方面表现出卓越…1.论文介绍 MAS-SAM: Segment Any Marine Animal with Aggregated Features MAS-SAM利用聚合特征分割任何海洋动物 Paper Code(空的) 2.摘要 最近分割任何模型SAM在生成高质量的对象掩模和实现零拍摄图像分割方面表现出卓越的性能。然而作为一种通用的视觉模型SAM主要是用大规模自然光图像训练的。在水下场景中由于光的散射和吸收它表现出显著的性能下降。同时SAM 解码器的简单性 可能会导致丢失细粒度的对象细节。为了解决上述问题我们提出了一种新的特征学习框架MAS—SAM的海洋动物分割其中包括整合有效的适配器到SAM的编码器和构建一个金字塔解码器。更具体地说首先建立了一个新的SAM的编码器与有效的适配器的水下场景。然后介绍了一个超映射提取模块Hypermap Extraction ModuleHEM以产生多尺度的功能全面的指导。最后提出了一个渐进预测解码器PPD聚合的多尺度特征和预测最终的分割结果。当嫁接融合注意力模块FAM我们的方法能够提取更丰富的海洋信息从全球上下文线索细粒度的局部细节。 Keywords适配器SAM金字塔解码器分割海洋动物LoRA微调 3.Introduction 海洋动物分割MAS是视觉智能和水下机器人领域中的关键和基本任务。它旨在从水下图像或视频中识别和分割海洋动物。从功能上讲海洋动物的准确分割对于包括海洋生物学、生态学和保护在内的各个研究领域都非常重要。但水下环境的特点是复杂的光散射和吸收效应导致图像质量下降对比度降低和物体模糊。此外海洋动物往往表现出伪装的属性这进一步复杂的分割任务。为了应对这些挑战需要先进的感知技术。 最近SAM提出并在一般的分割任务上已显示出巨大的潜力。然而SAM的训练场景主要涉及自然光照条件这限制了其在水下环境中的性能。此外SAM中过于简单的解码器结构缺乏生成细粒度分割结果的能力。 考虑到上述事实在这项工作中本文提出了一种新的基于SAM的特征学习框架命名为MAS-SAM海洋动物分割。更具体地说通过冻结SAM的编码器的预训练参数并引入有效的适配器我们建立了一个Adapter-informed SAM编码器ASE从海洋动物图像中提取特征。此外我们还构造了一个超映射提取模块HEM用于从新SAM的编码器中提取多尺度特征映射。它为后续的掩模预测过程提供了全面的指导。为了改进SAM的解码器我们引入了渐进预测解码器PPD来聚合来自原始提示、ASE和HEM的特征。当与融合注意力模块FAM嫁接时我们的PPD可以优先考虑多粒度特征图的重要性并从全局上下文线索中提取更丰富的海洋信息以获得细粒度的局部细节。 4.网络结构详解 本文提出的框架MAS-SAM的整体结构。它由三个主要部分组成适配器通知SAM编码器ASE、超映射提取模块HEM和渐进预测解码器PPD。 适配器通知SAM编码器Adapter-informed SAM Encoder 保留了原始SAM的核心组件并利用两个参数高效的微调机制来改进预训练的编码器。如上图所示我们将LoRA 和适配器分别输入到每个Transformer块的多头自注意MHSA和前馈网络FFN中。更具体地令Xi ∈ RN×D为第i个Transformer块的输入。这里N是令牌的数量D表示嵌入维数。由LoRA修改的MHSA层可以表示如下 其中Wq、Wk和Wv分别是用于生成原始查询、关键字和值矩阵的三个线性投影层的权重。 W q , v d o w n ∈ R M × D W^{down}_{q,v} ∈ R^{M×D} Wq,vdown​∈RM×D和 W q , v u p ∈ R M × D W^{up}_{q,v} ∈ R^{M×D} Wq,vup​∈RM×D分别是两个线性投影层的权值用于降低和恢复特征维数其中M是向下映射的维度。通过这种方式可以冻结预训练的权重Wq、Wk和Wv和利用秩分解矩阵来大大减少可训练参数的数量。 此外我们将一个适配器插入到FFN中如下所示 其中LN和MLP代表层归一化LN和多层感知器MLP。σ是ReLURectified Linear Unit。 W a d p t d o w n ∈ R P × D W^{down}_{adpt} ∈ R^{P×D} Wadptdown​∈RP×D和 W a d p t u p ∈ R P × D W^{up}_{adpt} ∈ R^{P×D} Wadptup​∈RP×D分别是两个线性投影的权值用于降低和恢复特征维数。P是向下投影维度。与LoRA类似通过采用极低的参数P值可以实现参数有效的微调以使预训练的SAM的编码器适应海洋场景。 超地图提取模块 由于复杂的水下环境利用局部的细节和全局的背景下鲁棒性和准确的MAS十分重要。不同的Transformer层捕获不同级别的语义通常浅层保留更多的局部细节深层表达更多的上下文信息。因此为了使我们提出的模型利用更丰富的海洋信息提出了一个超地图提取模块HEM考虑ASE的多尺度特征地图。然后它作为后续掩模预测过程的综合指导。更具体地说我们首先将图像 I ∈ R H × W × 3 I ∈ R^{H×W×3} I∈RH×W×3送入ASE(编码器)并获得不同Transformer层的输出。在这项工作中我们选择了3-6-9-12层并得到多尺度表征特征即Xii 36912。然后我们将它们重塑为空间特征映射 F i ∈ R H / 16 × W / 16 × D F_i ∈ R^{H/16×W/16×D} Fi​∈RH/16×W/16×D。为了同时考虑这些多尺度特征图我们执行以下特征聚合 其中ϕ1×1和ϕ3×3分别是具有1×1和3×3核的卷积层。为了提高训练的稳定性在卷积层之后引入了批归一化(BN)和RELU激活函数。[·]是通道中的级联。 然后我们引入通道注意层以生成超映射Hj如下所示 其中GAP是全局平均池(GAP)δ是Sigmoid函数ψ2×2是具有2×2核的反卷积层。这样可以获得多比例尺的超图。这些超地图在提高MAS的性能方面起着至关重要的作用。 渐进预测解码器 由于海洋动物的外观变化很大SAM中简单的解码器设计很难实现准确的分割掩模。为此提出了一种渐进预测解码器(PPD)来有效地提高预测能力。它具有金字塔结构从原始提示、ASE和HEM中逐步聚合多源特征并获得最终的分割预测。 如上图所示提出了一个融合注意力模块FAM来完全聚合多源特征。更具体地说我们开始对来自ASE的特征进行上采样并将输入特征缩放为相同的大小。然后我们将它们融合如下 其中Ui是通过利用双线性插值Φ的上采样特征。Dj是所提出的PPD中的第j个金字塔级的输出。对于FAM我们利用通道注意力来优先考虑多源功能的重要性。还部署了残差结构以加强代表能力。该过程可以表述为 GMP是Global Max PoolingGMP。通道权重可以突出相关特征并抑制不相关特征。同时我们的FAM所采用的注意力机制有助于捕捉不同尺度的特征之间的复杂关系从而产生更连贯和信息量更大的特征表示。因此FAM可以有效地集成和细化多源功能。 最后为了实现渐进式预测我们构建了与FAM嫁接的PPD如下所示 其中Pj是第j个金字塔级的预测掩码。PPD推进原始提示ASE和HEM的无缝聚合从而产生更丰富的海洋信息从全局上下文线索细粒度的局部细节。 为了进一步改善预测结果我们在不同阶段进行所有预测并生成最终预测如下所示 通过金字塔结构和FAM的协同使用我们的MAS-SAM可以有效地利用各种信息并为各种海洋动物形状和大小产生高度精细和详细的分割掩模。 损失函数 从三个层面进行深度监管像素级监督二进制交叉熵损失、区域级监督SSIM损失和全局级监督IoU损失。因此我们将Lf或Lj定义为具有三项的组合损失 其中Lf和Lj分别是最终预测和第j级输出的损失。 问题 代码也没公开中间的cross attention没有提CMP也没有提应该是最后金字塔解码器的每一级输出到最终输出P的过程。 文章提到解码器接收原始提示、ASE编码器和HEM的特征但实际上只接收了HEM的Hi和ASE的Fi进行上采样处理并没有接收原始提示应该是ASE编码器与原始提示也就是默认提示因为文章没有对提示编码器进行更改的最终输出进行cross attention作为D0。 总体来说创新点在于SAM中增加LoRA和适配器微调而冻结原SAM的图像编码器增加了超地图提取模块把编码器的不同层特征提出来进行处理解码器金字塔型增加接收不同层的特征。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/910517.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

平度网站制作广州专业网站制作哪家专业

码元:一个固定时长的信号波形,代表不同离散数值的基本波形 1码元可以携带多个比特的信息量 例如:下图就称为二进制码元,因为只有两种状态,一种代表0状态,一种代表1状态 还有其他进制码元 时长称为码元宽…

2025年华为杯C题|围岩裂隙精准识别与三维模型重构|思路、代码、论文|持续更新中.... - 实践

2025年华为杯C题|围岩裂隙精准识别与三维模型重构|思路、代码、论文|持续更新中.... - 实践2025-09-22 21:55 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !importa…

9.22每日总结

今天急性胃炎发作,请了一天病假,远程完成了一些课程任务、课上练习和作业

算法人生

算法人生 算法与人生,看上去没有什么联系,其实不然。人生是由若干指令(去吃饭、去睡觉、去工作等)组成的有穷序列。 算法有零个或多个由外部提供的量作为算法的输入。人从生下来开始就不断地接收来自于自然界、社会各…

c++ 线程 单例模式

1 #include <iostream>2 #include <cstdio>3 #include <cstdlib>4 #include <cstring>5 #include <mutex>6 #include <thread>7 using namespace std;8 9 #define ll long long 1…

网站开发入无形资产摊销几年个人主页设计图

当下降本增效是各行各业的主题&#xff0c;而 SaaS 应用作为更快触达和服务业务场景的方式则被更多企业熟知和采用。随着国内 SaaS 商业环境的逐渐成熟&#xff0c;传统企业中各个部门的工程师和管理者&#xff0c;能迅速决定采购提升效率的 SaaS 产品&#xff0c;然后快速投入…

南昌的网站设计wordpress婚庆模板

数据类型与作用域练习 1、选择题 1.1、以下选项中,不能作为合法常量的是 ___b_______ A&#xff09;1.234e04 B&#xff09;1.234e0.4 C&#xff09;1.234e4 D&#xff09;1.234e0 1.2、以下定义变量并初始化错误的是______d_______。 A) char c1 ‘H’ &am…

学校网站用途哈尔滨建站哪个好

众所周知&#xff0c;在IOS微信小程序不支持虚拟支付&#xff0c;一直是困扰IOS开发者、运营最头疼的问题&#xff0c;主要原因是苹果不允许IOS微信上架这类产品。导致微信小程序的开发者在IOS上都不能支付虚拟商品&#xff0c;虚拟商品包含了虚拟课程、会员、虚拟书等。 那么…

网站建设运营合同模板招标网查询

文章目录 1、什么是消息队列&#xff1f;2、消息队列有哪些使用场景&#xff1f;&#xff08;为什么使用消息队列&#xff09;2.1 应用解耦2.2 流量削峰2.3 异步处理2.4 消息通讯2.5 远程调用 3、消息队列如何解决消息丢失问题&#xff1f;3.1 生产者保证消息不丢失3.2 存储段不…

海淀网站建设电话合肥建站公司有哪家招聘的

HTML 5已经成为Web开发者当中最流行的语言之一&#xff0c;“健壮的”语言有很大的生产优质万维网内容的能力。HTML 5在近三年的增长迅猛&#xff0c;新引入HTML 5的技术更加的优秀。HTML 5技术被现代浏览器所支持&#xff0c;如Chrome、Firefox、Internet Explorer等等。而今天…

上海聚众网站建设公司joomla网站如何加入会话功能

【-1】写在前面 以下内容文字描述来自于 王爽老师的《汇编语言》教材&#xff0c;建议大家都买一本&#xff0c;哈哈。不是我打广告&#xff0c;确实人家写的好&#xff0c;应该支持。我只是附上了自己的图片和理解而已。 【0】先上干货 只修改ip&#xff0c;称为段内转移&a…

【51单片机】【protues仿真】基于51单片机PM2.5温湿度测量蓝牙架构

【51单片机】【protues仿真】基于51单片机PM2.5温湿度测量蓝牙架构pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "…

下载网站建设匿名留言墙 wordpress

一般搜索都是调后端的接口&#xff0c;绑searchValue字段&#xff08;也有可能叫其他的字段名&#xff09;&#xff0c;通过后端的接口进行实时搜索 如果由前端自己实现搜索过滤的话也简单 1、input事件 <el-inputv-model"queryParams.searchValue"input"k…

每日反思(2025.9.22)

今天下午跑完步后到自习室跟b站马士兵视频学习,学习了插入,冒泡,选择排序,学习了异或运算的一些小用处,比如不开辟新空间进行两个数的交换,如果一个数组中有一个或者两个数出现奇数次,其他出现偶数次如何找出他…

网站开发与维护工资多少做网站的主流软件

要对接淘宝API接口&#xff0c;可以按照以下步骤进行操作&#xff1a; 注册成为淘宝开放平台开发者&#xff0c;并创建一个应用。在应用创建页面&#xff0c;需要填写应用的名称、描述等信息&#xff0c;并设置应用的API权限等级。获取App Key和App Secret。在应用创建后&…

中国电力建设集团网站网页设计html成品免费

使用conda可以在电脑上创建很多套相互隔离的Python环境&#xff0c;命令如下&#xff1a; 创建环境 创建一个名为deeplearning的环境&#xff0c;python版本为3.7 conda create --name deeplearning python3.7查看版本 conda --version切换环境 切换到deeplearning环境 c…

怎么自己做网站卡扣wordpress 摄影 模板

目录 一、网络相关知识简介 二、网络协议的分层模型 2.1 OSI七层模型 2.2 TCP/IP五层模型 2.3 协议层报文间的封装与拆封 三、IP协议 3.1 MAC地址 3.2 IP地址 3.3 MAC地址与IP地址区别 一、网络相关知识简介 互联网通信的本质是数字通信&#xff0c;任何数字通信都离…

商贸网站企业邮箱与个人邮箱有什么区别

Pytorch上手使用 近期学习了另一个深度学习框架库Pytorch&#xff0c;对学习进行一些总结&#xff0c;方便自己回顾。 Pytorch是torch的python版本&#xff0c;是由Facebook开源的神经网络框架。与Tensorflow的静态计算图不同&#xff0c;pytorch的计算图是动态的&#xff0c;可…

旅游电子商务网站建设调查问卷虚拟体验网站

不久前举办的中心金融工作会议明确要求“推动股票发行注册制走深走实”&#xff0c;无疑为本钱商场活泼进一步夯实制度保证。 上市公司是本钱商场的基石&#xff0c;其质量是决议本钱商场长期健康展开的重要因素之一。作为牵一发而动全身的重要革新&#xff0c;注册制的实施逐…

兰州网站建设价格谁有学做网站论坛账号

IO复用 概述IO模型阻塞式IO非阻塞式IOIO复用select、poll、epoll异同 信号驱动式IO异步IO select函数select示例代码 poll函数poll示例代码 epoll函数创建  epoll_create注册、修改、删除  epoll_ctl轮询 I/O 事件的发生  epoll_waitepoll示例代码 基于TCP和epoll在线多人…