图像分割-DeepLab

DeepLabV3+源码链接:https://github.com/bubbliiiing/deeplabv3-plus-pytorch(打不开私信我获取)

一、简介

        一般的模型如Unet一般用于医学领域,小目标,如细胞分割。

        为了增大感受野(从而更好的获得全局特征),通常会选择pooling操作(一般就是每隔几层卷积就会进行pooling),但会丢失部分信息。

二、方法

2.1空洞卷积(dilated convolution)

        下图展示了空洞卷积的原理。左图是普通的卷积,这是紧凑的,连在一起的区域(3*3)。右边是空洞卷积,它在传统卷积的区域分割开了(5*5),从而增大感受野

通过设置dilated参数可以得到不同感受野的特征(3*3,7*7,15*15)

        图像分割任务中(除了医学领域小目标分割,其它场景也适用)需要较大感受野来完成任务。同样目标检测领域等等其他计算机视觉领域都能用到。

2.2 SPP-Layer

        假设输入图像经过了卷积层已经得到了256个特征图,第一种对其进行4*4的切分,划分为16个小方格,然后每个小方格进行maxpooling得到4*4=16个特征值,第二种进行对其进行2*2的切分,划分为4个小方格,同样进行maxpooling得到2*2=4个特征值,第三种直接全局提取特征,然后再拼上(16+4+1)*256,这就是SPP层。

        三种不同的策略,得到三种不同的特征,在拼在一起,相当于全局的也有,粗糙的也有,细节的也有,这样的特征就比较好了。保证了输出固定·

2.3 ASPP(atrous convolution SPP)

        这个其实和APP差不多,只不过引入了不同倍率的空洞卷积,如下图

三、DeepLab V3+

结构图如下:

        输入图像,先进行基础网络(这里是ResNet),再进行五种特征提取方法:①1*1卷积;②3*3卷积,并有间隔为6 的空洞卷积;③3*3卷积,并有间隔为12 的空洞卷积;④3*3卷积,并有间隔为18 的空洞卷积;⑤pooling池化;得到了5种不同的特征图,并要保持他们h,w(即长和宽)一样(利用pading进行),五个特征拼接在一起,经过1*1卷积,得到一个融合很多信息的特征。

        并有粗糙提取得到的特征(图中Low-Level Features),经过1*1卷积得到特征图,然后与上一段得到的融合很多信息的特征进行再次融合(为了保证两个特征图大小一样,这里要进行上采样,因为它已经经过多次卷积后特征图变小),再进行3*3卷积,最终再上采样得到和输入大小相同的输出结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/57612.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 18.四数之和

LeetCode 18.四数之和 C 思路🧐: 由题意得,四个数组里面的整数相加需要得到target这个目标值,且结果不能重复,那么我们可以用排序双指针的方式进行解答,将该数组变为升序数组,然后固定左边两个数…

建站工具Halo

建站工具Halo 项目及文档快速体验启动成功 类似wordpress的建站工具,使用java技术栈Springboot开发,对java开发者友好。 项目及文档 https://github.com/halo-dev/halo 快速体验 为了快速体验,直接使用docker compose部署。也可在源码基础…

人工智能+医学

医学影响的内型:(X光片、计算机断层扫描、磁共振成像、超声波) ITK snap医学图像读取 医学影像领域常见任务: 图像分类、语义分割、疾病预测、目标检测、图像配准、图像生成(应用少)、图像增强、生成放射学报告。 需要有很强的可解释…

指针进阶(三)(C 语言)

目录 一、回调函数二、快速排序函数 qsort1. qsort() 函数原型2. 使用 qsort() 函数 三、仿照 qsort 函数设计一个可以排序任意类型数组的冒泡函数1. 函数原型2. 函数设计思路 一、回调函数 在 C 语言中,回调函数是一种通过函数指针调用的函数,也就是一…

Spring Boot驱动的植物健康监测革命

1系统概述 1.1 研究背景 随着计算机技术的发展以及计算机网络的逐渐普及,互联网成为人们查找信息的重要场所,二十一世纪是信息的时代,所以信息的管理显得特别重要。因此,使用计算机来管理植物健康系统的相关信息成为必然。开发合适…

【贪心算法】(第十三篇)

目录 整数替换(medium) 题目解析 讲解算法原理 编写代码 俄罗斯套娃信封问题(hard) 题目解析 讲解算法原理 编写代码 整数替换(medium) 题目解析 1.题目链接:. - 力扣(Leet…

软件测试学习笔记丨Selenium学习笔记:常用页面信息对比方法expected_conditions

本文转自测试人社区,原文链接:https://ceshiren.com/t/topic/22514 本文为霍格沃兹测试开发学社的学习经历分享,写出来分享给大家,希望有志同道合的小伙伴可以一起交流技术,一起进步~ 说明:本篇博客基于sel…

开拓鸿蒙测试新境界,龙测科技引领自动化测试未来

在当今科技舞台上,鸿蒙 OS 以非凡先进性强势登场,打破传统操作系统格局,为软件测试领域带来全新机遇与艰巨挑战。 一、鸿蒙 OS 的辉煌崛起 (一)壮丽发展历程与卓越市场地位 鸿蒙 OS 的发展如波澜壮阔的史诗。2023 年…

【vue】Mammoth.js的使用:将.docx和doc 文件转换成HTML

mammoth.convertToHtml(input, options) :把源文档转换为 HTML 文档 mammoth.convertToMarkdown(input, options) :把源文档转换为 Markdown 文档。 mammoth.extractRawText(input) :提取文档的原始文本。这将忽略文档中的所有格式…

JavaScript进阶:手写代码挑战(一)

​🌈个人主页:前端青山 🔥系列专栏:JavaScript篇 🔖人终将被年少不可得之物困其一生 依旧青山,本期给大家带来JavaScript篇专栏内容:JavaScript手写代码篇 #1024程序员节|征文# 在现代Web开发中&#xff0c…

【人工智能-初级】第6章 决策树和随机森林:浅显易懂的介绍及Python实践

文章目录 一、决策树简介二、决策树的构建原理2.1 决策树的优缺点优点缺点 三、随机森林简介3.1 随机森林的构建过程3.2 随机森林的优缺点优点缺点 四、Python实现决策树和随机森林4.1 导入必要的库4.2 加载数据集并进行预处理4.3 创建决策树模型并进行训练4.4 可视化决策树4.5…

中国移动机器人将投入养老场景;华为与APUS共筑AI医疗多场景应用

AgeTech News 一周行业大事件 华为与APUS合作,共筑AI医疗多场景应用 中国移动展出人形机器人,预计投入养老等场景 作为科技与奥富能签约,共拓智能适老化改造领域 天与养老与香港科技园,共探智慧养老新模式 中山大学合作中国…

0160____declspec(noreturn)的用法

__declspec(noreturn)的用法-CSDN博客

[Python学习日记-53] Python 中的正则表达式模块 —— re

[Python学习日记-53] Python 中的正则表达式模块 —— re 简介 re 模块 练习 简介 我们在编程的时候经常会遇到想在一段文字当中找出电话号码、身份证号、身高、年龄之类的信息,就像下面的数据一样 # 文件名:美丽学姐联系方式.txt 姓名 地区 …

微信小程序美团点餐

引言:外卖已经成为了都市人的必备,在无数个来不及(懒得)做饭的时刻拯救孤单寂寞的胃。美团外卖无疑是外卖届的领头羊,它的很多功能与设计都值得我们学习。本文将从五个方面,对美团外卖展开产品分析&#xf…

Axios 基本使用

Axios 是一个异步请求技术,核心作用就是用来在页面中发送异步请求,并获取对应数据在页面中渲染 页面局部更新技术 Ajax 中文网站:https://www.kancloud.cn/yunye/axios/234845 安装: <script src"https://unpkg.com/axios/dist/axios.min.js"></script&g…

【ArcGIS Pro实操第4期】绘制三维地图

【ArcGIS Pro实操第4期】绘制三维地图 ArcGIS Pro绘制三维地图-以DEM高程为例参考 如何使用ArcGIS Pro将栅格数据用三维的形式进行表达&#xff1f;在ArcGIS里可以使用ArcScene来实现&#xff0c;ArcGIS Pro实现原理跟ArcScene一致。由于Esri未来将不再对ArcGIS更新&#xff0c…

深入浅出神经网络:从基础原理到高级应用

第5章 神经网络 更加详细内容可以看这篇文章 5.1 神经元模型 神经网络的基本单元是神经元模型。神经元模拟了生物神经元的行为&#xff0c;通过接收输入信号&#xff0c;进行加权求和&#xff0c;然后经过激活函数输出结果。 数学上&#xff0c;一个简单的神经元可以表示为&…

pipeline开发笔记

pipeline开发笔记 jenkins常用插件Build Authorization Token Root配置GitLab的webhooks(钩子)配置构建触发器--示例 piblish over sshBlue OceanWorkspace Cleanup PluginGit插件PipelineLocalization: Chinese (Simplified) --中文显示Build Environment Plugin 显示构建过程…

Unity3D 摄像机显示颜色详解

在Unity3D中&#xff0c;摄像机是显示游戏场景内容的核心组件&#xff0c;它负责将场景中的3D模型、材质、光照等元素转换为屏幕上的2D图像。摄像机显示颜色的过程涉及多个技术和算法&#xff0c;包括渲染管线、着色器、光照、材质以及后期处理等。以下是对这一过程的详细解析&…