昆明网站seo公司seo 网站关键词优化

web/2025/9/27 8:45:17/文章来源:
昆明网站seo公司,seo 网站关键词优化,凡科网建站系统源码,宜昌网站建设开发基于Grad-CAM与KL损失的SSD目标检测算法 人工智能技术与咨询 来源#xff1a;《电子学报》#xff0c;作者侯庆山等 摘 要#xff1a; 鉴于Single Shot Multibox Detector (SSD)算法对中小目标检测时会出现漏检甚至错检的情况#xff0c;提出一种改进的SSD目标检测算法《电子学报》作者侯庆山等 摘 要 鉴于Single Shot Multibox Detector (SSD)算法对中小目标检测时会出现漏检甚至错检的情况提出一种改进的SSD目标检测算法以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping (Grad-CAM)技术对检测过程中的细节作可视化处理并以类激活图的形式呈现各检测层细节分析各检测层的类激活图发现SSD算法中待检测目标的错检以及中小目标的漏检现象与回归损失函数相关.据此采用Kullback-Leibler (KL)边框回归损失策略利用Non Maximum Suppression (NMS)算法输出最终预测框.实验结果表明改进算法相较于已有检测算法具有更高的准确率以及稳定性. 关键词: 目标检测可视化类激活图Grad-CAMSSDKL损失 1 引言 目标检测技术的不断完善和发展引起智能化交通系统[1]、智能监控系统[2]、军事目标检测[3]及医学导航手术中手术器械定位[4]等领域的广泛关注是计算机视觉领域的核心技术之一.在国内外相关研究机构的努力下高效的目标检测算法如雨后春笋般层出不穷如基于单阶段过程的You Only Look Once (YOLO)算法[5]、SSD算法[6]、基于双阶段过程的Region with CNN features (R-CNN)算法[7]等. 针对SSD算法在中小目标检测中漏检甚至错检的问题WenZhan[8]等人改进原SSD算法的激活函数并引入Atrous滤波器.Wu[9]等人在传统的SSD检测算法中加入转置卷积结构将低分辨率、高语义与高分辨率、低语义的输出特征图进行融合.针对图像中某些待检测目标被遮挡的情况Xing[10]等人根据检测目标的分布规律调整了输出特征层的缩放系数一定程度上解决了漏检问题.Tang[11]等人提出了多视窗的方法但由于该方法存在目标被拆分检测等问题使得其准确性及稳定性受到影响.针对SSD模型的低特征层Chen[12]等人采用区域放大提取的方法提升了算法的中小目标检测能力.Fu[13]等人提出Deconvolutional Single Shot Detector (DSSD)模型但其网络结构也随之变得更复杂导致模型的检测实时性下降.Jeong [14]等人提出的Rainbow Single Shot Multibox Detector (RSSD)模型改进了特征融合的方式对各输出层特征更加充分的利用提升算法对中小目标的检测效果.Li[15]等人通过特征融合与下采样的方法获取更多输出特征层细节信息从而提出Feature fusion Single Shot multibox Detector (FSSD)目标检测模型. 为了方便对SSD算法在中小目标检测方面性能的提高本文引入可视化技术[16]对原算法的检测过程进行分析优化了原算法的损失函数.改进后的检测算法对中小目标的检测能力更强总体检测效果更好并且目标漏检、错检问题也得到相应改善. 2 相关研究 2.1 SSD模型 SSD算法使用多尺度特征层进行目标检测是一种直接预测目标类别和边界框的多目标检测算法.与双阶段过程的目标检测算法相比SSD算法将所有计算在单阶段过程中进行没有候选框区域的生成和后续特征重采样阶段的过程提升了SSD算法的检测速度.该算法以Visual Geometry Group 16 (VGG-16)[17]为基础网络中上部分采用采样金字塔结构[18]将最后两个全连接层替换为卷积层并在其后增加四个卷积层. 2.2 KL损失函数 现有的目标检测算法在大规模数据集上进行某些边界框标定时存在歧义.KL损失[19]针对边界框的移动与位置间的方差进行学习在同等计算量下提升不同结构定位的准确率.KL边界框回归损失可以获取到数据集中的模糊从而降低预测边界框的回归损失. 基于对Faster R-CNN[20]Mask R-CNN[21]检测网络的认知KL损失将原本的回归框参数由(x,y,w,h)替换为(x1,y1,x2,y2)这样便于在每个维度上单独优化预测边界框与真实边界框的偏差可由式(1)表达. (1) (x1,y1,x2,y2)表示预测边界框左上角和右下角的坐标 表示真实边界框左上角以及右下角的坐标.(x1a,x2a,y1a,y2a,wa,ha)是由真实边界框聚类产生的锚框. KL损失重点评估位置的置信度在预测位置的同时给出置信度.假设坐标间互相独立并使用单变量高斯模型将边界框坐标表示为x单独对每个坐标进行独立优化可由式(2)表达. (2) 式(2)中Θ表示一组要学习的参数xe表示预测边界框的位置xe∈(x1,y1,x2,y2)σ表示位置估计的置信度. 真实边界框也可以表示为σ→0的高斯分布如式(3)所示.式(3)中的xg表示真实边界框的位置. PD(x)δ(x-xg) (3) 选取N个样本将这些样本的预测边界框分布PΘ(x)和真实边界框分布PD(x)之间的误差最小化进而对 进行评估获取位置定位的目标可由式(4)表达. (4) 基于KL损失的检测算法中边界框回归的损失函数采用KL损失对于单个样本的边界框回归损失由式(5)定义. LregDKL(PD(x)‖PΘ(x)) (5) xe表示预测边界框的位置当预测边界框的坐标位置不准确时网络通过预测更大的方差σ2使回归损失降低由于式(5)中的后两部分与参数Θ无关得式(6). (6) 当σ1时损失变为欧氏距离如式(7). (7) 对式(6)中预测边界框的位置估计和定位标准偏差σ分别求偏导如式(8)、(9)所示. (8) (9) 为了防止在训练开始时发生梯度爆炸令αlog(σ2)在进行测试时将α重新变回为σ变换后的损失可由式(10)表达. (10) 用随机高斯分布对全连接层初始化KL损失在开始训练时类似于smooth L1损失当│xg-xe│1时损失可定义为式(11). (11) 2.3 类激活图 为解决卷积神经网络模型中的不可见问题通过Grad-CAM技术[22]可将网络模型对输入图像中感兴趣的区域表示出来将网络模型可视化直观的表达了算法得出分类结果的原因.在Grad-CAM技术中利用类别输出结果对卷积层的输出特征图求导获取特征激活图由式(12)计算得到权重值 将与特征图累加得到可视化结果权重说明了类别c对特征映射的重要度. (12) 通过ReLU函数除去特征图上负值对分类结果的影响最终的分类任务由式(13)、(14)表达. (13) (14) 3 改进框架设计 3.1 SSD检测算法的可视化 Grad_CAM技术根据输入图像中各目标的类别标签判别目标区域.将该技术运用到SSD检测算法使该算法的执行过程可视化针对用于目标检测的各卷积层对这些层的特征输出层进行分析构建各检测层的类激活图. SSD检测算法的可视化能够更好的理解网络的目标检测过程通过分析类激活图得出中小目标检测不准确或漏检的原因针对该原因做出相应的改进策略提高检测效率.SSD 300目标检测算法的可视化过程如图1所示. 3.2 基于KL损失的SSD算法 3.2.1 默认框设定 检测算法沿用了原SSD算法中默认框的设定方法针对多个目标检测层的输出特征图进行设定对于特征图中的每个像素点生成大小不同的两个正方形及多个长方形默认框.比例值ar的数目决定了特征输出图中某一像素点下默认框的数目默认框的大小取决于Sk值的设定默认框的长和宽可由式(15)、(16)进行表达. (15) 其中m为特征图的个数Smin0.2 Smax0.9. (16) 其中默认框长宽比ar∈(1,2,3,1/2,1/3)另外设置一个 的默认框.默认框中心点的位置可由式(17)计算. (17) 其中│fk│为第k个特征图的大小i,j∈[0,│fk│]. 3.2.2 正负样本标定 利用检测算法对输入图像中的目标进行检测时需要对默认边界框进行类别标定.通过IoU值进行匹配IoU值由式(18)定义.对于每一个待检测目标的真实边界框对应默认边界框的匹配规则如下设定IoU的阈值为0.5当默认边界框与真实边界框的IoU值大于0.5时将此默认边界框标定为正例样本否则标定为负例样本. (18) 其中AreadbAreagt分别表示默认边界框与真实边界框的面积. 3.2.3 损失策略 改进的SSD目标检测算法的训练损失由目标分类损失和预测边界框的回归损失两部分组成改进算法训练损失可由式(19)表达. (19) 式中N为正例样本数α表示用于控制分类损失和回归损失的比重. 目标分类损失采用交叉熵损失[23]损失由式(20)表达. (20) 表示的是第i个默认边界框与第j个真实边界框关于目标类别p是否匹配当时不匹配时匹配. 预测边界框的回归损失采用KL损失回归损失由式(21)定义. (21) 式中pg分别表示预测边界框和真实边界框与默认边界框之间的偏移量在边界框的回归损失中通常期望p和g差距较小. 对经过NMS算法处理后所选中的边界框位置投票选择最大得分边界框M{x1y1x2y2sσx1σy1σx2σy2}根据自身和相邻边界框的参数更新坐标位置邻近边界框权重值Pi和新坐标的计算式由式(22)定义. pie-(1-IoU(bi,b))2/σt (22) 式中σt表示变量投票表决时的可调参数. 4 图像数据预处理 为增强检测算法的通用性和稳定性采取数据增广的方法对数据预处理.通常将图像目标区域分割掩码中像素数量小于1024的目标定义为小目标大于1024且小于9216的目标定义为中等目标.为此针对改进的SSD算法制定如下数据增广规则 (a)对原始的输入图像进行随机位置的采样采样图像与原始图像的比例取1/64、1/32、1/16、1/8、1/4、1/2、1. (b)对采样图像以一定的概率作翻转和裁剪处理. (c)对采样图像以一定的概率添加色彩变换. 与原SSD算法的采样比例相比更小的采样比例可以使得由随机采样得到的小目标经过图像尺寸恢复后被更明显的表示出来. 5 实验设计 5.1 实验数据集说明 以PASCAL VOC和MS COCO 2017三种数据集为基础设计相关实验数据集数据集的说明如下 选取MS COCO数据集中的30类目标作为检测类别.分别从MS COCO和PASCAL VOC数据集的训练集中选取3000张和2000张带有检测类别的图像将选取的5000张图像作为训练集从MS COCO数据集的验证集中选取1000张图像作为验证集用于调控模型的超参数监测过拟合现象分别从MS COCO和PASCAL VOC数据集的测试集中选取800张图像作为检测算法的测试集. 5.2 实验相关过程描述 基于设计好的实验数据集对改进的SSD目标检测算法进行训练测试.改进的SSD目标检测算法采用了随机梯度下降的方法对改进算法的初始学习率、动量、权重大小、批量等参数进行设定.检测算法在训练数据时将初始学习率设定为0.001,对训练集中的图像进行30000次的迭代训练进一步将学习率设定为0.0001对训练集中的图像进行10000次的迭代训练最后将学习率下降至0.00005对训练集中的图像进行10000次的迭代训练.此外设置IoU阈值为0.5利用验证集对超参数进行调节监测过拟合现象. 利用测试集对训练好的改进目标检测算法进行测试与原算法的mPA及fps值作对比体现改进检测算法的优势验证算法改进的合理性和有效性. 5.3 实验结果分析 5.3.1 各检测层结果对比 检测算法的低检测层对小目标特征进行提取对原SSD目标检测算法中各检测层的检测效果进行测试与原检测算法相比改进算法对小目标检测的准确度明显提升检测精度提升约12%.计算原算法和改进算法各检测层的mPA值和fps值如表1所示. 表1 目标检测算法各检测层mPA值和fps值对比 由表1数据可知改进后的低特征层对小目标的检测效果提升明显能够收集到更丰富的语义信息.通过fps值的对比改进后的SSD目标检测算法保持了良好的检测实时性SSD算法得到明显改进. 5.3.2 SSD相关改进算法对比 对现有的一些SSD改进算法在相关数据集上训练和预测 将训练和预测结果与改进的SSD 300目标检测算法做对比对比结果如表2所示。 分析表2可知与选取的SSD改进算法相比本文提出的改进算法检测精度有较明显的提高算法的检测实时性得到较好保持. 表2 SSD相关改进算法mPA和fps对比 5.3.3 常见目标检测算法框架对比 对现有的一些目标检测算法在实验设计数据集上训练和预测将训练和预测结果与改进的SSD目标检测算法做对比对比结果如表3所示. 将改进算法训练过程的mPA值与YOLO、YOLOv2算法训练过程的mPA值对比对比结果如图2所示.另外选取基于两阶段过程的Fast R-CNN、Faster R-CNN算法训练过程的mPA值对比结果如图3所示. 对比改进算法与原SSD算法训练过程的mPA值对比结果如图4所示. 与现有的目标检测算法对比改进后的SSD目标检测算法检测精度有较明显的提高算法的检测实时性较好.一方面对原SSD目标检测算法的损失策略进行改进进一步缩小了检测算法训练时的损失另一方面针对图像中的中小目标做出相应的图像增广策略 表3 目标检测算法mPA和fps对比 使得检测算法对中小目标特征的收集更加全面提高了对输入图像上中小目标的检测精度. 5.3.4 效果图对比 将改进算法的检测效果图与原算法的检测效果图进行对比对比效果图如图5、6所示.改进后的SSD目标检测算法对输入图像中的中小目标能够更加精准的检测和分类对由于遮挡现象造成的目标漏检问题有良好改善.在复杂场景中与原SSD检测算法相比改进的SSD目标检测算法能够检测到更多的目标在简单场景中改进算法对待检测目标类型的判别更加精确目标的正确分类得分更高。此外在处理模糊场景及小目标场景时改进算法能够检测到更多的模糊目标与小目标。 6 结束语 改进的SSD目标检测算法提高了原SSD目标检测算法的稳定性和准确率改善了在遮挡情况下造成的目标错检现象,对中小目标的检测效果有明显的提升.改进算法的贡献主要体现在以下方面 (1)对SSD目标检测算法进行可视化分析SSD目标检测算法的检测过程. (2)针对原算法的不足改进了输入图像的增广策略. (3)基于对可视化结果的分析优化了传统SSD目标检测算法的边界框回归损失. (4)利用改进的NMS算法输出目标的预测边界框. 我们的服务类型 公开课程 人工智能、大数据、嵌入式                     内训课程 普通内训、定制内训                          项目咨询 技术路线设计、算法设计与实现图像处理、自然语言处理、语音识别

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/81185.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软装设计案例网站wordpress仪表盘修改

作为一名java工程狮,大家肯定经历过很多面试,但每次几乎都会被问到什么是MVC设计模式,你是怎么理解MVC的类似这样的一系列关于MVC的问题。 【出现频率】 【关键考点】 MVC的含义MVC的结构 【考题分析】  在java Web开发中,存在两…

男人做想看的免费网站杭州企业网站建设 哪里好

一 Web应用模式 在开发Web应用中,有两种应用模式: 1.1 前后端不分离 1.2 前后端分离 二 API接口 为了在团队内部形成共识、防止个人习惯差异引起的混乱,我们需要找到一种大家都觉得很好的接口实现规范,而且这种规范能够让后端写…

西局网站建设怎做网站

1、先安装依赖 自行百度搜索或csdn 2.引入:import table2excel from js-table2excel 3、按钮点击事件(我是直接写在button按钮里面的 你们也可以写一个店家事件写进去) onClick{() > {console.log(list);const column [//数据表单{titl…

网站建设收费标准渠道网站文章没有被收录

目录 前言 查看页面原型,明确需求 页面原型 需求 阅读接口文件 思路分析 功能接口开发 控制层(Controller类) 业务层(Service类) 业务类 业务实现类 持久层(Mapper类) 接口测试 前…

南宁做网站公司必荐云尚网络邯郸做网络推广的公司

今天把微软的报表重新部署一遍,发现在不同的浏览器中,显示的尺寸大小不一样。在IE8浏览器中是正常的:而在火狐浏览器中却始终只有全屏的四分之一大小,无论在报表中如何修改尺寸也没有变化。看起来,应该是在浏览器的什么…

电子商务网站建设的方法有哪些古典网站建设欣赏

1、计算机组成结构 计算机组成结构是指计算机系统的各个组成部分以及它们之间的相互关系和功能。通常,计算机组成结构可以分为以下主要部分: 中央处理单元(CPU): CPU 是计算机的大脑,负责执行程序指令和处理…

怎么用网站源码建站技能培训机构排名前十

在过去的六个月里,我们 LinkedIn 的团队一直在努力开发一种新的人工智能体验。我们希望重新构想我们的会员如何进行求职和浏览专业内容。 生成式人工智能的爆炸式增长让我们停下来思考一年前不可能实现的事情。我们尝试了许多想法,但都没有真正实现&…

贷款网站模板东莞网络建站

什么是网站监控 网站监控是持续跟踪网站在互联网上的性能和可用性,以确保其正常运行并提供良好的用户体验的过程,在当今的数字时代,一个表现良好的网站对公司的声誉至关重要,打开速度慢的网站会对用户体验产生负面影响&#xff0…

有几个网站苏州网站建设搭建

文章目录 题目描述基本思路 题目描述 每一本正式出版的图书都有一个 ISBN 号码与之对应。ISBN 码包括9位数字、1位识别码和3位分隔符,其规定格式如x-xxx-xxxxx-x,其中符号- 是分隔符(键盘上的减号),最后一位是识别码&…

360提交网站备案深圳罗湖网站设计

这里是使用的opencv进行图片的读取,自然也是想使用opencv的imshow方法来显示图像,但是在google Colab中不可以使用,所以寻找了一下变通的显示方法。 方法1:使用matplotlib 使用plt需要交换一下r、b通道,否则显示不正常…

新网站快速提高排名杭州做网站价格

本文是简单的视频总结:从此再也不怕动态规划了,动态规划解题方法论大曝光 !详细信息还请看代码随想录讲解视频 文章目录 动态规划的常见类型动态规划的误区动规五步曲DP数组以及下标的含义递推公式DP数组如何初始化DP数组遍历顺序打印DP数组…

临武县网站建设专业洛阳霞光网络科技

推荐:使用 NSDT场景编辑器 助你快速搭建可编辑的3D应用场景 我们都知道,GAN在生成非结构化合成数据(如图像和文本)方面越来越受欢迎。然而,在使用GAN生成合成表格数据方面所做的工作很少。合成数据具有许多好处&#x…

佛山网站建设联系电话天津建站平台

网红营销已经演变成一个由品牌、MCN机构、红人和消费者组成的复杂生态系统,并在某种程度上重新定义了当今社交媒体时代营销和广告的本质。在这个情况下,品牌找红人进行营销推广已经成为大势,而最能体现网红营销发展的莫过于Instagram这个平台…

网站开发到上线的流程网站排名突然下降

来源:国际电子商情 概要:11月6日,博通官方发出公告,宣布将以每股60美元现金,另加10美元公司股票收购高通全部流通股,交易总价值达到1300亿美元。 高通昨日证实已收到了博通公司发出的主动收购提议&#xf…

天门市网站建设seo网站页面设计优化方案

官网:👉详情一 👉详情二 👉关于redux 使用原因:👉详情 /** 2-1、随着javascript单页应用程序的发展,需要在代码中管理更多的状态(包括服务器响应数据、缓存数据、本地创建还未发送…

专做服装的网站企业所得税

前言 解决问题:Adobe Acrobat快速自动批量添加书签/目录, 彻底告别手动添加书签的烦恼 AutoBookmark 前言1 功能简介2 实现步骤2.1 下载插件2.2 将插件复制到Acrobat文件夹下2.3 自动生成书签 1 功能简介 我们在查看PDF版本的论文或者其他文件的时候, 虽然相比较于…

支付网站怎么设计的下载168网站

简介 “今天发现一个比较奇怪的现象,因为博主不熟悉mysql,所以在安装hive的使用了postgresql作为hive的元数据库,在测试几个连接工具对hive进行链接,后面再测试的时候发现链接不上了,并且报错日志如下:” …

律师网站建设与维护深圳南山区网站建设

1、反向代理后,自然而然就引出了负载均衡,下面简单实现负载均衡的效果; 2、实现该效果需要再添加一个 Nginx ,所以要增加一个文件夹。 /home|---mutou|----nginx|----conf.d|----html|----conf.d2|----html3 1.创建 html3 文件夹, 新建 index…

中车网站建设的优缺点酒店网站建设的构思

一、说明 本周我不得不为客户抓取一个网站。我意识到我做得如此自然和迅速,分享它会很有用,这样你也可以掌握这门艺术。【免责声明:本文展示了我的抓取做法,如果您有更多相关做法请在评论中分享】 二、计划策略 2.1 策划 确定您…

保定自助建站网页设计布局有哪几种方法

前言 LM358双运放有几十年的历史了吧?通用运放,很常用,搞电路的避免不了接触运放,怎么选择运放,是工程师关心的问题吧? 从本文开始,将陆续发一些常用的运放,大家选型可以参考&#…