新公司网站建设有限责任公司和有限公司有啥区别
web/
2025/10/1 15:22:42/
文章来源:
新公司网站建设,有限责任公司和有限公司有啥区别,网站建设财务策划书,新手学做网站 pdf 下载定位和检测: 定位是找到检测图像中带有一个给定标签的单个目标 检测是找到图像中带有给定标签的所有目标 图像分割和目标检测的区别#xff1a; 图像分割即为检测出物体的完整轮廓#xff0c;而目标检测则是检测出对应的目标。#xff08;使用框框把物体框出来#xff… 定位和检测: 定位是找到检测图像中带有一个给定标签的单个目标· 检测是找到图像中带有给定标签的所有目标 图像分割和目标检测的区别 图像分割即为检测出物体的完整轮廓而目标检测则是检测出对应的目标。使用框框把物体框出来此外目标检测还分为多种类型可以只检测一个物体也可以同时检测多个物体。 目标检测性能指标
检测精度
Precision, Recall, F1 scorelou (Intersection over Union)P-R curve ( Precison-Recall curve)·AP(Average Precision)mAP (mean Average Precision)
检测速度
前传耗时每秒帧数FPS (Frames Per Second)浮点运算量(FLOPS) 混淆矩阵 精度Precision(查准率)是评估预测的准不准看预测列) 召回率Recall(查全率)是评估找的全不全(看实际行)
YOLO——you only look once YOLO算法基本思想
损失函数(Loss function)
损失函数包括:
classification loss,分类损失localization loss,定位损失预测边界框与GT之间的误差)confidence loss,置信度损失框的目标性; objectness of the box)
总的损失函数三类损失之和 classification loss localization loss confidence loss
YOLOv5使用二元交叉嫡损失函数计算类别概率和目标置信度得分的损失。
YOLOv5使用CIOu Loss作为bounding box回归的损失。 类别预测class prediction 大多数分类器假设输出标签是互斥的。如果输出是互斥的目标类别则确实如此。因此YOLO应用softmax函数将得分转换为总和为1的概率。而YOLOv3/v4/v5使用多标签分类。例如输出标签可以是“行人”和“儿童”它们不是非排他性的。现在输出得分的总和可以大于1) YOLOv3/v4/v5用多个独立的逻辑(logistic)分类器替换softmax函数以计算输入属于特定标签的可能性。 在计算分类损失进行训练时YOLOv3/v4/v5对每个标签使用二元交叉嫡损失。这也避免使softmax函数而降低了计算复杂度。 边界框回归是许多2D/ 3D计算机视觉任务中最基本的组件之一。 一个改进机会是使用根据loU计算的度量损失取代替代回归损失例如l1和l2-norms平方损失) 灵活配置不同复杂度的模型 应用类似EfficientNet的channel和layer控制因子
YOLOv5的四种网络结构是depth_multiple和width_multiple两个参数来进行控制网络的深度和宽度。其中depth_multiple控制网络的深度BottleneckCSP数)width_multiple控制网络的宽度卷积核数量)。 predicted bounding box (black rectangle)
ground truth box (green rectangle)
loU用作性能度量和损失函数的问题: 如果两个物体不重叠则loU值将为零并且不会反映两个形状彼此之间的距离。
在物体不重叠的情况下如果将loU用作损失则其梯度将为零并且无法进行优化。 major weakness: If |AnB| 0,IoU(A,B)0.
想法:推广loU到非重叠情形并且确保: (a遵循与loU相同的定义即将比较对象的形状属性编码为区域(region)属性;
(b维持loU的尺寸不变性;
(c在重叠对象的情况下确保与loU的强相关性。 GloUgeneralized intersection over union the smallest convex shapes C enclosing both A and B 空间金字塔池化 SPP——spatial pyramid pooling
YOLOv5-SPP 在 CSP 上添加 SPP 块因为它能显著增加接收场分离出最重要的上下文特征而且几乎不会降低网络运行速度。 相比较而言的YOLOv4的SPP模块如上 PAnetpath-aggregation network路径聚合网络 对 一般的特征金字塔网络他的特征图大小为不同的尺度可以对于不同尺度做融合但是当在较下面的维度和右侧的红色箭头指向的维度进行融合时不利于进行融合。如图a
对于PAnet而言他会增加一个bottom-up的模型如图b使得下面的较为精细的尺度特征图能够较为容易的传递到上层。然后在相同的尺度上进行融合最后进行拼接操作如图c。由于PAnet中的a和b存在尺度特征图的上升和下降的信息流传递使得PAnet的信息也较spp更为丰富。 目标框回归 Anchor给出了目标宽高的初始值需要回归的是目标真实宽高与初始宽高的偏移量 预测框中心点相对于对应网格(grid cell)左上角位置的相对偏移值 为了将边界框中心点约束在当前网格中使用sigmoid函数处理偏移值使预测偏移值在(0,1)范围内YoLOv/v4目标框回归公式: 根据边界框预测的4个offsets tx,ty,tw,th可以按如下公式计算出边界框实际位置坐标值和宽高值: YOLOv5跨网格匹配策略 YOLO5采用了跨邻域网格的匹配策略从而得到更多的正样本anchor可加速收敛
从当前网格的上、下、左、右的四个网格中找到离目标中心点最近的两个网格再加上当前网格共三个网格进行匹配。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/85125.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!