目录
前言
算法原理
Methodology—方法
可编程梯度信息PGI
辅助可逆分支
多级辅助信息
广义 ELAN
实验效果
实施细节
与最先进实时目标检测器的比较
消融实验
表6展示了从基线 YOLOv7 到 YOLOv9 逐渐增加组件的结果。我们提出的 GELAN 和 PGI 为我们带来了较大优势。
可视化
部分核心代码
基于 YOLOv9 的自定义数据集目标检测
前言
YOLOv9是由Chien-Yao Wang, I-Hau Yeh, and Hong-Yuan Mark Liao开发的计算机视觉模型。Hong-Yuan Mark Liao和Chien-Yao Wang还对YOLOv4、YOLOR和YOLOv7等流行的模型架构进行了研究。
YOLOv9引入了两种新的架构:YOLOv9和GELAN,这两种架构都可以从论文发布的YOLOv9 Python库中使用。
YOLOv9有四种模型,按参数个数排序是:v9-S、v9-M、v9-C、v9-E。目前v9 - S和v9 - M的权重暂不可用。其中最小的模型在MS COCO数据集的验证集上达到了46.8 %的AP,而最大的模型达到了55.6 %。
算法原理
输入数据在前馈过程中可能会有不可忽略的信息丢失。这种信息丢失会导致梯度流出现偏差,而梯度流又被用于更新模型。上述问题会导致深度网络在目标和输入之间建立不正确的关联,从而使训练后的模型产生不正确的预测结果。
本文完整代码详见目标检测YOLOV9论文及源代码
在深度网络中,输入数据在前馈过程中丢失信息的现象通常被称为信息瓶颈(information bottleneck),缓解这一现象的方法主要有以下几种: