COCO数据集神经网络性能现状2025.5.18

根据当前搜索结果,截至2025年5月,COCO数据集上性能最佳的神经网络模型及其关键参数如下:

1. D-FINE(中科大团队)

  • 性能参数
    • 在COCO数据集上以78 FPS的速度实现了59.3%的平均精度(AP),是当前实时目标检测领域的最高水平。
    • 轻量化版本(D-FINE-S/M/L)在T4 GPU上分别达到287 FPS(3.49 ms)和178 FPS(5.62 ms),AP为48.5%和52.3%。
  • 技术亮点
    • 细粒度分布优化(FDR):将边界框回归任务转化为概率分布优化,提升对遮挡、模糊等复杂场景的鲁棒性。
    • 全局最优定位自蒸馏(GO-LSD):通过层间知识蒸馏进一步优化定位精度,AP较基线模型提升最高达5.3%。
    • 支持自定义数据集训练,代码和预训练模型已开源。
      在这里插入图片描述

2. AODGCN(太原科技大学团队)

  • 性能参数
    • 在MS-COCO 2017测试集上达到51.8% mAP,较YOLOv8提升1.6%。
    • 对小目标(50×50像素)的检测精度提升3.2%。
  • 技术亮点
    • 动态图卷积网络(D-GCN):自适应调整邻接矩阵,适应多尺度目标。
    • 内容感知注意力模块(CAAM):通过空间权重强化关键区域特征,遮挡场景下分类准确率提升2.1%。

3. InstaBoost(上海交大MVIG团队)

  • 性能提升
    • 在Mask R-CNN和Cascade R-CNN等框架中应用后,COCO实例分割任务提升2.2 mAP,目标检测任务最高提升4 mAP
    • 通过改进数据增强方法(如Matting和Inpainting),增强前景与背景的融合一致性,减少过拟合。
  • 优势
    • 仅需替换数据加载函数(dataloader),训练时间每轮仅增加0.03秒,适合在线训练。

4. PMD-LAMB(中科院自动化所)

  • 训练效率
    • 使用超大批次(batch size=1056)训练,COCO检测任务训练时间缩短至12分钟,实例分割任务17分钟。
    • 在OpenImages数据集上实现10%以上的性能提升。
  • 优化方法
    • 周期性矩衰减优化策略,解决大批次训练时的收敛问题。

5. DANet(双重注意力网络)

  • 应用领域
    • 主要用于场景分割任务,在COCO Stuff数据集上达到SOTA性能,平均IoU显著提升。
    • 通过空间和通道维度的注意力机制建模全局依赖关系。
      在这里插入图片描述

总结

  • 性能最优模型:D-FINE以59.3% AP和78 FPS的速度成为当前COCO目标检测的标杆。
  • 效率与精度平衡:PMD-LAMB和InstaBoost分别通过训练优化和数据增强显著提升模型效率与精度。
  • 技术趋势:动态图卷积、注意力机制、知识蒸馏和高效数据增强是提升COCO性能的主流方向。

如需具体模型的代码或训练细节,可参考各研究的开源仓库(如D-FINE的GitHub项目)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/81977.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Sentinel原理与SpringBoot整合实战

前言 随着微服务架构的广泛应用,服务和服务之间的稳定性变得越来越重要。在高并发场景下,如何保障服务的稳定性和可用性成为了一个关键问题。阿里巴巴开源的Sentinel作为一个面向分布式服务架构的流量控制组件,提供了从流量控制、熔断降级、…

Ubuntu 20.04 报错记录: Matplotlib 无法使用 OpenCV 的 libqxcb.so

网上查了一下这个报错,有很多解决方案,但是都不是针对 OpenCV 触发的这种 qt.qpa.plugin: Could not load the Qt platform plugin "xcb" in " */lib/*/site-packages/cv2/qt/plugins" even though it was found. 本文的方案是牺牲 …

配置代理服务器访问github、google

配置代理服务器访问github、google 背景与原理配置环境配置步骤云主机配置Windows客户端创建SSH隧道安装 Windows 内置 OpenSSHssh config 配置文件创建动态代理隧道 浏览器代理设置 验证浏览器访问google、githubssh 访问github 背景与原理 由于网络政策限制,中国…

网络学习-利用reactor实现http请求(六)

一、实现HTTP请求 1、印象里面,总有人说C/C语言不能实现HTTP请求,其实不然。C/C语言完全可以实现HTTP请求。通过对select,poll,epoll等IO多路复用技术的学习以及reactor模式的学习,完全能够实现HTTP请求。 2、webserver 主要解决两个问题 …

【VSCode】修改侧边文件资源管理器中的文件夹折叠模式

默认为紧凑模式: 然后我们勾选该项为宽松模式:

信息化时代国产主板如何防止信息泄露?

在数字化时代,每一份机密的泄露都可能成为我们的致命伤,尤其是如今网络如此发达的5G时代,如何防止网络信息泄密,已经成为每个人必须直面的问题。随着网络安全问题日益严重,企业和个人对网络安全的重视程度不断加深&…

vue的简单使用

1.vue的引入 引入函数&#xff0c;创建createApp对象 <div id"app">{{ message }}</div><script type"module">import { createApp, ref } from https://unpkg.com/vue3/dist/vue.esm-browser.jscreateApp({setup() {const message re…

【图像生成大模型】HunyuanVideo:大规模视频生成模型的系统性框架

HunyuanVideo&#xff1a;大规模视频生成模型的系统性框架 引言HunyuanVideo 项目概述核心技术1. 统一的图像和视频生成架构2. 多模态大语言模型&#xff08;MLLM&#xff09;文本编码器3. 3D VAE4. 提示重写&#xff08;Prompt Rewrite&#xff09; 项目运行方式与执行步骤1. …

DPDK 技术详解:榨干网络性能的“瑞士军刀”

你是否曾感觉&#xff0c;即使拥有顶级的服务器和万兆网卡&#xff0c;你的网络应用也总是“喂不饱”硬件&#xff0c;性能总差那么一口气&#xff1f;传统的网络处理方式&#xff0c;就像在高速公路上设置了太多的收费站和检查点&#xff0c;限制了数据包的“奔跑”速度。 今…

力扣网-复写零

1.题目要求 2.题目链接 1089. 复写零 - 力扣&#xff08;LeetCode&#xff09; 3.题目解答 class Solution {public void duplicateZeros(int[] arr) {int cur0,dest-1,narr.length;while(cur<n){//遇到0就dest走两步if(arr[cur]0){dest2;}//遇到非零元素dest就走一步els…

STL中的Vector(顺序表)

vector容器的基本用法&#xff1a; template<class T> class vector { T* _a; size_t size; size_t capacity; } 尾插和遍历&#xff1a; vector<int> v; v.push_back(1); v.push_back(2); v.push_back(3);//遍历 for(int i0;i<v.size();i) {cout<<…

Hass-Panel - 开源智能家居控制面板

文章目录 ▎项目介绍&#xff1a;预览图▎主要特性安装部署Docker方式 正式版Home Assistant Addon方式详细安装方式1. Home Assistant 插件安装&#xff08;推荐&#xff09;2. Docker 安装命令功能说明 &#xff1a;3. Docker Compose 安装升级说明Docker Compose 版本升级 功…

ctfhub技能书http协议

http://challenge-ffe8afcf1a75b867.sandbox.ctfhub.com:10800/index.php curl -v -X CTFHUB http://challenge-ffe8afcf1a75b867.sandbox.ctfhub.com:10800/index.php curl&#xff1a;用于发送 HTTP 请求的命令行工具。 -v&#xff08;--verbose&#xff09;&#xff1a;开启…

Eigen与OpenCV矩阵操作全面对比:最大值、最小值、平均值

功能对比总表 功能Eigen 方法OpenCV 方法主要区别最大值mat.maxCoeff(&row, &col)cv::minMaxLoc(mat, NULL, &maxVal, NULL, &maxLoc)Eigen需要分开调用&#xff0c;OpenCV一次获取最小值mat.minCoeff(&row, &col)cv::minMaxLoc(mat, &minVal, NU…

结课作业01. 用户空间 MPU6050 体感鼠标驱动程序

目录 一. qt界面实现 二. 虚拟设备模拟模拟鼠标实现体感鼠标 2.1 函数声明 2.2 虚拟鼠标实现 2.2.1 虚拟鼠标创建函数 2.2.2 鼠标移动函数 2.2.3 鼠标点击函数 2.3 mpu6050相关函数实现 2.3.1 i2c设备初始化 2.3.2 mpu6050寄存器写入 2.3.3 mpu6050寄存器读取 2.3.…

[Docker排查] 镜像拉取/容器启动/网络不通?Docker常见错误与解决方案

Docker&#xff0c;这个让无数开发者和运维工程师高呼“真香”的容器化技术&#xff0c;凭借其轻量、快速、可移植的特性&#xff0c;极大地简化了应用的开发、测试和部署流程。但即便是再“香”的技术&#xff0c;也难免有“闹脾气”的时候。你是不是也遇到过这样的“抓狂瞬间…

Oracle如何解决LATCH:CACHE BUFFERS CHAINS

CACHE BUFFERS CHAINS LATCH主要用于保护HASH CHAIN结构。一个CACHE BUFFERS CHAINS LATCH保护着多条HASH CHAIN。可以通过查看隐含参数_db_block_hash_latches的值或者查询vlatch_children视图获得系统中CACHE BUFFER CHAIN LATCH的数量。目前系统中CACHE BUFFER CHAIN LATCH的…

手搓四人麻将程序

一、麻将牌的表示 在麻将游戏中&#xff0c;总共有一百四十四张牌&#xff0c;这些牌被分为多个类别&#xff0c;每个类别又包含了不同的牌型。具体来说&#xff0c;麻将牌主要包括序数牌、字牌和花牌三大类。序数牌中&#xff0c;包含有万子、条子和筒子&#xff0c;每种花色…

spring cloud config更新配置

在开发微服务时&#xff0c;往往需要有开发环境、测试环境和生产环境&#xff0c;手动修改配置环境是一件很麻烦的事情&#xff0c;因此&#xff0c;这里使用spring cloud config管理配置环境。要使用spring cloud config&#xff0c;需要先在GitHub搭建一个仓库。 一、仓库搭…

MySQL 5.7 实战:JSON 字段提取、Base64 解码与引号问题全解析

一、背景与问题场景 在 MySQL 数据库中&#xff0c;存储 JSON 格式数据&#xff08;如用户行为日志、配置参数、扩展信息&#xff09;的场景日益普遍。当需要从 JSON 字段中提取特定键值&#xff08;如info&#xff09;并进行 Base64 解码时&#xff0c;常遇到以下问题&#x…