YOLOv12本地部署教程——42%速度提升,让高效目标检测触手可及

YOLOv12 是“你只看一次”(You Only Look Once, YOLO)系列的最新版本,于 2025 年 2 月发布。它引入了注意力机制,提升了检测精度,同时保持了高效的实时性能。在保持速度的同时,显著提升了检测精度。例如,YOLOv12-N 在 T4 GPU 上的推理延迟为 1.64 毫秒,平均精度(mAP)达到 40.6%,相比 YOLOv10-N 和 YOLOv11-N 分别提升了 2.1% 和 1.2%

1741228236413_20250306101338.png

YOLOv12 作为 YOLO 系列的最新迭代,首次将注意力机制深度融入单阶段检测框架,通过三大关键技术实现性能飞跃:

  • 区域注意力模块(A2):通过特征图分块与重塑操作,将全局注意力的计算复杂度从二次方降至线性,同时保留大感受野,兼顾效率与精度。

  • 残差高效层聚合网络(R-ELAN):引入块级残差连接与动态缩放技术,解决传统ELAN的梯度阻塞问题,提升训练稳定性与特征融合能力。

  • 极简架构设计:移除位置编码、降低MLP扩展比、减少堆叠块深度,结合FlashAttention优化内存访问效率,推理速度较YOLOv9提升42%。

在性能方面更是全面碾压前代模型,在 MS COCO 基准测试中,YOLOv12展现出显著优势:

  • 小型模型(YOLOv12-N):以40.6% mAP超越YOLOv10-N(38.5%),延迟仅1.64毫秒/图像。

  • 中型模型(YOLOv12-S):48.0% mAP,较YOLOv8-S提升3.0%,计算量降低至21.4G FLOPs。

  • 跨任务兼容性:支持实例分割、姿态估计等扩展任务,在复杂场景(如遮挡、低光照)中检测精度提升15%以上。

与基于 Transformer 的 RT-DETR 相比,YOLOv12-S 快42%、仅需36%计算资源,在实时性与部署成本上占据绝对优势。

接下来就为大家奉上详细的 YOLOv12 本地部署教程,手把手教你如何将模型部署到你的项目中,轻松享受高性能AI带来的便利。

二、部署流程

环境推荐配置

系统:Ubuntu22.04,

显卡:4090,

显存:24G,cuda11.8

1. 基础环境

查看系统是否有Miniconda3的虚拟环境

conda -V

如果输入命令没有显示Conda版本号,则需要安装。

1733121521985_image.png

2.更新系统命令

输入下列命令将系统更新及系统下载

apt-get update && apt-get install ffmpeg libsm6 libxext6  -y

1733121540798_image.png

3.创建虚拟环境

创建名称为“yolov12”的虚拟环境并激活

conda create -n yolov12 python=3.11 -y
conda activate yolov12

1741228987875_20250224102029.png

4.下载模型

输入下列命令下载yolov12模型同时进入项目中

git clone https://gitclone.com/github.com/sunsmarterjie/yolov12.git 
cd yolov12/

1741229001963_20250224102138.png

5.下载模型依赖包

输入下列命令:

pip install -r requirements.txt

1741229257788_20250306104714.png


出现报错,重新使用命令下载包同时换源加速:

wget https://github.com/Dao-AILab/flash-attention/releases/download/v2.7.3/flash_attn-2.7.3+cu11torch2.2cxx11abiFALSE-cp311-cp311-linux_x86_64.whl

1741229869835_20250224101700.png

pip install -r requirements.txt  -i https://pypi.tuna.tsinghua.edu.cn/simple

1741229398884_20250224102518.png

继续下载其他依赖包

pip install -e .

1741229462635_20250224112924.png

三、网页演示

在本地运行Gradio应用程序,使用下列命令运行项目呈现模型的成功界面

python app.py

1741229154861_20250224113202.png

打开网址:

1741228669675_20250306101322.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/897124.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【原创】C# HttpClient 读取流数据的问题

默认情况下HttpClient中有缓存,在读取流数据的时候,往往要等一小会儿,然后读出一大堆。 我们在请求OpenAI类的大模型的时候,往往要一边读取一边显示(输出),这时候需要禁止HttpClient 中内置的缓…

能源行业标杆:信创系统在智能电网中的3个创新应用案例

在当今数字化浪潮汹涌澎湃的时代,信息技术应用创新(信创)已成为推动我国经济社会发展的重要引擎。智能电网作为能源行业的核心领域,其信息化建设对于保障国家能源安全和促进能源转型具有重要意义。今天,让我们一同探索…

AcWing 蓝桥杯集训·每日一题2025·5526. 平衡细菌

5526. 平衡细菌 题意 给定一个序列 ( a i ) (a_i) (ai​),每次操作可以选择一个位置 (p),令从 ( a p ) (a_p) (ap​) 开始的每个数都加上一个以 (1) 或者 (-1) 为公差的从 ( 1 / − 1 ) (1 / -1) (1/−1) 开始的等差数列。求最小化让序列归零的操作…

PTA 7-6 列出连通集

题目详情: 给定一个有 n 个顶点和 m 条边的无向图,请用深度优先遍历(DFS)和广度优先遍历(BFS)分别列出其所有的连通集。假设顶点从 0 到 n−1 编号。进行搜索时,假设我们总是从编号最小的顶点出…

ES中数据刷新策略refresh

在 Elasticsearch 中,插入数据时的 refresh 参数控制文档在写入后何时对搜索可见,其行为直接影响数据可见性和系统性能。以下是 refresh 参数的三个可选值(true、false、wait_for)的详细说明及适用场景: 1. refreshtr…

用Python的Pandas库解锁数据科学:从入门到实战

用Python的Pandas库解锁数据科学:从入门到实战 引言 Python的Pandas库(名称源自"Panel Data")作为数据科学生态系统的基石,凭借其强大的数据结构和灵活的操作功能,已成为全球超过90%数据工作者的首选工具。…

如何提高域名解析速度?

在搭建网站或使用在线服务时,许多人会问:“为什么我的网站加载速度这么慢?”“如何提高域名解析速度?”“域名解析速度对网站性能有什么影响?”域名解析速度直接影响用户访问网站的体验,因此,了解如何提高域名解析速度尤为重要…

深度学习语义分割数据集全景解析

一、语义分割任务概述 语义分割是计算机视觉领域的核心任务之一,目标是通过算法将图像中的每个像素精准划分到对应的语义类别(如道路、车辆、行人等)。高质量标注数据集是推动该领域发展的关键因素。本文将系统梳理主流数据集的技术特征与适…

贪心算法一

> 作者:დ旧言~ > 座右铭:松树千年终是朽,槿花一日自为荣。 > 目标:了解什么是贪心算法,并且掌握贪心算法。 > 毒鸡汤:有些事情,总是不明白,所以我不会坚持。早安! >…

基于websocket的多用户网页五子棋 --- 测试报告

目录 功能测试自动化测试性能测试 功能测试 1.登录注册页面 2.游戏大厅页面 3.游戏房间页面 自动化测试 1.使用脑图编写web自动化测试用例 2.创建自动化项目,根据用例通过selenium来实现脚本 根据脑图进行测试用例的编写: 每个页面一个测试类&am…

docker学习与使用

一、docker概述 1.docker是什么 是一个开源的应用容器引擎,基于go语言开发并遵循apache2.0协议开源 是在Linux容器里运行应用的开源工具 是一种轻量级的 “虚拟机” Docker的容器技术,可以在一台主机上轻松为任何应用创建一个轻量级的、可移植的、自给自足的容器…

2025-03-04 学习记录--C/C++-C语言 判断是否是素数

合抱之木&#xff0c;生于毫末&#xff1b;九层之台&#xff0c;起于累土&#xff1b;千里之行&#xff0c;始于足下。&#x1f4aa;&#x1f3fb; C语言 判断是否是素数 一、代码 ⭐️ #include <stdio.h> #include <stdbool.h> // 使用 bool 类型// 判断是否是…

如何将飞书多维表格与DeepSeek R1结合使用:效率提升的完美搭档

将飞书的多维表格与DeepSeek R1结合使用&#xff0c;就像为你的数据管理和分析之旅装上一台涡轮增压器。两者的合作&#xff0c;不仅仅在速度上让人耳目一新&#xff0c;更是将智能化分析带入了日常的工作场景。以下是它们如何相辅相成并改变我们工作方式的一些分享。 --- 在…

离散傅里叶变换(Discrete Fourier Transform, DFT)及其在图像处理中的应用

离散傅里叶变换&#xff08;DFT&#xff09;及其在图像处理中的应用 什么是离散傅里叶变换&#xff1f; 离散傅里叶变换&#xff08;Discrete Fourier Transform, DFT&#xff09;是一种强大的数学工具&#xff0c;用于将离散信号从时域&#xff08;或空间域&#xff09;转换…

在 macOS 上使用 CLion 进行 Google Test 单元测试

介绍 Google Test&#xff08;GTest&#xff09;是 Google 开源的 C 单元测试框架&#xff0c;它提供了简单易用的断言、测试夹具&#xff08;Fixtures&#xff09;和测试运行机制&#xff0c;使 C 开发者能够编写高效的单元测试。 本博客将介绍如何在 macOS 上使用 CLion 配…

Oracle SQL优化实战要点解析(11)——索引、相关子查询及NL操作(1)

11.1. 充分利用索引有序特性,避免发生大表上的FTS,以及对中间大数据集的排序。 11.1.1. 适用场景 从一个或多个大表(例如:亿行级或TB级数据量)中过滤出全列大数据集(例如:数百万或千万行数据),对该大数据集按其中某列进行排序,最终,只取最前面的少部分数据(例如:…

软考架构师笔记-计算机网络

1.9 计算机网络 OSI/RM 七层模型 物理层 二进制传输(中继器、集线器) (typedef) 数据链路层 传送以帧为单位的信息(网桥、交换机、网卡) 网络层 分组传输和路由选择(三层交换机、路由器)ARP/RARP/IGMP/ICMP/IP 传输层 端到端的连接(TCP/UDP)在前向纠错系统中&#xff0c;当接…

STM32MP157A单片机移植Linux系统使用python链接云服务器

思维导图 需求分析 stm32mp157a单片机上移植Linux操作系统&#xff0c;包括LCD驱动、触摸驱动、Ethernet/WiFi支持&#xff0c;设备树信息包括ADC、GPIO、LCD&#xff0c;使用QT上位机在PC端显示&#xff0c;通过TCP与stm32交互&#xff0c;将ad数据传输到PC端和云服务器&…

【MySQL】Can‘t connect to server in ‘localhost‘

【问题】连接MySQL数据库时报错&#xff1a; 【原因】没有启动MySQL服务 【解决方法】&#x1f447;&#x1f447;&#x1f447; 1.以管理员身份运行PowerShell 2.执行命令&#xff1a;net start MySQL 提示 “MySQL服务已经启动成功” 就说明成功了&#xff0c;这时再连…

OceanBase-obcp-v3考试资料梳理

集群架构 基本概念 集群: 集群由一个或多个Region组成,Region 由一个或多个Zone组成,Zone由一个或多个OBServer组成,每个OBServer里有若干个partition的Replica。 Region: 对应物理上的一个城市或地域,当OB集群由多个Region组成时, 数据库的数据和服务能力就具备地域…