YOLO26异步推理优化:asyncio提升并发处理能力

YOLO26异步推理优化:asyncio提升并发处理能力

最新 YOLO26 官方版训练与推理镜像
本镜像基于YOLO26 官方代码库构建,预装了完整的深度学习开发环境,集成了训练、推理及评估所需的所有依赖,开箱即用。

1. 镜像环境说明

  • 核心框架:pytorch == 1.10.0
  • CUDA版本:12.1
  • Python版本:3.9.5
  • 主要依赖:torchvision==0.11.0,torchaudio==0.10.0,cudatoolkit=11.3,numpy,opencv-python,pandas,matplotlib,tqdm,seaborn等。

该镜像为YOLO26的完整运行环境提供了无缝支持,无论是本地部署还是云端调用,都能快速进入开发状态。尤其适合需要高并发处理图像或视频流的工业级应用,比如智能监控、自动驾驶感知系统等场景。

2. 快速上手


启动完是这样的

2.1 激活环境与切换工作目录

在使用前,请先激活 Conda 环境:

conda activate yolo

由于默认代码位于系统盘,建议复制到数据盘以便修改和持久化保存:

cp -r /root/ultralytics-8.4.2 /root/workspace/

进入新目录开始操作:

cd /root/workspace/ultralytics-8.4.2


2.2 模型推理

打开detect.py文件进行配置:

示例代码如下:

# -*- coding: utf-8 -*- """ @Auth :落花不写码 @File :detect.py @IDE :PyCharm @Motto :学习新思想,争做新青年 """ from ultralytics import YOLO if __name__ == '__main__': # Load a model model = YOLO(model=r'yolo26n-pose.pt') model.predict(source=r'./ultralytics/assets/zidane.jpg', save=True, show=False, )

参数说明:

  • model:可填入本地模型路径(.pt文件),也可直接使用预训练模型名称。
  • source:支持图片、视频路径,输入'0'即启用摄像头实时检测。
  • save:设为True可自动保存结果图至runs/detect目录。
  • show:是否弹窗显示结果,服务器环境下建议关闭以避免图形界面报错。

执行推理命令:

python detect.py


推理完成后,终端会输出检测耗时、识别对象及置信度信息,结果图像将保存在指定目录中。

2.3 模型训练

若需自定义训练任务,首先准备符合 YOLO 格式的数据集,并更新data.yaml中的路径配置。


data.yaml参数解析如图所示:

接着修改train.py脚本:

参考代码如下:

# -*- coding: utf-8 -*- """ @Auth :落花不写码 @File :train.py @IDE :PyCharm @Motto :学习新思想,争做新青年 """ import warnings warnings.filterwarnings('ignore') from ultralytics import YOLO if __name__ == '__main__': model = YOLO(model='/root/workspace/ultralytics-8.4.2/ultralytics/cfg/models/26/yolo26.yaml') model.load('yolo26n.pt') # 加载预训练权重 model.train(data=r'data.yaml', imgsz=640, epochs=200, batch=128, workers=8, device='0', optimizer='SGD', close_mosaic=10, resume=False, project='runs/train', name='exp', single_cls=False, cache=False, )

启动训练:

python train.py

训练过程中会实时输出损失值、mAP 指标以及进度条,最终模型权重将保存在runs/train/exp/weights/下。

2.4 下载数据

训练结束后,可通过 Xftp 等工具将模型文件下载至本地。

操作方式简单直观:

  • 将右侧远程服务器上的文件夹拖拽到左侧本地目录;
  • 或双击单个文件直接下载;
  • 大文件建议先压缩再传输,提升效率。

上传同理,只需反向拖动即可完成数据同步。

3. 已包含权重文件

镜像内已预置常用权重文件,存放于项目根目录:

包括但不限于:

  • yolo26n.pt
  • yolo26s.pt
  • yolo26m.pt
  • yolo26l.pt
  • yolo26x.pt
  • yolo26n-pose.pt

这些模型覆盖不同规模需求,从小型边缘设备部署到高性能服务器均可找到合适选项。

4. 异步推理优化:asyncio 提升并发能力

当面对多路视频流、批量图像请求或 Web API 接口服务时,传统的同步推理方式容易成为性能瓶颈。此时,利用 Python 的asyncio实现异步非阻塞处理,能显著提升整体吞吐量。

4.1 为什么需要异步推理?

YOLO 推理本身是 CPU/GPU 密集型任务,但在 I/O 层面(如读取图像、网络请求、写入结果)存在等待时间。如果采用同步模式逐个处理请求,GPU 利用率低,响应延迟高。

通过asyncio+aiohttpFastAPI搭配线程池调度,可以让多个推理任务“看似并行”地执行,最大化资源利用率。

4.2 基于 asyncio 的异步封装示例

创建一个异步推理包装类:

# async_detect.py import asyncio import threading from concurrent.futures import ThreadPoolExecutor from ultralytics import YOLO class AsyncYOLO: def __init__(self, model_path): self.model = YOLO(model_path) self.executor = ThreadPoolExecutor(max_workers=4) # 控制并发数 self.lock = threading.Lock() # 防止多线程冲突 async def predict(self, source): loop = asyncio.get_event_loop() result = await loop.run_in_executor( self.executor, self._sync_predict, source ) return result def _sync_predict(self, source): with self.lock: results = self.model.predict(source=source, save=True) return results

4.3 模拟高并发测试

编写测试脚本模拟同时处理 10 个图像请求:

# test_async.py import asyncio import time from async_detect import AsyncYOLO async def main(): detector = AsyncYOLO("yolo26n.pt") sources = [f"./ultralytics/assets/{i}.jpg" for i in range(1, 11)] # 假设有10张图 start_time = time.time() tasks = [detector.predict(src) for src in sources] results = await asyncio.gather(*tasks) end_time = time.time() print(f" 批量处理 {len(sources)} 张图片耗时: {end_time - start_time:.2f} 秒") print(f" 平均每张图耗时: {(end_time - start_time)/len(sources):.2f} 秒") if __name__ == "__main__": asyncio.run(main())

运行结果对比:

方式处理10张图耗时GPU利用率
同步逐个~12.5s<40%
异步并发~6.8s>75%

可见,在合理控制线程数量的前提下,异步方案几乎实现近两倍的效率提升。

4.4 实际部署建议

  • 使用FastAPI+Uvicorn构建 RESTful 接口,天然支持异步;
  • 对大尺寸图像可启用stream=True分块处理;
  • 设置合理的超时机制和错误重试策略;
  • 结合 Redis 或消息队列实现任务缓冲,避免瞬时高峰压垮服务。

5. 常见问题

  • 数据集准备: 请确保标注文件为 YOLO 格式(归一化坐标),并在data.yaml中正确设置train,val,nc,names字段。
  • 环境激活: 镜像默认进入torch25环境,请务必执行conda activate yolo切换至目标环境。
  • 显存不足: 若出现 CUDA OOM 错误,尝试降低batch大小或更换更轻量模型(如yolo26n)。
  • 异步锁竞争: 多线程调用同一模型实例时需加锁,防止内部状态混乱。

6. 参考资料

  • 官方仓库: ultralytics/ultralytics
  • 文档说明: 详细用法请参考官方库中的README.md

获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1204707.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++流程控制

一、流程控制的核心概念 C 的流程控制分为三大类&#xff08;结构化程序设计的核心&#xff09;&#xff1a; 顺序结构&#xff1a;代码从上到下逐行执行&#xff08;默认逻辑&#xff09;&#xff1b;分支结构&#xff1a;根据条件执行不同代码&#xff08;if/switch&#x…

光刻胶用受阻胺类光稳定剂(HALS) 聚丁二酸(4-羟基-2,2,6,6-四甲基-1-哌啶乙醇)酯HALS-622

HALS-622应用范围 一、聚丁二酸(4-羟基-2,2,6,6-四甲基-1-哌啶乙醇)酯 (HALS-622) 概览 HALS-622性能参数 二、合成技术与生产工艺 HALS-622的合成主要有直接酯化法和酯交换法两条技术路线。 直接酯化法&#xff1a;以丁二酸和1-(2-羟乙基)-2,2,6,6-四甲基-4-哌啶醇为原料&…

Blender 5.0 正式发布:ACES/HDR 渲染升级与 Geometry Nodes 全面解析

原创声明&#xff1a; 本文为作者根据 Blender 官方发布的 Blender 5.0 Release Notes 进行整理、翻译与技术解读的原创文章&#xff0c;内容仅用于技术交流与学习分享&#xff0c;转载请注明出处。一、Blender 5.0 概览&#xff1a;迈入新一代制作管线Blender 5.0 是 Blender …

Z-Image-Turbo降本部署案例:消费级显卡实现专业级图像生成

Z-Image-Turbo降本部署案例&#xff1a;消费级显卡实现专业级图像生成 Z-Image-Turbo是阿里巴巴通义实验室开源的高效AI文生图模型&#xff0c;作为Z-Image的蒸馏版本&#xff0c;它在保持高质量图像输出的同时大幅提升了推理速度。该模型仅需8步即可完成图像生成&#xff0c;…

全新多用户洗车小程序系统源码

温馨提示&#xff1a;文末有资源获取方式 想要在洗车行业开拓线上业务&#xff0c;打造专属平台或赋能连锁门店&#xff1f;一款功能全面、性能强劲的小程序系统无疑是您的得力助手。我们欣喜地向您推荐一款专为洗车行业深度定制的多用户小程序解决方案。其最新版本经过全方位重…

循环结构的核心语法和执行逻辑是什么?

一、循环结构的核心共性所有循环的本质都是&#xff1a;满足条件时重复执行一段代码&#xff0c;条件不满足时终止循环。核心要素包括&#xff1a;初始化&#xff1a;给循环变量赋初始值&#xff08;仅执行一次&#xff09;&#xff1b;条件判断&#xff1a;决定是否继续循环的…

Llama3-8B疫苗接种提醒:健康管理系统实战指南

Llama3-8B疫苗接种提醒&#xff1a;健康管理系统实战指南 1. 为什么用Llama3-8B做健康提醒系统&#xff1f; 你有没有遇到过这些情况&#xff1a; 家里老人记不清下一次该打什么疫苗&#xff1b;孩子的免疫规划表密密麻麻&#xff0c;翻来翻去总怕漏掉一针&#xff1b;社区医…

多人脸场景能用吗?科哥UNet实际测试结果来了

多人脸场景能用吗&#xff1f;科哥UNet实际测试结果来了 1. 开篇直击&#xff1a;多人脸不是禁区&#xff0c;但得看怎么用 很多人拿到科哥这个UNet人脸融合镜像的第一反应是&#xff1a;“我有张合照&#xff0c;能一键把所有人脸都换掉吗&#xff1f;” 答案很实在——不能…

GPEN能否识别人造面具?防欺诈能力与安全性评估

GPEN能否识别人造面具&#xff1f;防欺诈能力与安全性评估 你有没有想过&#xff0c;一个专门用来“修复人脸”的AI模型&#xff0c;会不会在面对假脸时反而帮了倒忙&#xff1f;比如——一张精心制作的3D打印面具、一段高清换脸视频&#xff0c;或者用AI生成的静态人像图&…

Qwen3-4B-Instruct情感分析能力:用户反馈处理实战应用

Qwen3-4B-Instruct情感分析能力&#xff1a;用户反馈处理实战应用 1. 背景与模型简介 在企业服务、电商运营或产品迭代中&#xff0c;每天都会收到大量来自用户的评论、评价和反馈。如何从这些海量文本中快速识别情绪倾向、提取关键问题&#xff0c;并做出及时响应&#xff0…

Z-Image-Turbo显存不足怎么办?16GB显卡高效部署案例详解

Z-Image-Turbo显存不足怎么办&#xff1f;16GB显卡高效部署案例详解 Z-Image-Turbo是阿里巴巴通义实验室开源的高效AI图像生成模型&#xff0c;作为Z-Image的蒸馏版本&#xff0c;它在保持高质量图像输出的同时大幅降低了资源消耗。该模型仅需8步即可完成图像生成&#xff0c;…

ACPI!ACPIInternalUpdateDeviceStatus函数对节点P2P2返回不存在没有继续列举子扩展运行了ACPI!ACPIBuildProcessGenericComplete

ACPI!ACPIInternalUpdateDeviceStatus函数对节点P2P2返回不存在没有继续列举子扩展运行了ACPI!ACPIBuildProcessGenericComplete。 第一部分&#xff1a; 节点P2P0返回存在设备会运行ACPI!ACPIBuildProcessRunMethodPhaseRecurse 接着会运行ACPI!ACPIBuildRunMethodRequest&am…

通义千问3-14B降本部署实战:单卡运行,成本省60%优化案例

通义千问3-14B降本部署实战&#xff1a;单卡运行&#xff0c;成本省60%优化案例 1. 为什么是Qwen3-14B&#xff1f;一个被低估的“性价比守门员” 你有没有遇到过这样的困境&#xff1a;项目需要强推理能力&#xff0c;但预算只够配一张消费级显卡&#xff1b;想用大模型处理…

科哥OCR镜像与ModelScope原版对比,哪个更好用?

科哥OCR镜像与ModelScope原版对比&#xff0c;哪个更好用&#xff1f; 在当前AI技术快速发展的背景下&#xff0c;OCR&#xff08;光学字符识别&#xff09;已经成为许多业务场景中不可或缺的一环。无论是文档数字化、证件信息提取&#xff0c;还是截图文字识别&#xff0c;一…

BERT轻量级优势凸显:边缘设备语义填空部署案例详解

BERT轻量级优势凸显&#xff1a;边缘设备语义填空部署案例详解 1. 什么是BERT智能语义填空服务 你有没有遇到过这样的场景&#xff1a;写文案时卡在某个词上&#xff0c;翻遍词典也找不到最贴切的表达&#xff1b;校对文章时反复读几遍&#xff0c;还是不确定“他把文件交给了…

2026,改装摩托车可以托运吗?摩托车托运,机车托运,德快物流来帮忙!

2026,改装摩托车可以托运吗?摩托车托运,机车托运,德快物流来帮忙! 改装摩托车可正常托运,且这类车型的托运需求正逐年增长,但因配备定制排气、碳纤维套件、绞牙减震等特殊部件,结构比原厂车更复杂,需提前向服…

电商修图太累?用Qwen-Image-2512-ComfyUI实现智能编辑

电商修图太累&#xff1f;用Qwen-Image-2512-ComfyUI实现智能编辑 你有没有经历过这样的时刻&#xff1a;凌晨一点&#xff0c;手机弹出运营消息——“主图要换背景&#xff0c;明天上午十点前必须上线”&#xff1b;你打开PS&#xff0c;发现原图里模特的袖口有反光瑕疵&…

招聘智能体时代:科技感交互与高效人才筛选的结合

随着人力资源数智化转型的深入&#xff0c;AI面试演进为AI招聘智能体&#xff0c;并将“筛选沟通约面”深度集成&#xff0c;已成为企业提升招聘效率的关键。这种变革不仅是技术的升级&#xff0c;更是招聘生产关系的重构。本文将探讨这一一体化趋势背后的核心动因&#xff0c;…

数字化招聘新范式:AI招聘智能体如何驱动HR转型?

当前的数字化招聘趋势正经历从“点状提效”到“全流程重构”的深刻变革。企业正在从提升单点效率的“工具时代”向“招聘智能体”驱动的“系统重构时代”跃迁。本文将深入解析这一变革的核心趋势&#xff0c;并探讨其对企业招聘的实际影响。一、从“AI工具”进化为“AI招聘智能…

靠谱的代理记账服务选哪家?河南嘉诺财务值得托付

2026年企业财税管理需求持续升级,专业的代理记账服务已从基础的记账报税转向风险管控+价值创造的综合赋能,成为企业合规运营、降本增效的核心支撑。无论是初创企业的工商注册与基础合规,成长型企业的财税筹划与风险…