YOLOv8+bytetrack实现多目标追踪

1. bytetrack简介

ByteTrack是一种基于检测的目标追踪算法,它在YOLOv8检测器的基础上进行了改进,实现了更高效的目标追踪,具有简单、高效和通用的特点。相较于传统的多目标跟踪方法,ByteTrack不依赖于ReID模型,而是通过关联每个检测框来进行跟踪。这种方法可以有效地解决低分检测框被简单丢弃的问题,从而减少漏检和碎片化轨迹的情况。

ByteTrack算法流程如下:首先,使用目标检测器对当前帧进行检测,得到一系列候选目标框。然后,利用卡尔曼滤波对目标框进行预测,并利用匈牙利算法进行数据关联,将检测框与历史轨迹进行匹配。对于得分较高的目标框,直接与历史轨迹匹配;对于得分较低的目标框,则与第一次没有匹配上的轨迹进行匹配,用于检测目标遮挡的情形。

为了实现高效的实时多目标跟踪,ByteTrack还采用了一些优化策略。例如,对轨迹进行分类,避免在代码阅读时出现混淆的情形;同时,对于连续两帧都未匹配上的轨迹,将其标记为即将删除的轨迹,从而及时清理无效轨迹。

在实际应用中,ByteTrack能够轻松应用到各种多目标跟踪框架中,并取得显著的性能提升。在MOT17测试集上,ByteTrack实现了80.3 MOTA、77.3 IDF1和63.1 HOTA等优异性能指标,同时在单个V100 GPU上运行速度达到了30 FPS。这表明ByteTrack具有高效、准确和实时性强的特点,能够满足实际应用的需求。

2. 实现流程

使用了 YOLOv8 和 ByteTrack 进行目标识别与跟踪。实现流程:如下面代码所示

  1. 导入必要的库:

    • cv2:用于处理视频和图像。
    • os:用于处理文件路径。
    • ultralytics.YOLO:用于加载 YOLOv8 模型进行目标检测和跟踪。
  2. 加载 YOLOv8 模型:

    model = YOLO(r'track/pt/best.pt')
    

    这行代码加载了预训练的 YOLOv8 模型,该模型用于目标检测和跟踪。

  3. 设置输入视频文件夹路径和输出视频文件夹路径:

    input_video_folder = r"track/input"
    output_video_folder = r"track/output"
    

    这里定义了输入视频文件夹路径和输出视频文件夹路径。

  4. 获取视频文件列表并按文件名排序:

    video_files = [file for file in os.listdir(input_video_folder) if file.endswith(".mp4")]
    video_files.sort()
    

    这行代码获取指定文件夹中所有以 .mp4 结尾的视频文件,并按文件名排序。

  5. 循环处理每个视频文件:

    for video_file in video_files:
    

    这是一个循环,遍历所有视频文件。

  6. 打开视频文件并设置输出视频路径:

    input_video_path = os.path.join(input_video_folder, video_file)
    output_video_path = os.path.join(output_video_folder, video_file)
    

    这里根据当前视频文件构建输入视频文件路径和输出视频文件路径。

  7. 获取视频的帧率和尺寸:

    fps = cap.get(cv2.CAP_PROP_FPS)
    width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    

    这行代码获取视频的帧率和尺寸。

  8. 创建视频写入对象:

    out = cv2.VideoWriter(output_video_path, fourcc, fps, (width, height))
    

    这行代码创建了一个视频写入对象,用于写入处理后的视频帧。

  9. 循环处理视频的每一帧:

    while cap.isOpened():
    

    这是一个循环,用于处理视频的每一帧。

  10. 读取视频的下一帧:

    success, frame = cap.read()
    

    这行代码读取视频的下一帧,并将帧存储在变量 frame 中。

  11. 使用 YOLOv8 模型进行目标检测和跟踪:

    results = model.track(frame, tracker="ultralytics/cfg/trackers/bytetrack.yaml", persist=True)
    

    这行代码使用 YOLOv8 模型对当前帧进行目标检测和跟踪,使用 ByteTrack 跟踪器,并设置 persist=True 以保持跟踪。

  12. 将检测和跟踪结果可视化并写入输出视频:

    annotated_frame = results[0].plot()
    out.write(annotated_frame)
    

    这行代码将检测和跟踪结果可视化在当前帧上,并将结果写入输出视频。

  13. 显示处理后的视频帧:

    cv2.imshow("YOLOv8 Tracking", annotated_frame)
    

    这行代码显示处理后的视频帧。

  14. 检测是否按下 ‘q’ 键:

    if cv2.waitKey(1) & 0xFF == ord("q"):break
    

    如果用户按下键盘上的 ‘q’ 键,则跳出循环。

  15. 释放视频捕获对象和视频写入对象:

    cap.release()
    out.release()
    

    这行代码释放视频捕获对象和视频写入对象,释放视频资源。

  16. 关闭显示窗口:

    cv2.destroyAllWindows()
    

    这行代码关闭 OpenCV 显示的所有窗口。

  17. 显示处理完成信息:

    print("所有视频处理完成!")
    

    这行代码打印输出所有视频处理完成的消息。

3. 总体代码:

import cv2
from ultralytics import YOLO
import os# Load the YOLOv8 model
model = YOLO(r'track/pt/best.pt')# 输入视频文件夹路径和输出视频文件夹路径
input_video_folder = r"track/input"
output_video_folder = r"track/output"# 获取视频文件夹中的所有视频文件名,并按文件名排序
video_files = [file for file in os.listdir(input_video_folder) if file.endswith(".mp4")]
video_files.sort()# 循环处理每个视频文件
for video_file in video_files:# 打开视频文件input_video_path = os.path.join(input_video_folder, video_file)cap = cv2.VideoCapture(input_video_path)# 获取输出视频文件名output_video_path = os.path.join(output_video_folder, video_file)# 获取视频的帧率和尺寸fps = cap.get(cv2.CAP_PROP_FPS)width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))# 创建视频写入对象fourcc = cv2.VideoWriter_fourcc(*'mp4v')out = cv2.VideoWriter(output_video_path, fourcc, fps, (width, height))# Loop through the video frameswhile cap.isOpened():# Read a frame from the videosuccess, frame = cap.read()if success:# Run YOLOv8 tracking on the frame, persisting tracks between framesresults = model.track(frame, tracker="ultralytics/cfg/trackers/bytetrack.yaml", persist=True)# Visualize the results on the frameannotated_frame = results[0].plot()# Write the annotated frame to the output videoout.write(annotated_frame)# Display the annotated framecv2.imshow("YOLOv8 Tracking", annotated_frame)# Break the loop if 'q' is pressedif cv2.waitKey(1) & 0xFF == ord("q"):breakelse:# Break the loop if the end of the video is reachedbreak# Release the video capture and video write objectscap.release()out.release()# Close the display window
cv2.destroyAllWindows()print("所有视频处理完成!")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/830504.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在国内 PMP 有多少含金量?

PMP认证并不是对所有人都有价值,也并不是考到它必须会升值加薪,那可能就有人会问了,那我为什么还要考PMP?此言差矣,我个人项目管理行业混迹了这么多年了,真正对我有用的证书除了学历以外就是PMP认证了&…

Ubuntu 24.04 LTS (Noble Numbat) 正式版发布

Ubuntu 24.04 LTS (Noble Numbat) 正式版发布 Canonical 的第 10 个长期支持版本在性能工程、企业安全和开发人员体验方面树立了新标准 请访问原文链接:Ubuntu 24.04 LTS (Noble Numbat) 正式版发布,查看最新版。原创作品,转载请保留出处。…

搭建基础镜像(centos+jdk)

搭建基础镜像(centosjdk) 1. 目录结构1.1 应用目录2.2 镜像目录 2. 编写Dockerfile2.1 设置工作目录2.2 解决时间同步问题(设置时区)2.3 核心逻辑2.4 设置环境变量 3. 构建镜像3.1 构建镜像3.2 导出镜像 1. 目录结构 1.1 应用目录…

10.MMD 室内场景导入背景视频和灯光

导入背景视频 1. 导入人物和场景 场景是Akali’s room,可以在墙壁上添加视频 先添加主场景 2. 修改视频文件格式 在背景里选择导入背景视频文件 需要将mp4视频格式转化为AVI格式 方法一 先将视频导入格式工厂 点击配置 将视频编码改成DivX 再开始处理 …

DockerUI安装使用

DockerUI安装使用 主机环境 [roottest01 ~]# uname -a Linux test01 3.10.0-862.el7.x86_64 #1 SMP Fri Apr 20 16:44:24 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux [roottest01 ~]# cat /etc/redhat-release CentOS Linux release 7.5.1804 (Core)安装 [roottest01 ~]# doc…

【算法基础实验】图论-UnionFind连通性检测之quick-find

Union-Find连通性检测之quick-find 理论基础 在图论和计算机科学中,Union-Find 或并查集是一种用于处理一组元素分成的多个不相交集合(即连通分量)的情况,并能快速回答这组元素中任意两个元素是否在同一集合中的问题。Union-Fin…

分布式存储 Ceph 的演进经验

从 2004 年到今天,Ceph 的存储后端一直都在演变,从最开始基于 B 树的 EBOFS 演变到今天的 BlueStore,存储后端已经变得非常成熟,新的存储系统不仅能够提供良好的性能,还有着优异的兼容性。我们在这篇文章中将要简单介绍…

Android SQLiteDatabase的使用详解

1、数据库–公共变量: 2、数据库–打开: 3、数据库–增: 4、数据库–删: 5、数据库–改: 6、数据库–查: 7、数据库–关闭: 8、数据库–辅助工具: 9、数据库–效果&…

配置DHCP和DNS

DHCP DHCP原理 作用:是一种网络协议,用于自动分配IP地址、子网掩码、默认网关、DNS服务器等TCP/IP参数 1.DHCP的四个报文 1.discover报文: 找寻dhcp服务器 2.offer报文: 服务器回复discover报文并且携带网络配置信息&#xff…

我在公司干了两年,有个在公司工作三年的成员要离职,接手别人代码才发现真的是一言难尽

微服务框架是别的团队的人搭建的,他负责单独开发一个报表模块,这是初始版本,还未上线 1、nacos做注册中心,却胡乱注册,服务命名有下划线 测试环境nacos配置命名空间为dev,直接与其他的微服务test命名空间…

Qt QLineEdit详解

1.简介 QLineEdit是一个单行文本编辑器。 行编辑允许用户使用一组有用的编辑功能输入和编辑单行纯文本,包括撤消和重做、剪切和粘贴以及拖放。 通过更改行编辑的echoMode,它也可以用作“只写”字段,用于密码等输入。 文本的长度可以限制为ma…

毅四捕Go设计模式笔记——命令模式

命令模式(Command Pattern) 为了解决什么问题? 命令模式的目的是将请求发起者和请求执行者解耦,使得请求的发起者不需要知道具体的执行者是谁,也不需要知道执行的具体过程,只需要发送请求即可。 通过使用…

如何轻松在D盘新建文件夹?意外丢失的文件夹怎么找回

对于很多刚接触电脑的朋友来说,如何正确地新建文件夹并将其放置在特定盘符(如D盘)可能是一个不小的挑战。同时,如果新建的文件夹突然消失,而我们又确信自己没有删除它,那么该如何找回呢?本文将为…

直播间怎么提高流量?巨量千川官方真实投流助力获客轻松翻倍

随着互联网的快速发展,直播已经成为了一种极具吸引力和互动性的娱乐和营销方式。然而,如何提高直播间的流量,(直播间流量:kxs7667)吸引更多观众成为了每个直播主都关注的重要问题。与此同时,巨量千川官方真实投流作为一…

如何在WordPress中设置网站的SEO标题和描述

在WordPress中,想要让你的网站在搜索引擎结果中脱颖而出,设置优秀的SEO标题和描述至关重要。这不仅可以帮助搜索引擎更好地理解你的网站内容,还可以吸引更多的点击率和流量。而选择一款合适的SEO插件是实现这一目标的关键之一。让我们来看看两…

pgvector扩展在IvorySQL Oracle兼容模式下的应用实践

向量数据库是生成式人工智能(GenAI)的关键组成部分。作为PostgreSQL的重要扩展,pgvector支持高达16000维的向量计算能力,使得PostgreSQL能够直接转化为高效的向量数据库。 IvorySQL基于PostgreSQL开发,因此它同样支持添加pgvector扩展。在Ora…

部署YUM仓库及NFS共享服务

YUM yum仓库常用类型: 本地源仓库:baserulfile:// 在线源仓库:baserulhttp:// ftp源仓库:baseru:ftp:// 实验: 首先安装软件 [rootlocalhost yum.repos.d]# cd /mnt/Packages/ [rootloca…

基于FPGA的数字信号处理(3)--什么是浮点数?

科学计数法 你可能不了解「浮点数」&#xff0c;但你一定了解「科学记数法」。 10进制科学记数法把一个数表示成a与10的n次幂相乘的形式&#xff08;1≤|a|<10&#xff0c;a不为分数形式&#xff0c;n为整数&#xff09;&#xff0c;例如&#xff1a; 19970000000000 1.9…

2024-04学习笔记

1.sql优化-子查询改为外连接 1.改之前 改之前是这样&#xff0c;那针对查出来的每一条数据&#xff0c;都要执行一次箭头所指的函数 执行的sql很慢 2.改之后 改之后是这样&#xff0c;整体做外连接&#xff0c;不用每一条都再执行一次查询 执行时间缩短了好几倍 2.Mybatis中…

Mysql基础(四)DML之insert语句

一 insert 语句 强调&#xff1a; 本文介绍的内容很基础,仅做记录用,参考价值较少 ① 总述 目的&#xff1a; 增加rows记录1、完整格式insert [into] 表名[字段名1[, 字段名2]] value[s](值1, 值2);备注&#xff1a;指定部分字段添加,没有被指定的字段要么会自动增长,要…