yolov5单目测距+速度测量+目标跟踪(算法介绍和代码)

在这里插入图片描述

要在YOLOv5中添加测距和测速功能,您需要了解以下两个部分的原理:

单目测距算法

  • 单目测距是使用单个摄像头来估计场景中物体的距离。常见的单目测距算法包括基于视差的方法(如立体匹配)和基于深度学习的方法(如神经网络)。
  • 基于深度学习的方法通常使用卷积神经网络(CNN)来学习从图像到深度图的映射关系。

单目测距代码

单目测距涉及到坐标转换,代码如下:

def convert_2D_to_3D(point2D, R, t, IntrinsicMatrix, K, P, f, principal_point, height):"""例如:像素坐标转世界坐标Args:point2D: 像素坐标点R: 旋转矩阵t: 平移矩阵IntrinsicMatrix:内参矩阵K:径向畸变P:切向畸变f:焦距principal_point:主点height:Z_wReturns:返回世界坐标系点,point3D_no_correct, point3D_yes_correct"""point3D_no_correct = []point3D_yes_correct = []##[(u1,v1),#   (u2,v2)]point2D = (np.array(point2D, dtype='float32'))

在YOLOv5中添加单目测距功能的一种方法是,在训练集上收集带有物体标注和深度信息的数据。然后,可以使用深度学习模型(如卷积神经网络)将输入图像映射到深度图。训练完成后,您可以使用该模型来估计图像中物体的距离。
在这里插入图片描述

差帧算法(Frame Difference Algorithm)

  • 差帧算法是一种基于视频序列的帧间差异来计算物体速度的方法。它基于一个简单的假设:相邻帧之间物体的位置变化越大,物体的速度越快。
  • 差帧算法是一种基于视频序列的帧间差异来计算物体速度的方法。其原理是计算物体在相邻两帧之间的位置差异,然后通过时间间隔来计算物体的速度。

假设物体在第t帧和第(t-1)帧中的位置分别为pt和pt-1,则可以使用欧氏距离或其他相似度度量方法来计算它们之间的距离:

d = ||pt - pt-1||

其中||.||表示欧氏距离。然后,通过时间间隔Δt来计算物体的平均速度v:

v = d / Δt

其中,Δt表示第t帧和第(t-1)帧之间的时间间隔。在实际应用中,可以根据需要对速度进行平滑处理,例如使用移动平均或卡尔曼滤波等方法。

测速代码

以下是一个简单的差帧算法代码示例,用于计算物体在视频序列中的速度:```python
import cv2
import numpy as np# 读取视频文件
cap = cv2.VideoCapture('video.mp4')# 初始化参数
prev_frame = None
prev_position = None
fps = cap.get(cv2.CAP_PROP_FPS)  # 视频帧率
speeds = []  # 存储速度值while cap.isOpened():ret, frame = cap.read()if not ret:breakgray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)if prev_frame is not None:# 计算当前帧和前一帧之间的位置差异flow = cv2.calcOpticalFlowFarneback(prev_frame, gray, None, 0.5, 3, 15, 3, 5, 1.2, 0)# 提取运动向量的x和y分量vx = flow[..., 0]vy = flow[..., 1]# 计算位置差异的欧氏距离distance = np.sqrt(np.square(vx) + np.square(vy))# 计算速度speed = np.mean(distance) * fpsspeeds.append(speed)# 可选:可视化结果flow_vis = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)flow_vis[..., 0] = np.arctan2(vy, vx) * (180 / np.pi / 2)flow_vis[..., 2] = cv2.normalize(distance, None, 0, 255, cv2.NORM_MINMAX)flow_vis = cv2.cvtColor(flow_vis, cv2.COLOR_HSV2BGR)cv2.imshow('Flow Visualization', flow_vis)if cv2.waitKey(1) & 0xFF == ord('q'):breakprev_frame = graycap.release()
cv2.destroyAllWindows()# 打印速度结果
print("速度列表:", speeds)

该代码使用OpenCV库中的`函数来计算相邻帧之间的光流向量,并通过欧氏距离计算位置差异。然后,通过视频的帧率计算速度,并将速度存储在一个列表中。你可以根据自己的需求对速度进行进一步处理或可视化。请注意,这只是一个简单的示例,实际应用中可能需要根据具体情况进行调整和改进。

追踪

而DeepSORT是一种目标跟踪算法,常与YOLOv5结合使用。

DeepSORT(Deep Learning + SORT)是一种基于深度学习和卡尔曼滤波的目标跟踪算法。它通过结合YOLOv5等目标检测器的输出和SORT(Simple Online and Realtime Tracking)算法的轨迹管理,实现对视频中目标的准确跟踪。

DeepSORT的主要特点如下:

  • 多目标跟踪:DeepSORT能够同时跟踪多个目标,并为每个目标生成唯一的ID,以便在不同帧之间进行关联。
  • 深度特征嵌入:DeepSORT使用深度学习模型(如ResNet)提取目标的特征向量,将其用于目标的身份验证和关联。
  • 卡尔曼滤波:DeepSORT使用卡尔曼滤波器来预测目标的位置和速度,并通过将检测和预测结果进行关联,提供平滑的目标轨迹。
  • 数据关联:DeepSORT使用匈牙利算法将当前帧的检测结果与上一帧的跟踪结果进行关联,以最大化目标标识的一致性

通过将YOLOv5和DeepSORT结合使用,可以实现准确的目标检测和连续的目标跟踪,从而在视频监控、自动驾驶、智能机器人等领域提供更加全面和高效的解决方案。这种结合能够在实时场景下处理大量目标,并为每个目标提供连续的轨迹信息,具有广泛的应用前景。

追踪代码

以下是一个简化的卡尔曼滤波算法的代码示例:

import numpy as npclass KalmanFilter:def __init__(self, state_dim, measurement_dim):# 初始化状态转移矩阵self.F = np.eye(state_dim)# 初始化测量矩阵self.H = np.eye(measurement_dim, state_dim)# 初始化状态估计self.x = np.zeros((state_dim, 1))# 初始化状态协方差矩阵self.P = np.eye(state_dim)# 初始化过程噪声协方差矩阵self.Q = np.eye(state_dim)# 初始化测量噪声协方差矩阵self.R = np.eye(measurement_dim)def predict(self):# 预测状态self.x = np.dot(self.F, self.x)# 预测状态协方差self.P = np.dot(np.dot(self.F, self.P), self.F.T) + self.Qdef update(self, z):# 计算预测残差y = z - np.dot(self.H, self.x)# 计算预测残差协方差S = np.dot(np.dot(self.H, self.P), self.H.T) + self.R# 计算卡尔曼增益K = np.dot(np.dot(self.P, self.H.T), np.linalg.inv(S))# 更新状态估计self.x = self.x + np.dot(K, y)# 更新状态协方差self.P = np.dot((np.eye(self.x.shape[0]) - np.dot(K, self.H)), self.P)# 示例用法
# 创建卡尔曼滤波器对象
kalman_filter = KalmanFilter(state_dim=2, measurement_dim=1)# 模拟测量值
measurements = [1.2, 1.7, 2.5, 3.6]# 进行预测和更新
for z in measurements:kalman_filter.predict()kalman_filter.update(np.array([[z]]))# 打印更新后的状态估计值print(kalman_filter.x)

上述代码是一个简单的一维卡尔曼滤波器的实现。您可以根据需要调整状态维度 state_dim 和测量维度 measurement_dim,并设置相应的状态转移矩阵 F、测量矩阵 H、过程噪声协方差矩阵 Q 和测量噪声协方差矩阵 R。然后,通过 predict() 方法进行预测,通过 update() 方法进行更新。

请注意,卡尔曼滤波算法的具体实现可能因应用场景而有所不同。这里提供的代码仅用于展示基本的卡尔曼滤波器结构和操作步骤,需要根据具体需求进行相应的调整和扩展。

总结

具体实现上述功能的步骤如下:
在这里插入图片描述

单目测距:

  • 收集训练数据集,包含物体标注和对应的深度信息。
    构建深度学习模型,例如使用卷积神经网络(如ResNet、UNet等)进行图像到深度图的映射。
  • 使用收集的数据集进行模型训练,优化深度学习模型。
  • 在YOLOv5中添加单目测距功能时,加载训练好的深度学习模型,并在检测到对象时,使用该模型估计距离。

差帧算法:

  • 对视频序列进行物体检测和跟踪,获取物体在连续帧中的位置信息。
  • 计算相邻帧之间物体位置的差异,可以使用欧氏距离或其他相似度度量方法。
  • qq 1309399183
  • 将差异除以时间间隔,得到物体的平均速度。

追踪算法

除了DeepSORT,还有一些其他常见的目标追踪算法:

  1. SORT(Simple Online and Realtime Tracking):一个简单但高效的在线实时目标追踪算法,通过卡尔曼滤波器和匈牙利算法实现目标匹配。

  2. MOSSE(Minimum Output Sum of Squared Error):一种基于相关滤波器的目标追踪算法,使用最小输出平方误差来更新模板。

  3. KCF(Kernelized Correlation Filter):一种基于相关滤波器的目标追踪算法,使用核函数来建立目标与模板之间的关系。

  4. TLD(Tracking-Learning-Detection):一种结合了目标检测和跟踪的方法,使用学习算法来提高目标模型的准确性。

  5. ECO(Efficient Convolution Operators):一种基于傅里叶变换的目标追踪算法,能够快速计算目标模板与搜索区域之间的相似度。

  6. C-COT(Context-aware Correlation Tracking):一种基于上下文感知的目标追踪算法,使用上下文信息来提高目标模板的鲁棒性。

  7. StapleTrack:一种基于稀疏表示的目标追踪算法,使用稀疏编码来提取目标的特征表示。

这些追踪算法各有优缺点,具体应用时需要根据实际需求选择合适的算法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/232558.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[自动化运维工具]ansible简单介绍和常用模块

ansible 源操作主机功能 自动化运维(playbook剧本yaml) 是基于python开发的一个配置管理和应用部署工具,在自动化运维中,现在还是异军突起 ansible能批量配置,部署,管理上千台主机,类似于xshell…

使用vite搭建项目时,在启动vite后,浏览器显示页面:找不到localhost的网页

现象 在使用前端工具vite(版本5),搭建vue3项目时,启动vite,浏览器显示页面:找不到localhost的网页, 起初怀疑是 未加参数 --host0.0.0.0,导致,后加上该参数后问题依旧 解决 将index.html页面…

中国的下一个风口:低代码开发

“中国的下一个风口是什么?低代码?你赞同吗?” 可以肯定的是,企业想站上未来产业的风口,”数字化“是必经之路。而低代码是企业向制高点突进的手段。产业的风口,就是产业发展的趋势,只有尽力站上…

Makefile的使用

在Linux中使用 make 命令来编译程序,特别是大程序;而 make 命令所执行的动作 依赖于 Makefile 文件。以下是最简单的Makefile文件: 首先,包含如下文件: Makefile文件内容如下所示: 然后,直接执行…

【Git】撤销命令

git add 撤销 add 错误文件,撤销掉add列表的文件使用: git reset [文件名] 撤销单个文件 git reset . 撤销全部 git commit 撤销 commit 之后,但是还没有push 可以用撤回刚刚的commit 记录 git reset HEAD~ git log -v 查看提交记录

【程序】STM32 读取光栅_编码器_光栅传感器_7针OLED

文章目录 源代码工程编码器基础程序参考资料 源代码工程 源代码工程打开获取: http://dt2.8tupian.net/2/28880a55b6666.pg3这里做了四倍细分,在屏幕上显示 速度、路程、方向。 接线方法: 单片机--------------串口模块 单片机的5V-------…

天猫数据分析-天猫查数据软件-11月天猫平台饮料市场品牌及店铺销量销额数据分析

今年以来,饮料是快消品行业中少数保持稳定增长的品类之一。 11月份,饮料市场同样呈现较好的增长态势。根据鲸参谋电商数据分析平台的相关数据显示,今年11月份,天猫平台上饮料市场的销量为2700万,环比增长约42%&#xf…

水经微图Web新版发布

水经微图Web新版已经上线,在该版本中主要新增了态势箭头标绘、文本要素标注和显示网页气泡等功能。 在本文中,我们将为大家分享新增的功能项,以及原有功能作的一些优化等。 当前版本 当前版本号为:1.4.0-beta 如果你发现该版…

linux 操作系统(二)

1、linux用户和权限 1.1、用户分类: 在linux中的用户可以分为两类,一类是root用户,root用户拥有linux操作系统的最大的权限,另外一类就是普通用户,相比于root用户,普通用户的权限受到一定的限制&#xff0…

zookeeper:启动后占用8080端口问题解决

ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务。它为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。 我们经常在运行zookeeper服务时,不需要配置服务端口,…

电脑风扇控制软件Macs Fan Control mac支持多个型号

Macs Fan Control mac是一款专门为 Mac 用户设计的软件,它可以帮助用户控制和监控 Mac 设备的风扇速度和温度。这款软件允许用户手动调整风扇速度,以提高设备的散热效果,减少过热造成的风险。 Macs Fan Control 可以在菜单栏上显示当前系统温…

图片上传超过2M就无法上传,如何解决cmreb

第一步:1,修改配置文件 在config/upload.php 里面修改一下上传文件大小 第二步:2,重启 重启php 重启ngix 重启守护进程的-swoole 在Supervisor管理器里的守护进程。进行重启 参考链接: https://doc.crmeb.com/pro/…

MySQL Binlog Digger 4.32

1. 取消了对mysql命令的引用 2. 解决了一些已知的bug 欢迎大家下载使用,如发现问题,请斧正 下载地址: https://download.csdn.net/download/bournetai/88644026

I.MX6ULL_Linux_驱动篇(49)linux SPI驱动

上一章我们讲解了如何编写 Linux 下的 I2C 设备驱动, SPI 也是很常用的串行通信协议,本章我们就来学习如何在 Linux 下编写 SPI 设备驱动。本章实验的最终目的就是驱动 I.MX6UALPHA 开发板上的 ICM-20608 这个 SPI 接口的六轴传感器,可以在应…

C#中的协变和逆变

这两个都是只能使用在接口和委托上 个人理解: 协变:出参,让基类使用范围变大,将父类/基类当作子类一样使用 --为什么这样规定呢? 我的理解:真正实现的是子类,子类拥有所有的方法,却…

低代码开发:解析其崛起、争议与未来趋势

近年来,低代码开发平台以其低门槛、高效率和易集成的特性在IT领域迅速崛起,引起了广泛的关注和讨论。然而,与此同时,也有人对低代码提出了一系列的质疑与担忧。在这个争议不断的话题中,我们将深入探讨低代码的真实面貌…

让AIGC成为你的智能外脑,助力你的工作和生活

人工智能成为智能外脑 在当前的科技浪潮中,人工智能技术正在以前所未有的速度改变着我们的生活和工作方式。其中,AIGC技术以其强大的潜力和广泛的应用前景,正在引领着这场革命。 AIGC技术是一种基于人工智能的生成式技术,它可以通…

个微和企微,哪个做私域流量的优势更大?

个人微信和企业微信是目前最为常用的私域经营平台,那在功能和使用上都有哪些区别: 1、开通对象不同: 个人微信是个人用户,个人就可以申请开通使用; 企业微信则要由企业在官方网站申请开通,并完成实名认证…

企业微信无法给Gmail发邮件问题

问题说明 在使用企业微信给国外客户的Gmail邮箱发信件的时候,邮件一直被退信,退信内容如下: 发件人(*******.cn)域名的DNS记录未设置或设置错误导致对方拒收此邮件。 host gmail-smtp-in.l.google.com[142.251.175.2…