深度学习在测距模型中的应用

深度学习在测距模型中的应用

news/2026/1/12 8:19:08/文章来源:https://blog.csdn.net/m0_73442527/article/details/146703750

一、单目视觉测距和双目视觉测距简介

1、单目视觉测距

模型：深度估计（Depth Estimation）

原理：通过深度学习模型（如MonoDepth2、MiDaS）或传统的计算机视觉方法（如单目相机结合物体大小推断）估计场景深度。
实现方式：
- 使用卷积神经网络（CNN）或Transformer模型，从单张图像预测像素级深度信息。
- 需要大量带深度信息的标注数据进行训练，如KITTI、NYU Depth等数据集。

2、双目视觉测距

模型：立体匹配（Stereo Matching）

原理：基于视差计算（Disparity Calculation），通过两个摄像头的图像视差计算目标距离。
计算步骤：
1. 通过SGBM（Semi-Global Block Matching）或深度学习模型（如PASMNet、GA-Net）获取视差图。
2. 结合摄像头参数（基线长度、焦距）使用公式：
  
  其中：
  - d：目标距离
  - f：摄像头焦距
  - B：摄像头基线距离
  - disparity：视差

二、深度学习在双目视觉测距领域的应用

1、视差图计算阶段

这是深度学习应用最广泛的阶段。传统方法（如SGBM、BM等）在复杂场景下效果不佳。

（1）什么是视差图？

视差图（Disparity Map）是表示同一场景在不同视角下图像中对应点之间水平位移的图

每个像素值代表该点在左右图像中的水平位移（视差值）

视差越大，表示物体距离相机越近

视差越小，表示物体距离相机越远

（2）视差图的特点

灰度图像：每个像素值表示视差大小

颜色越亮：表示视差越大（物体越近）

颜色越暗：表示视差越小（物体越远）

黑色区域：表示无法计算视差（遮挡或无效区域）

（3）深度学习方法（如PSMNet、GCNet等）可以：

更好地处理遮挡区域
提高视差计算的准确性
减少计算时间
更好地处理弱纹理区域

2、特征提取阶段

使用卷积神经网络（CNN）提取更鲁棒的特征

相比传统SIFT、SURF等特征，深度学习特征：

具有更强的表达能力

对光照变化更鲁棒

计算速度更快

3、视差图优化阶段

使用深度学习模型进行视差图的后处理可以：

填充视差空洞

平滑视差图

提高视差图的连续性

4、深度估计阶段

直接使用端到端的深度估计网络

例如：

MonoDepth2

DeepStereo

这些方法可以直接从双目图像估计深度图

深度学习应用于测距领域的主要优势：

精度更高：相比传统方法，深度学习方法的精度显著提升
鲁棒性更强：对复杂场景、光照变化等具有更好的适应性
速度更快：通过GPU加速，可以实现实时处理
端到端训练：可以直接优化最终目标

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/899491.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Linux Mem -- Slub内存分配器的几点疑问及解答

Linux Mem -- Slub内存分配器的几点疑问及解答

目录 1 怎样通过object地址获取其对应的struct slab？ 2 struct page、struct folio和struct slab类型之间转换，怎么保证内部关键数据的传递？ 3 怎样判断一个内存空间是属于slab、page管理？ 4 struct page 结构中 __mapcou…

阅读更多...

pip install cryptacular卡住，卡在downloading阶段

pip install cryptacular卡住，卡在downloading阶段

笔者安装pip install cryptacular卡在downloading阶段，但不知道为何 Collecting cryptacularCreated temporary directory: /tmp/pip-unpack-qfbl8f08http://10.170.22.41:8082 "GET http://repo.huaweicloud.com/repository/pypi/packages/42/69/34d478310d6…

阅读更多...

Lag-Llama时间序列模型简单实现数据预测

Lag-Llama时间序列模型简单实现数据预测

前言： 最近在大模型预测，简单了解了lag-llama开源项目，网上也有很多讲解原理的，这里就将如何快速上手使用说一下，只懂得一点点皮毛，有错误的地方欢迎大佬指出。简单介绍： Lag-Llama 是一个开…

阅读更多...

Plastiform复制胶泥：高精度表面复制与测量的高效工具

Plastiform复制胶泥：高精度表面复制与测量的高效工具

在工业制造和质量检测领域，表面复制和测量是确保产品质量的关键环节。Plastiform复制胶泥作为一种创新材料，凭借其出色的性能和多样化的应用，为用户提供了可靠的解决方案。它能够快速捕捉复杂表面的细节，确保测量结果的准确性&…

阅读更多...

AI大模型、机器学习以及AI Agent开源社区和博客

AI大模型、机器学习以及AI Agent开源社区和博客

以下梳理了适合学习 AI大模型、机器学习、AI Agent和多模态技术的英文网站、社区、官网和博客，按类别分类整理： 一、官方网站与开源平台 1. AI大模型 (Large Language Models) • OpenAI • 官网: openai.com • 内容: GPT系列模型文档、研究论文、AP…

阅读更多...

python 上下文管理器with

python 上下文管理器with

with 上下文管理器上下文管理器示例如下：若想不使用with关键字上下文管理器任何实现了 enter() 和 exit() 方法的对象都可称之为上下文管理器，上下文管理器对象可以使用 with 关键字。必须同时具有__enter__和__exit__，就可以使用with语句…

阅读更多...

买卖股票的最佳时机（121）

买卖股票的最佳时机（121）

121. 买卖股票的最佳时机 - 力扣（LeetCode） 解法： class Solution { public:int maxProfit(vector<int>& prices) {int cur_min prices[0];int max_profit 0;for (int i 1; i < prices.size(); i) {if (prices[i] > cur…

阅读更多...

CesiumJS 本地数据瓦片加载南北两极出现圆点问题

CesiumJS 本地数据瓦片加载南北两极出现圆点问题

const imageryProvider new UrlTemplateImageryProvider({url: "/gisimg/{z}/{x}/{reverseY}.png",minimumLevel: 0,maximumLevel: 19})上面这段代码是加载本地切片，但是有个致命问题就是会出现南北两极显示蓝色圆点解决方案： 加上这句话&am…

阅读更多...

Linux编译器gcc/g++使用完全指南：从编译原理到动静态链接

Linux编译器gcc/g++使用完全指南：从编译原理到动静态链接

一、gcc/g基础认知在Linux开发环境中，gcc和g是我们最常用的编译器工具： gcc：GNU C Compiler，专门用于编译C语言程序g：GNU C Compiler，用于编译C程序（也可编译C语言） &#x1f4cc…

阅读更多...

Vue学习笔记集--computed

Vue学习笔记集--computed

computed 在 Vue 3 的 Composition API 中，computed 用于定义响应式计算属性它的核心特性是自动追踪依赖、缓存计算结果（依赖未变化时不会重新计算） 基本用法 1. 定义只读计算属性 import { ref, computed } from vue;const count ref(…

阅读更多...

飞致云荣获“Alibaba Cloud Linux最佳AI镜像服务商”称号

飞致云荣获“Alibaba Cloud Linux最佳AI镜像服务商”称号

2025年3月24日，阿里云云市场联合龙蜥社区发布“2024年度Alibaba Cloud Linux最佳AI镜像服务商”评选结果。经过主办方的严格考量，飞致云（即杭州飞致云信息科技有限公司）凭借旗下MaxKB开源知识库问答系统、1Panel开源面板、Halo开…

阅读更多...

Vue如何利用Postman和Axios制作小米商城购物车----简版

Vue如何利用Postman和Axios制作小米商城购物车----简版

实现功能：全选、单选、购物数量显示、合计价格显示实现效果如下： 思路： 1.数据要利用写在Postman里面，通过地址来调用Postman里面的数据。 2.写完数据后，给写的数据一个名字，然后加上一个空数组&#xf…

阅读更多...

第一篇：系统分析师首篇

第一篇：系统分析师首篇

目录一、目标二、计划三、完成情况1.宏观思维导图2.过程中的团队管理和其它方面的思考四、意外之喜(最少2点)1.计划内的明确认知和思想的提升标志2.计划外的具体事情提升内容和标志一、目标通过参加考试，训练学习能力，而非单纯以拿证为目的。 1.在复…

阅读更多...

CSS学习笔记4——盒子模型

CSS学习笔记4——盒子模型

目录盒子模型是什么？ 盒子模型的组成一、div标签二、边框属性 1、border-style:边框样式 2、border-width:边框宽度 3、border-color:边框颜色、border：综合设置 4、border-radius:圆角边框 5、border-image：图像边框三、边距属性…

阅读更多...

复现文献中的三维重建图像生成，包括训练、推理和可视化

复现文献中的三维重建图像生成，包括训练、推理和可视化

要复现《One - 2 - 3 - 45 Fast Single Image to 3D Objects with Consistent Multi - View Generation and 3D Diffusion (CVPR)2024》文献中的三维重建图像生成，包括训练、推理和可视化，并且确保代码能正常运行，下面是基本的实现步骤和示例…

阅读更多...

stable diffusion 本地部署教程 2025最新版

stable diffusion 本地部署教程 2025最新版

前提： 需要环境 git git下载地址Git - Downloading Package 直接装即可 python3.10.6 下载地址 Python Release Python 3.10.6 | Python.org 记得python环境一定要3.10.6！！！ 第一个版本项目地址https://github.…

阅读更多...

【二刷代码随想录】螺旋矩阵求解方法、推荐习题

【二刷代码随想录】螺旋矩阵求解方法、推荐习题

一、求解方法 （1）按点模拟路径在原有坐标的基准上，叠加横纵坐标的变化值，求出下一位置，并按题完成要求。但需注意转角的时机判断，特别是最后即将返回上一出发点的位置。 （2）按层…

阅读更多...

从Manus到OpenManus：AI智能体技术如何重塑未来生活场景？

从Manus到OpenManus：AI智能体技术如何重塑未来生活场景？

从Manus到OpenManus：AI智能体技术如何重塑未来生活场景？ 一、现状：AI智能体技术面临的三大核心矛盾 （通过分析用户高频痛点与市场反馈提炼） 能力与门槛的失衡 Manus展示的复杂任务处理能力（如股票分析、代…

阅读更多...

迭代器与可迭代对象

迭代器与可迭代对象

概念层面： 可迭代对象： 一个可迭代对象是指任何可以返回一个迭代器的对象。换句话说，它实现了 __iter__() 方法比如：列表、元组、字典、字符串、集合等直接通过 for 循环使用，因为 for 循环内部会调用其 __iter__(…

阅读更多...

总结PostgreSQL创建数据库失败的解决办法

总结PostgreSQL创建数据库失败的解决办法

作者：朱金灿来源：clever101的专栏系统环境是Windows 11 专业版，PostgreSQL版本是17。在运行sql语句创建数据库时出现错误： 閿欒: template database \"template1\" has a collation version mismatch DETAIL: Th…

阅读更多...

最新文章