【视觉多模态】- 3D建模尝试 III(室内静态多视角,建模成功)

【视觉多模态】- 3D建模尝试 III(室内静态多视角,建模成功)

  • 背景
  • 新数据新尝试【静态多视角静态室内】
  • 室内3D重建

背景

3D建模一直没成功,试过很多回,静态多视角动态广场、动态多视角静态房间,试过多回,修改参数尝试,都建模失败,基本败在稀疏点云构建环节,所给的图要找出2张特征能匹配对应上的都难,并因此失败。
因此,猜测:

  1. 静态多视角动态广场的失败,猜测主要是图与图之间有很多人在动导致特征在变化,进行了黑色遮罩后每张图留下的特征太少,也很难匹配上,试过用于建模的图像张数:6、10、50、100、200,均建模失败,于是放弃用这个数据集进行3D建模;
  2. 动态多视角静态房间的失败,猜测是视角间重叠度太低、焦点差异显著,而且可用的图很有限,导致图之间特征匹配失败,而稀疏点云建立失败,于是放弃用这个数据集进行3D建模;

新数据新尝试【静态多视角静态室内】

  1. Panoptic Studio(最佳选择)
    配置:120 路同步摄像头(54 个 RGB+66 个深度),环形分布,360° 覆盖
    重叠率:相邻摄像头重叠 > 80%,任意两帧间重叠 > 90%(静态设计 + 同步采集)
    适用场景:室内动态 / 静态场景、人体 3D 重建、多视角融合
    获取方式:https://panoptic.stanford.edu/(需申请)
    Panoptic Studio:多路静态相机 + 极高重叠 + 同步采集,适合验证多路摄像头重建方案;
    斯坦福大学的数据集看起来非常贴合,但需要申请,想想算了。
  2. Replay Dataset(全称:Replay: A Dataset of Synchronized Multi-View Videos for Social Interaction Analysis),由 Meta(原 Facebook)人工智能研究院(FAIR)发布。
    官方主页链接:https://replay-dataset.github.io/

    数据链接:
    {
    “full”: {
    “metadata”: [
    “https://dl.fbaipublicfiles.com/replay/v0/metadata.zip”
    ],
    “videos”: [
    “https://dl.fbaipublicfiles.com/replay/v0/videos_SC-1001-1007.zip”,
    “https://dl.fbaipublicfiles.com/replay/v0/videos_SC-1008-1018.zip”,
    “https://dl.fbaipublicfiles.com/replay/v0/videos_SC-1019-1028.zip”,
    “https://dl.fbaipublicfiles.com/replay/v0/videos_SC-1032-1044.zip”,
    “https://dl.fbaipublicfiles.com/replay/v0/videos_SC-1045-1052.zip”,
    “https://dl.fbaipublicfiles.com/replay/v0/videos_SC-1053-1071.zip”,
    “https://dl.fbaipublicfiles.com/replay/v0/videos_SC-1073-1079.zip”,
    “https://dl.fbaipublicfiles.com/replay/v0/videos_SC-1081-1091.zip”,
    “https://dl.fbaipublicfiles.com/replay/v0/videos_SC-1092-1104.zip”,
    “https://dl.fbaipublicfiles.com/replay/v0/videos_SC-1105-1109.zip”
    ],
    “masks”: [
    “https://dl.fbaipublicfiles.com/replay/v0/mask_videos_SC-1001-1109.zip”
    ],
    “audio”: [
    “https://dl.fbaipublicfiles.com/replay/v0/audio_SC-1001-1109.zip”
    ]
    }
    }
    我只下载了:https://dl.fbaipublicfiles.com/replay/v0/videos_SC-1001-1007.zip,是录像。包含现场11台不同机位的动、静态相机的2分多钟视频。

    有一个围绕转动的相机(G3)中的场景前64秒机位在动,场景内的人物、物件不动。非常吻合建模需求(只要我等时间隔截取帧,就相当于静态多视角静态室内,对于3D建模非常理想,当然,当时只是猜测)
    于是我进行间隔1秒的帧截取,获取64帧图像(相当于64个重叠度极高的不同视角):

    于是得到3D建模用的纯图。

室内3D重建

进行如下流程的建模过程:

# ========== 步骤1:稀疏重建(基础位姿与特征) ==========# 1. 创建COLMAP数据库colmap database_creator --database_path database.db# 2. 特征提取(GPU/CPU兼容,无GUI环境适配)exportQT_QPA_PLATFORM=offscreen xvfb-run colmap feature_extractor --database_path database.db --image_path /data1/projs/airport_human_trail/selected_masked_images --SiftExtraction.use_gpu0# 3. 特征匹配(穷尽匹配,控制匹配数提升精度)colmap exhaustive_matcher --database_path database.db --SiftMatching.use_gpu0--SiftMatching.max_num_matches4# 4. 三角化生成稀疏点云colmap point_triangulator --database_path database.db --image_path selected_masked_images --input_path colmap_sparse/0 --output_path ./colmap_sparse/triangulated# ========== 步骤2:稠密重建(生成深度图+稠密点云) ==========# 1. 图像去畸变(校正镜头畸变)colmap image_undistorter --image_path /data1/datas/videos_SC-1001-1007/extracted_frames_SC-1001_GOPRO-3 --input_path sparse/0 --output_path dense --output_type COLMAP# 2. PatchMatch立体匹配(生成深度图,几何一致性校验)colmap patch_match_stereo --workspace_path dense --workspace_format COLMAP --PatchMatchStereo.geom_consistencytrue--PatchMatchStereo.filtertrue--PatchMatchStereo.num_samples15--PatchMatchStereo.max_image_size2000--PatchMatchStereo.num_iterations5# 3. 立体融合生成稠密点云colmap stereo_fusion --workspace_path dense --workspace_format COLMAP --input_type geometric --output_path dense/fused.ply --StereoFusion.min_num_pixels=3--StereoFusion.max_reproj_error=4# ========== 步骤3:表面重建(点云→3D网格模型) ==========colmap poisson_mesher --input_path dense/fused.ply --output_path dense/meshed-poisson.ply

得到如下结果:


截止当前为止的首次成功,效果确实不好,但可以逐步尝试优化一下。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1124891.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于STM32单片机的智能窗帘/晾衣架控制系统 物联网无线控制 蓝牙WIFI传输 定时开关 光线采集 雨滴感应 防盗报警成品套件 DIY设计 实物+源程序+原理图+仿真+其它资料(832-4/5/6)

本人从事毕业论文设计辅导10余载,撰写的毕业论文超2000余篇,为广大的应届毕业生节省了大量的设计和撰写时间。在单片机领域,参与设计51系列、STM32系列、Proteus仿真、JAVA上位机、Android Studio、物联网无线通信等千余套项目,具…

四层PCB板设计

在 Altium Designer 的 Layer Stack Manager 中,这几个概念的区别和设置方式如下: 一、Add Layer vs Add Internal Plane 功能 Add Layer Add Internal Plane 层类型 添加信号层(Signal Layer) 添加内部电源 / 地平面层(Power/Ground Plane) 用途 用于走信号线(如 Top …

基于STM32单片机的智能窗帘/晾衣架控制系统 蓝牙系统设计 定时开关 光线采集 雨滴感应 成品套件 DIY设计 实物+源程序+原理图+仿真+其它资料(832-0/1/2)

本人从事毕业论文设计辅导10余载,撰写的毕业论文超2000余篇,为广大的应届毕业生节省了大量的设计和撰写时间。在单片机领域,参与设计51系列、STM32系列、Proteus仿真、JAVA上位机、Android Studio、物联网无线通信等千余套项目,具…

点击【历史对话】按钮时会弹出下拉列表,现在需要增加一个功能:点击页面其他区域时隐藏这个下拉列表

E:\source\aa2_agent12\ui\app\courses\[id]\page.tsx文件,点击【历史对话】按钮时会弹出下拉列表,现在需要增加一个功能:点击页面其他区域时隐藏这个下拉列表 修改内容总结 1. page.tsx:3 添加了 useRef 导入: import React, {…

redis存储空间复杂度和时间复杂度的平衡

下面是一个案例:根据奖品概率计算奖品存储空间以及时间复杂度的权衡. 1. 内存占用的计算 1.1 不同精度下的内存占用 // 精度范围(rateRange)决定了数组大小 rateRange 10000 // 万分位 (0.0001) rateRange 100000 // 十万分位 (0.00001) r…

CPU密集型任务与I/O密集型任务详解

目录 CPU密集型任务与I/O密集型任务详解 一、基本概念 CPU密集型任务(CPU-bound) I/O密集型任务(I/O-bound) 二、关键区别对比 三、详细特征与应用场景 CPU密集型任务 I/O密集型任务 四、线程池配置建议 CPU密集型任务 …

bss段、data段、text段、heap堆、stack栈的基本概念

1. bss段bss段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。bss是英文Block Started by Symbol的简称。bss段属于静态内存分配。2. data段数据段(data segment)通常是指用来存放程序中已初始化的全局变…

【SRC 挖洞赚钱实测】单高危漏洞 2W+!低中高危赏金拆解,挖漏洞平均日收入算给你看

一个漏洞奖励2w,这是真实的嘛! 我入行网安这些年也一直在接私活,副业赚的钱几乎是我工资的三倍!看到最近副业挖漏洞的内容非常火爆,我便决定将自己的经验分享出来,带我的粉丝们一起挣钱! 注意…

破防了!Java 卷到月薪 8K,转网安直接年薪 40 万 +,2025 自救路线图全公开!

从卷Java到冲网安:计算机人2025自救路线图(附安全岗年薪40-150万) 只要你敢学我就敢教!500集黑客入狱教程,从入门到入狱!全程干货无废话,学不会我退网! 计算机专业未来发展全景图&…

抗干扰更强!8路PWM输出模块:隔离RS485/CAN通讯+占空比精准调节

8路PWM脉冲输出模块,是一种集成化的工业控制/电子接口模块,其核心功能是同时提供8组独立或可同步的、可编程的PWM(脉冲宽度调制)脉冲信号输出。通过内置的控制核心、定时单元和功率驱动电路,将外部控制器(PLC、工控机、单片机、云平台)的指令…

多元场景通吃的秘密!8路PWM输出模块——集中控制+独立调节,双重模式更灵活

8路PWM脉冲输出模块的核心价值在于多通道独立/同步的占空比、频率可调控制,能同时驱动8路执行器实现调速、调光、调压、调力等精准控制。结合工业自动化、物联网、智能装备等领域的实际需求,其典型应用场景可分为以下8大类,覆盖从工业核心设备…

副业封神!挖 SRC 漏洞一个就赚 2W+,网安人轻松躺赚,平均日收入看完馋哭了!

一个漏洞奖励2w,这是真实的嘛! 我入行网安这些年也一直在接私活,副业赚的钱几乎是我工资的三倍!看到最近副业挖漏洞的内容非常火爆,我便决定将自己的经验分享出来,带我的粉丝们一起挣钱! 注意…

2026年六大GEO优化公司能力测评:技术纵深决定AI搜索霸权

2026年,生成式AI已占据用户决策链的核心节点。QuestMobile数据显示,中国AI搜索用户规模突破4.2亿,用户日均通过DeepSeek、文心一言、Kimi等平台发起超过2.8亿次商业类提问。当"新能源车怎么选""智能家居品牌推荐"这类问题…

在Windows上编译、安装Rust

你想知道在Windows系统上安装Rust编程语言的具体方法,我会为你提供官方推荐、新手友好的完整步骤,包括前置依赖、安装操作和验证方法,确保你能顺利完成安装。 一、前置准备(关键!避免后续编译报错) Rust在W…

救命!失业党狂喜!零成本学网安 3 个月,避开万元培训班,月薪 12K 成功逆袭!

失业 3 个月投了 127 份简历?别卷了!我靠网安转行月薪 12K,附 3 个月零成本入门攻略 去年被裁那天,我盯着招聘软件上 “35 岁以下优先” 的字样,把简历里的 “5 年行政经验” 改了又改,结果投出去的 127 份…

艾莉丝努力练剑的256天创作纪念日:在代码星河中逐梦前行

🔥艾莉丝努力练剑:个人主页 ❄专栏传送门:《C语言》、《数据结构与算法》、C/C干货分享&学习过程记录、Linux操作系统编程详解、笔试/面试常见算法:从基础到进阶、测试开发要点全知道 ⭐️为天地立心,为生民立命…

pycocotools绘制标注结果(bbox,segment,pose)

博主提供docker开发镜像(主要面向深度学习、计算机视觉和机器人开发等需要 GPU 支持的场景)用于测试所有博客用例代码,下载地址(ubuntu24_cux_dev)[https://wilson.blog.csdn.net/article/details/156309082] 以下是一个基于 pycocotools 开发的 Python 函数&#x…

深度测评9个AI论文工具,助本科生轻松搞定毕业论文!

深度测评9个AI论文工具,助本科生轻松搞定毕业论文! AI 工具如何改变论文写作的未来 随着人工智能技术的飞速发展,越来越多的本科生开始借助 AI 工具来辅助完成毕业论文。这些工具不仅能够帮助学生高效地完成内容生成、结构搭建,还…

2025 Java 转网安必看:从技能迁移到岗位选择,附 40-150 万安全岗薪资拆解!

从卷Java到冲网安:计算机人2025自救路线图(附安全岗年薪40-150万) 只要你敢学我就敢教!500集黑客入狱教程,从入门到入狱!全程干货无废话,学不会我退网! 计算机专业未来发展全景图&…

从0到1讲解什么是JVM:Java程序员必须掌握的核心知识(附Spring Boot实战案例)

视频看了几百小时还迷糊?关注我,几分钟让你秒懂!一、什么是JVM?小白也能听懂的解释JVM(Java Virtual Machine),中文叫 Java虚拟机,是运行Java程序的“发动机”。 你写的 .java 文件&…