浅论3DGS溅射模型在VR眼镜上的应用

摆烂仙君小课堂开课了,本期将介绍如何手搓VR眼镜,并将随手拍的电影变成3D视频。

一、3DGS模型介绍

3D 高斯模型是基于高斯函数构建的用于描述三维空间中数据分布概率的模型,高斯函数在数学和物理领域有着广泛应用,其在 3D 情境下的拓展为我们理解和处理三维数据提供了强大工具。在三维空间中,高斯模型的概率密度函数形式较为复杂,涉及多个参数。中心点坐标 (μ_x, μ_y, μ_z) 决定了分布的中心位置,即数据最可能聚集的点。而协方差矩阵则描述了数据在各个方向上的分布范围和相关性。协方差矩阵是一个对称的 3×3 矩阵,其对角线元素 (σ_x², σ_y², σ_z²) 分别代表数据在 x、y、z 轴上的方差,方差越大,说明数据在该轴方向上的分散程度越高;非对角线元素 σ_xy、σ_xz、σ_yz 反映了不同坐标轴之间的协方差,衡量了两个变量之间的线性相关程度,比如 σ_xy 为正,表明 x 和 y 方向的数据变化呈正相关趋势。

该模型在诸多领域都有重要应用,其中最重要的就是可以恶搞自己的室友,如图。

但是我们本期要讲的是如何通过3D溅射模型把普通视频变成3D视频。

二、VR眼镜盒子

VR眼镜盒子是一种较为基础且便捷的虚拟现实设备。其外观通常小巧轻便,便于携带和使用,主体部分多为一个类似眼镜的框架结构,中间有可容纳显示屏的区域,两侧设有绑带或夹子等固定装置,用于将设备稳固地佩戴在头上,确保使用者在使用过程中不会轻易滑落或移位。它的工作原理在于借助智能手机等具备显示功能的设备来作为显示屏,将手机放入盒子中特定的位置后,通过盒子内部的光学镜片等元器件对手机屏幕上的画面进行放大和聚焦,营造出一种身临其境的立体视觉效果。当使用者转动头部时,借助手机内部的陀螺仪等传感器,可实时感知头部的运动方向和角度变化,并将这些信息反馈给正在运行的VR应用,从而使得画面能够相应地进行切换或调整,让使用者仿佛置身于一个全方位、沉浸式的虚拟场景之中,无论是观看3D电影、体验虚拟旅游还是进行一些简单的VR游戏,都能提供较为出色的沉浸感体验。不过,由于其成本相对较低,技术也较为基础,在画面的清晰度、视场角以及帧率等方面可能不如一些高端的VR头显设备,但其亲民的价格和便捷的操作方式使其在普通消费者群体中有着较为广泛的应用,为大众接触和体验虚拟现实技术提供了一个入门级的便捷选择。

假设透镜的焦距为f,透镜与显示屏之间的距离为d,显示屏上的图像高度为h,经过透镜放大后的像高度为H。根据透镜成像公式:

f1​=u1​+v1​

其中,u 为物体到透镜的距离(即显示屏到透镜的距离),v 为像到透镜的距离。对于VR眼镜盒子来说,透镜通常被设计为靠近显示屏的一侧,因此 u 是一个较小的正值。根据成像公式,可以求出像距 v。

像的放大率 M 可以表示为:

M=hH​=uv​

通过调整透镜的焦距 f 和物体距 u,可以控制像的放大率和成像位置,从而优化用户的视觉体验。VR眼镜盒子利用双眼视觉和视差原理来营造三维立体效果。人类的双眼分别位于头部的两侧,两眼之间的距离(称为瞳距)导致两眼看到的物体图像存在细微差异,这种差异称为视差。大脑通过对两眼图像的融合和处理,能够感知物体的深度和立体感。在VR眼镜盒子中,左右两个透镜分别将两幅略有差异的图像(通常由VR应用生成)投射到用户的左右眼中,模拟了人眼观察真实世界时的视差效果。这种视差信息被大脑处理后,用户就会感受到虚拟场景的深度和立体感。

三、博主的实操记录

1.手搓VR眼镜

VR眼镜的技术原理在之前已经讲的很清楚了,无非就是双目视差罢了,所以实现起来也很简单,找个空纸壳然后折叠成下图这个样子,然后放上两个放大镜片就好了,是不是有手就行。

什么?说没有放大镜片,没事儿,仙君教你:在塑料瓶的上半部分中裁出两个圆片,然后将这两个圆片用胶水粘起来,里面放满水,一个放大镜片这不就做出来了吗?还不会的同学就自己上网买一个吧,也就十来块的样子,没钱的可以在评论区找博主报销。

2.普通视频转成VR视频

这种VR视频比较普通,就是将一个视频变成两个分视角的图片,多的不说,上干货:

import cv2 as cv
import numpy as np
import matplotlib.pyplot as plt# 加载预训练的深度估计模型和相关文件
def load_depth_model():# 模型和配置文件路径(假设已下载对应的模型文件)model_path = "models/midas_v2_1_small.onnx"# 加载模型depth_model = cv.dnn.readNet(model_path)return depth_model# 深度估计函数
def estimate_depth(frame, depth_model):# 将图片转换为模型需要的格式img = cv.cvtColor(frame, cv.COLOR_BGR2RGB)img = cv.resize(img, (256, 256), interpolation=cv.INTER_AREA)# 创建blobblob = cv.dnn.blobFromImage(img, 1/255., (256, 256), (123.675, 116.28, 103.53), swapRB=True, crop=False)# 设置输入并前向传播depth_model.setInput(blob)depth_map = depth_model.forward()depth_map = depth_map.reshape((256, 256))# 归一化深度图depth_map = cv.normalize(depth_map, None, 0, 1, cv.NORM_MINMAX)return depth_map# 根据深度图计算视差图
def compute_disparity(depth_map, max_disparity=50):# 计算视差图,简单的将深度图转换为视差图# 实际应用中可能需要更复杂的计算disparity_map = (1.0 - depth_map) * max_disparityreturn disparity_map.astype(np.int32)# 根据视差图生成右视图
def generate_right_view(left_view, disparity_map):height, width = left_view.shape[:2]# 将视差图扩展到与图像相同的尺寸disparity_map_img = cv.resize(disparity_map, (width, height), interpolation=cv.INTER_NEAREST)# 创建右视图right_view = np.zeros_like(left_view)# 沿x轴移动每个像素,根据视差图的值(简单的水平位移)for y in range(height):for x in range(width):disp = disparity_map_img[y, x]new_x = x - dispif new_x >= 0 and new_x < width:right_view[y, new_x] = left_view[y, x]else:# 处理边界情况,使用原图的边缘像素填充if new_x < 0:right_view[y, 0] = left_view[y, x]elif new_x >= width:right_view[y, width - 1] = left_view[y, x]return right_view# 读取视频文件
input_video_path = 'input_video.mp4'
output_video_path = 'output_3d_video.mp4'# 打开视频文件
cap = cv.VideoCapture(input_video_path)
if not cap.isOpened():print("Error: Could not open video.")exit()# 获取视频属性
frame_width = int(cap.get(cv.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv.CAP_PROP_FPS)# 定义视频输出
fourcc = cv.VideoWriter_fourcc(*'MP4V')
out = cv.VideoWriter(output_video_path, fourcc, fps, (frame_width * 2, frame_height))# 加载深度估计模型
depth_model = load_depth_model()# 处理视频的每一帧
while cap.isOpened():ret, frame = cap.read()if not ret:break# 估计深度depth_map = estimate_depth(frame, depth_model)# 计算视差图disparity_map = compute_disparity(depth_map)# 生成右视图right_view = generate_right_view(frame, disparity_map)# 创建左右分屏的3D视频帧stereo_frame = cv.hconcat([frame, right_view])# 写入输出视频文件out.write(stereo_frame)# 显示处理后的帧(可选)cv.imshow('3D Video', cv.resize(stereo_frame, (frame_width * 2 // 2, frame_height // 2)))# 按'q'键退出循环if cv.waitKey(1) & 0xFF == ord('q'):break# 释放资源
cap.release()
out.release()
cv.destroyAllWindows()

以上代码使用深度估计模型来估计每一帧图像的深度,然后根据深度图计算视差图,最后根据视差图生成右视图。需要注意的是,这种方法的效果可能不是非常好,实际应用中可能需要更复杂的视差计算方法,例如使用立体匹配算法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/82963.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025年中期大语言模型实力深度剖析

I. 引言&#xff1a;解读2025年动态LLM竞技场中的“实力” 用户提出的“如今哪个大语言模型最强”这一问题&#xff0c;精准地反映了业界对飞速发展的人工智能&#xff08;AI&#xff09;领域的高度关注。本报告基于截至2025年5月的最新数据&#xff0c;旨在对这一问题进行全面…

Spark缓存-cache

一、RDD持久化 1.什么时候该使用持久化&#xff08;缓存&#xff09; 2. RDD cache & persist 缓存 3. RDD CheckPoint 检查点 4. cache & persist & checkpoint 的特点和区别 特点 区别 二、cache & persist 的持久化级别及策略选择 Spark的几种持久化…

嵌入式开发学习日志(数据结构--顺序结构单链表)Day19

一、顺序结构 安装软件命令&#xff1a; sudo apt-get install (软件名) 安装格式化对齐&#xff1a;sudo apt-get install clang-format 内存泄漏检测工具&#xff1a; sudo apt-get install valgrind 编译后&#xff0c;使用命令 valgrind ./a.out 即可看内…

第六节第二部分:抽象类的应用-模板方法设计模式

模板方法设计模式的写法 建议使用final关键字修饰模板方法 总结 代码&#xff1a; People(父类抽象类) package com.Abstract3; public abstract class People {/*设计模板方法设计模式* 1.定义一个模板方法出来*/public final void write(){System.out.println("\t\t\t…

2025年渗透测试面试题总结-渗透测试红队面试三(题目+回答)

网络安全领域各种资源&#xff0c;学习文档&#xff0c;以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具&#xff0c;欢迎关注。 目录 渗透测试红队面试三 六十一、主机被入侵自查解决方案 六十二、NAT&#xff08;网络地址转换&#xff…

springboot-web基础

21.web spring MVC 基于浏览器的 B/S 结构应用十分流行。Spring Boot 非常适合 Web 应用开发。可以使用嵌入式 Tomcat、Jetty、 Undertow 或 Netty 创建一个自包含的 HTTP 服务器。一个 Spring Boot 的 Web 应用能够自己独立运行&#xff0c;不依赖需 要安装的 Tomcat&#x…

重构Cursor无限电子邮箱注册系统的技术实践

引言 在当今数字化时代&#xff0c;电子邮箱已成为个人和企业网络身份的基础。作为开发者&#xff0c;我们往往会遇到需要设计注册系统的场景&#xff0c;而如何构建一个既安全又用户友好的邮箱注册系统&#xff0c;是值得深入探讨的话题。本文将围绕Cursor邮箱系统的技术重构…

2025.05.10京东机考真题算法岗-第三题

📌 点击直达笔试专栏 👉《大厂笔试突围》 💻 春秋招笔试突围在线OJ 👉 笔试突围OJ 03. 忍者屋顶之旅 问题描述 LYA是一位身手敏捷的忍者,正在一个古老的村庄进行飞檐走壁的训练。村庄有两排房屋,每排从左到右排列着 n n

vscode不能跳转到同一个工作区的其他文件夹

明白了&#xff0c;你说的“第二种情况”是指&#xff1a; 你先打开的是项目文件夹&#xff08;比如 MyProject&#xff09;&#xff0c;然后通过 VS Code 的“添加文件夹到工作区”功能&#xff0c;把 ThirdPartyLib 文件夹添加进来。 结果&#xff0c;项目代码里 #include “…

FastAPI 和 MongoDB 实现请求头参数处理的示例,并在 React 中进行渲染

FastAPI 和 MongoDB 后端 安装必要的库 安装 FastAPI、Uvicorn、Motor&#xff08;用于 MongoDB 的异步驱动&#xff09;和 Pydantic&#xff08;用于数据验证&#xff09;。 pip install fastapi uvicorn motor pydantic创建 FastAPI 应用 创建一个文件 main.py&#xff0c;并…

技术伦理双轨认证如何重构AI工程师能力评估体系——基于AAIA框架的技术解析与行业实证研究

引言&#xff1a;AI工程师能力评估的范式转型 2025年全球人工智能产业呈现出两大特征&#xff1a;技术迭代加速与监管框架完善。据Gartner数据显示&#xff0c;全球75%的企业在AI项目部署中遭遇技术伦理混合型难题&#xff0c;传统单维度技术认证体系已无法满足产业需求。本文…

03.Golang 切片(slice)源码分析(二、append实现)

Golang 切片&#xff08;slice&#xff09;源码分析&#xff08;二、append实现&#xff09; 前言&#xff1a; Golang 切片&#xff08;slice&#xff09;源码分析&#xff08;一、定义与基础操作实现&#xff09; 在前面的文章我们介绍了&#xff0c;切片的结构体与创建\扩容…

mysql常用方法

mysql常用方法 一、基本用法 -- MySQL创建唯一索引 CREATE UNIQUE INDEX 索引名 ON 表名(列名1,列名2,...); --也可以使用ALTER TABLE语句给现有表添加唯一索引&#xff08;UNIQUE&#xff09; ALTER TABLE 表名 ADD CONSTRAINT 索引名 UNIQUE KEY(列名1,列名2,...); alter t…

STM32F103C8T6板子使用说明

第一章 计算机体系结构(了解) 后续在板子上开发的时候&#xff0c;需要考虑是否有操作系统 方式一&#xff1a;有操作系统&#xff0c;通过c库通过os api操作硬件方式二&#xff1a;无操作系统&#xff0c; 通过c库通过固件库操作硬件 第二章 STM32开发板概述 板子/开发板&…

PBR材质-Unity/Blender/UE

目录 前言&#xff1a; 一、Unity&#xff1a; 二、Blender&#xff1a; 三、UE&#xff1a; 四、全家福&#xff1a; 五、后记&#xff1a; 前言&#xff1a; PBR流程作为表达物理效果的经典方式&#xff0c;很值得一学。纹理贴图使用的是上一期的Textures | cgbookcas…

【生产实践】Linux中/usr/bin、/usr/sbin与/usr/local的关系解析(2025年技术规范)

一、核心定位与功能划分 /usr/bin&#xff1a;用户级通用命令库 • 定位&#xff1a;存储系统预装的用户级可执行文件&#xff0c;这些命令通常由Linux发行版官方软件包管理器&#xff08;如APT、YUM&#xff09;安装&#xff0c;属于系统默认功能的一部分。 • 示例命令&#…

智能网联汽车 “中央计算” 博弈:RTOS 与跨域融合的算力分配挑战

一、引言 随着智能驾驶技术的飞速发展&#xff0c;汽车逐渐从传统的交通工具演变为移动的智能终端。智能网联汽车的核心竞争力日益体现在其强大的计算能力和高效的算力管理上。汽车电子电气架构&#xff08;EEA&#xff09;正经历从分布式架构向 “中央计算 区域控制” 架构的…

【PDF】使用Adobe Acrobat dc添加水印和加密

【PDF】使用Adobe Acrobat dc添加水印和加密 文章目录 [TOC](文章目录) 前言一、添加保护加密口令二、添加水印三、实验四、参考文章总结 实验工具&#xff1a; 1.Adobe Acrobat dc 前言 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 一、添加保护加…

python面试实战经验分享

2025/3/28第一面 杭州实在智能 见习python开发工程师 1、Python方法中参数默认值可以是列表或者字典吗? 在Python中,函数参数的默认值可以是列表或字典,列表或者字典在初始化应在函数体内,如果不正确处理,可能会导致所有调用都共享同一个列表。 2、协程、线性和进程 进程…

MIST:一键解锁 macOS 历史版本,旧系统安装不再难!

在 Mac 电脑的使用过程中&#xff0c;你是否遇到过这些困扰&#xff1f;为了运行一款经典设计软件&#xff0c;新系统却无法兼容&#xff1b;或是想给老旧 Mac 设备升级&#xff0c;却找不到适配的系统版本。而 App Store 里&#xff0c;旧版 macOS 安装包就像 “隐藏副本”&am…