WebGL图形编程实战【7】:变换流水线 × 坐标系与矩阵精讲

变换流水线

模型矩阵
观察矩阵
投影矩阵
透视剔除
视口变换
局部坐标系
世界坐标系
相机坐标系
裁剪坐标系
规范化设备坐标系
屏幕坐标系
  • 局部坐标系:是坐标系以物体的中心为坐标原点,物体的旋转、平移等操作都是围绕局部坐标系进行的,这时,当物体模型进行旋转或平移等操作时,局部坐标系也执行相应的旋转或平移操作。
  • 世界坐标系:一个三维场景中通常都不会只有一个物体.我们真正需要的是把我们建立的物体按照我们所需要的形式摆放在场景之中.每个物体分布在场景的适当的位置上.整个场景的坐标系就称为世界坐标系
  • 相机坐标系:相机的重心为原点,上方向为y轴,原点与视点的连线为z轴,x轴为yoz面的垂线
  • 投影坐标系:是相机坐标系经过投影矩阵转换后得到的空间坐标系,之所以叫裁剪坐标系,是因为投影矩阵约定了视角的上下左右前后边界(对应的是相机的Frustum范围),后面会将处于边界之外的数据直接Clip到边界上
  • 规范化设备坐标系(Normalized Device Coordinates):NDC指的是与设备平台无关的一套三维坐标系(比如同一个物件,无论设备使用什么样的分辨率,在这个坐标系中的数值都是相同的)
  • 屏幕坐标系:是NDC坐标系经过视口变换后得到的空间坐标系,即NDC坐标系在屏幕上所占的比例,即屏幕坐标系

模型变换

模型变换:是从模型坐标系到世界坐标系的转换。

简单通俗来讲,3D建模之初,模型有自己的坐标系,以及相应的点坐标。就是将场景中的模型摆好,这个过程就叫模型变换。

在复合变化当中,模型变换不同顺序有不同的结果,其实就是因为矩阵相乘不满足交换律,但满足结合律,所以对应同一个复合变换,可以先得出其中的基础变换的矩阵乘积,再与输入向量相乘。

齐次坐标

在欧式几何当中,最重要的一个定理是:两条平行线永不相交。但是在实际生活应用中有很多非欧式几何的场景,比如:透视空间、透视投影等。那么齐次坐标就是用来解决这个问题的。

概述

齐次坐标是用n+1维向量表示n维向量的坐标系统,用于统一几何变换和表示无穷远点

  1. 定义与基本概念
    齐次坐标是一种数学工具,通过增加一个额外维度将n维向量表示为n+1维向量。例如:

    • 二维点(x,y)的齐次坐标为(x,y,w),其中w为非零实数,实际坐标可通过(x/w, y/w)还原。
    • 三维点(x,y,z)同理扩展为(x,y,z,w)。
    • 核心特点:齐次坐标具有规模不变性,即(kx,ky,kw)(k!=O)与原坐标(x,y,w)表示同一个点。
  2. 引入齐次坐标的目的

    • 统一几何变换:在计算机图形学中,平移、旋转、缩放等变换可通过单一的4x4矩阵乘法完成,简化计算。
    • 表示无穷远点:当w=0时,(x,y,0)表示二维空间中的无穷远点(方向向量),解决了欧氏坐标无法表达无限远的问题。
    • 射影几何兼容:平行线在射影空间中相交于无穷远点,齐次坐标为此提供了代数支持。
  3. 规范化处理

    • 齐次坐标的规范化指将W置为1(即(x,y,w)→ (x/w,y/w,1)),以消除尺度不确定性,便于实际计算。
  4. 数学原理示例

    • 平行线相交证明:
      在齐次坐标系下,两条平行线Ax+By+C=O和Ax+By+D=O可表示为Ax+By+Cw=O和Ax+By+Dw=0。当w=O时,解为(B,-A,0),即无穷远交点。
优势
  1. 可以表示无穷远

  1. 可以表示点在直线或者平面

在齐次坐标下,判断点是否位于直线或平面上的条件可统一表示为向量内积为零

二维空间中点在直线上的判断

  • 直线表示:直线方程为 ax + by + c = 0 ,用齐次坐标表示为向量 l = (a, b, c) ^ T。
  • 点的齐次坐标:点 P = (x, y) 的齐次坐标为 P’ = (x, y, 1)。
  • 判定条件:点 P 在直线 l 上的充要条件是内积 l x P’ = 0 ,即: ax + by + c*1 = 0 <=> ax + by + c = 0
  • 几何意义:内积为零等价于点坐标满足直线方程。

三维空间中点在平面上的判断

  • 平面表示:平面方程为 ax + by + cz + d = 0 ,用齐次坐标表示为向量 s = (a, b, c, d)^T 。
  • 点的齐次坐标:点 P = (x, y, z) 的齐次坐标为 P’ = (x, y, z, 1) 。
  • 判定条件:点 P 在平面 s 上的充要条件是内积 s * P’ = 0 ,即: ax + by + cz + d * 1 = 0 <=> ax + by + cz + d = 0
  • 几何意义:内积为零等价于点坐标满足平面方程。

总结

  • 核心条件:点 P 的齐次坐标 P’ 与直线 l 或平面 s 的内积为零。
  • 优势:统一处理有限点和无穷远点,不依赖坐标缩放,简化几何计算。
  • 公式表示:
    • 二维直线:l * P’ = 0 其中 P’ = (x, y, 1)
    • 三维平面:s * P’ = 0 其中 P’ = (x, y, z, 1)

  1. 可以表示两条直线的交点

在齐次坐标下,两条直线 l 和 m 的交点可以通过叉乘运算直接计算,并利用点积条件验证其几何意义

直线交点的齐次坐标表示

  • 叉乘定义:在二维投影几何中,两条直线 l = (a1, b1, c1)^T 和 m = (a2, b2, c2)^T 的交点 ( \mathbf{p} ) 由叉乘给出:

    p = l * m

叉乘结果 p = (px, py, pw)^T 是一个齐次坐标点。

交点满足两条直线的方程

  • 点积条件:若 p 是两直线的交点,则它必须同时位于 l 和 m 上。根据点在直线上的条件(l ^ T * p = 0) 和(m ^ T * p = 0),可以验证:

    l ^T * p = l ^ T (l * m) = 0

    m ^T * p = m ^ T (l * m) = 0

几何意义:叉乘结果 p 与 l 和 m 正交,因此满足直线方程。

叉乘的几何解释

  • 正交性:叉乘l * m 生成的向量 p 与 l 和 m 均正交。在齐次坐标下,这等价于点 p 同时位于两直线上。
  • 交点的唯一性:在投影平面中,两条不平行的直线必有唯一交点,叉乘直接给出了这一交点的齐次坐标。

齐次坐标的归一化

  • 坐标形式:叉乘结果 p = (px, py, pw)^T 可能为齐次坐标,需归一化得到欧氏坐标:

    欧氏坐标 = ( p_x/p_w, p_y/p_w) (若 p_w != 0).

  • 无穷远点:若 p_w = 0,则 p 表示无穷远点,说明两直线在欧氏空间中平行。

  1. 能够区分一个向量和一个点

点和向量的区别

  • 点:表示空间中的一个具体位置,例如三维点(x,y,z)
  • 向量:表示方向和大小,没有位置属性,例如位移向量(dx,dy,dz)

普通坐标 → 齐次坐标

  • 点的转换:普通坐标点 (x, y, z) 转换为齐次坐标时,添加第四个分量 1:

    齐次坐标点:} \quad (x, y, z, 1).

  • 向量的转换:普通坐标向量 (x, y, z) 转换为齐次坐标时,添加第四个分量 0

    齐次坐标向量:(x, y, z, 0).

齐次坐标 → 普通坐标

  • 的还原:若齐次坐标为 (x, y, z, 1),直接去掉第四个分量 1,还原为普通坐标点:

    普通坐标点:(x, y, z)

  • 向量的还原:若齐次坐标为 ((x, y, z, 0)),去掉第四个分量 0,还原为普通坐标向量:

    普通坐标向量:(x, y, z)

不同方式的图形变换

平移

让x的坐标+2表示沿着x平移

  1. 手动变换
const data = new Float32Array([1.0, 0.0, 0.0, 1.0,0.0, 1.0, 0.0, 1.0,0.0, 0.0, 1.0, 1.0,
])const data = new Float32Array([3.0, 0.0, 0.0, 1.0,2.0, 1.0, 0.0, 1.0,2.0, 0.0, 1.0, 1.0,
])
  1. js变换(CPU)
for (let i = 0; i < data.length; i += 4) {data[i] += 2.0;
} 
  1. 着色器(GPU)
gl_Position = vec4(apos.x + 2.0, apos.y, apos.z, 1);
  1. 平移矩阵

在这里插入图片描述

旋转
  1. 手动变换
const newArray = new Float32Array([1.0, 0.0, 0.0, 1.0,1.0, 1.0, 0.0, 1.0,1.0, 0.0, 1.0, 1.0
]);const newArray = new Float32Array([1.0, 0.0, 0.0, 1.0,1.0, 1.0, 0.0, 1.0,1.0, 0.0, 1.0, 1.0
]); 
  1. js变换(CPU)
const newArray = new Float32Array(data.length);
const angle = Math.PI / 2;
for (let i = 0; i < data.length; i += 4) {newArray[i] = data[i] * Math.cos(angle) - data[i + 1] * Math.sin(angle);newArray[i + 1] = data[i] * Math.sin(angle) + data[i + 1] * Math.cos(angle);newArray[i + 2] = data[i + 2];newArray[i + 3] = data[i + 3];
}
  1. 着色器(GPU)
gl_Position = vec4(apos.x * cosb - apos.y * sinb, apos.x * sinb + apos.y * cosb, apos.z, 1); 
  1. 旋转矩阵

在这里插入图片描述

缩放
  1. 手动变换
const newArray = new Float32Array([1.0, 0.0, 0.0, 1.0,1.0, 1.0, 0.0, 1.0,1.0, 0.0, 1.0, 1.0
]);const newArray = new Float32Array([2.0, 0.0, 0.0, 1.0,2.0, 1.0, 0.0, 1.0,2.0, 0.0, 1.0, 1.0
]);
  1. js变换(CPU)
const newArray = new Float32Array(data.length);
for (let i = 0; i < data.length; i += 4) {newArray[i] = data[i] * 2;newArray[i + 1] = data[i + 1] * 2;newArray[i + 2] = data[i + 2] * 2;newArray[i + 3] = data[i + 3];
}
  1. 着色器(GPU)
gl_Position = vec4(apos.x * 2, apos.y * 2, apos.z * 2, 1);  
  1. 缩放矩阵

在这里插入图片描述

视图变换

进入世界坐标系空间之后,物体与WebGL相机虽然建立了联系,但是并没有进一步确定观察物体的状态。当我们把相机的位置进行移动的时候,相机坐标系和世界坐标系不再重合。这意味着我们直接将世界坐标作为最终的坐标绘制,并不能正确的描述观察者和物体之间的位置关系。如图,我们将相机沿着x 轴正方向移动 1 个单位。此时世界坐标系的原点(0,0,0)在相机坐标系中的坐标就变成(-1,0,0),这说明我们需要在两个坐标系之间进行转换!这个时候就需要调整相机位置姿态,也就是视图变换。

公式推导

可以看这个知乎的文章:视图变换和投影变换矩阵的原理及推导,以及OpenGL,DirectX和Unity的对应矩阵

在相机坐标系当中,分别用d(向前向量 direction), u(向上向量 up ), r(向右向量right)和p(位置 position)来表示这四个变量。
并假设待求的视图矩阵为V(将摄像机移动到原点),并将摄像机的三个向量分别与坐标轴对齐,d与z轴正方向对齐,u与y轴正方向对齐,r与x轴正方向对齐。假设将摄像机与坐标轴对齐的矩阵为V,那么V的推导过程如下

其中d、u、r通常这些向量是正交的,且满足右手坐标系的关系

r = u × d , u = d × r , d = r × u

  • 平移矩阵T:
    • 将相机的位置p移到原点
  • 旋转矩阵R:
    • 将相机的三个正交单位向量r(右)、u(上)、d(前)旋转到与坐标轴对齐。旋转矩阵由这三个向量作为行向量构成
  • 组合视图矩阵V:
    • 先应用平移,再应用旋转,因此矩阵相乘顺序为R * T

在这里插入图片描述

视图变换案例

通过一个透视投影矩阵,模拟人眼观察效果(FOV 视野角度)

glMatrix.mat4.perspective(projMatrix, 30.0, canvas.width / canvas.height, 1.0, 100.0);

初始化相机矩阵(视图矩阵)使用 lookAt 函数创建视图矩阵,表示相机的位置、目标点和上方向

参数说明:修改 x, y, z 值会改变相机的目标点,从而调整视角

  • [3.0, 3.0, 3.0]: 相机的初始位置(位于 (3, 3, 3) 点)
  • [x, y, z]: 目标点,即相机看向的方向(由 setTranslate 的参数决定)
  • [0.0, 1.0, 0.0]:上方向向量(Y轴向上)
const viewMatrix = glMatrix.mat4.create();
glMatrix.mat4.lookAt(viewMatrix, [3.0, 3.0, 3.0], [x, y, z], [0.0, 1.0, 0.0]);

创建模型矩阵并计算 MVP 矩阵:

模型矩阵 (modelMatrix) 表示物体本身的变换(如平移、旋转等)

  • MVP 矩阵是通过将投影矩阵 (projMatrix)、视图矩阵 (viewMatrix) 和模型矩阵 (modelMatrix) 相乘得到的
  • 最终的 MVP 矩阵传递给着色器中的 u_formMatrix,用于顶点坐标变换
let modelMatrix = glMatrix.mat4.create();
u_ModelMatrix = gl.getUniformLocation(gl.program, 'u_formMatrix');
MVPMatrix = glMatrix.mat4.create();
glMatrix.mat4.multiply(MVPMatrix, projMatrix, glMatrix.mat4.multiply(MVPMatrix, viewMatrix, modelMatrix));
gl.uniformMatrix4fv(u_ModelMatrix, false, MVPMatrix);

第一人称视角

第一人称视角的核心是相机始终位于观察者的“眼睛”位置,并朝向观察方向

视线方向与水平方向计算

  • lookAtDirction: 从相机位置指向目标点的方向向量(即视线方向)
  • rightDirection: 水平方向向量,通过视线方向与上方向叉乘得到
const lookAtDirction = glMatrix.vec3.subtract(glMatrix.vec3.create(), lookAtPosition, eyePosition);
glMatrix.vec3.normalize(lookAtDirction, lookAtDirction);const rightDirection = glMatrix.vec3.cross(glMatrix.vec3.create(), updirction, lookAtDirction);
glMatrix.vec3.normalize(rightDirection, rightDirection);

第三人称视角

与第一人称视角不同的是,相机始终位于观察对象的后方或侧面,用户可以看到自己控制的角色或物体

特性第一人称视角第三人称视角
相机位置位于“眼睛”位置,跟随移动固定在角色背后或侧面,不随移动变化
目标点始终指向视线前方始终指向角色中心
移动方式相机位置改变,视角跟随移动角色移动,相机视角固定或绕其旋转
交互操作按钮控制前后左右移动按钮控制视角绕角色旋转
视觉体验用户感觉自己在场景中行走用户看到角色在场景中活动

投影变换

在前面已经了解了正交投影和透视投影,WebGL图形编程实战【3】:矩阵操控 × 从二维到三维的跨越

公式推导

正交投影

在这里插入图片描述

正交投影可以分为两步:第一步为平移,第二步为缩放。将长方体(目标)投影到画布上

在这里插入图片描述

透视投影

在这里插入图片描述

案例

在进行正交投影和透视投影的时候可以直接使用封装好的函数

glMatrix.mat4.ortho(projMatrix, -1, 1, -1, 1, -1, 100);
glMatrix.mat4.perspective(projMatrix, 30.0, canvas.width / canvas.height, 1.0, 100.0);

还是以正方体展示为例:

NDC变换

在这里插入图片描述

视口变换

该转换的目的在于将某个在ndc坐标系的点p(x, y, z) ,转换为屏幕坐标系中的点p1(x1, y1, z1) , 更具体的来说 就是将x轴的 [-1,1]转换为[X,X + Width],将y轴的[-1,1]转换为[Y,Y + Height], 将z轴的[-1,1] 转换为[near,far]

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/81030.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电力电容器故障利用沃伦森(WARENSEN)工业设备智能运维系统解决方案

行业工况背景 当配电室报警显示“电容器故障”时&#xff0c;管理者可能会感到焦虑。沃伦森&#xff08;WARENSEN&#xff09;凭借十多年的电力补偿设备服务经验&#xff0c;提供了科学的故障应对流程&#xff0c;帮助避免大部分二次损失。 一、五大常见故障现象快速识别 温度…

星海智算云平台部署GPT-SoVITS模型教程

背景 随着 GPT-SoVITS 在 AI 语音合成领域的广泛应用&#xff0c;越来越多的个人和团队开始关注这项前沿技术。你是否也在思考&#xff0c;如何快速、高效地部署并体验这款强大的声音克隆模型&#xff1f;遗憾的是&#xff0c;许多本地部署方案不仅配置复杂&#xff0c;而且对…

高吞吐与低延迟的博弈:Kafka与RabbitMQ数据管道实战指南

摘要 本文全面对比Apache Kafka与RabbitMQ在数据管道中的设计哲学、核心差异及协同方案。结合性能指标、应用场景和企业级实战案例,揭示Kafka在高吞吐流式处理中的优势与RabbitMQ在复杂路由和低延迟传输方面的独特特点;介绍了使用Java生态成熟第三方库(如Apache Kafka Clie…

Python零基础入门到高手8.4节: 元组与列表的区别

目录 8.4.1 不可变数据类型 8.4.2 可变数据类型 8.4.3 元组与列表的区别 8.4.4 今天彩票没中奖 8.4.1 不可变数据类型 不可变数据类型是指不可以对该数据类型进行原地修改&#xff0c;即只读的数据类型。迄今为止学过的不可变数据类型有字符串&#xff0c;元组。 在使用[]…

无人机数据处理与特征提取技术分析!

一、运行逻辑 1. 数据采集与预处理 多传感器融合&#xff1a;集成摄像头、LiDAR、IMU、GPS等传感器&#xff0c;通过硬件时间戳或PPS信号实现数据同步&#xff0c;确保时空一致性。 边缘预处理&#xff1a;在无人机端进行数据压缩&#xff08;如JPEG、H.265&#xff09;…

LeetCode 热题 100 105. 从前序与中序遍历序列构造二叉树

LeetCode 热题 100 | 105. 从前序与中序遍历序列构造二叉树 大家好&#xff0c;今天我们来解决一道经典的二叉树问题——从前序与中序遍历序列构造二叉树。这道题在 LeetCode 上被标记为中等难度&#xff0c;要求根据给定的前序遍历和中序遍历序列&#xff0c;构造并返回二叉树…

CSS- 1.1 css选择器

本系列可作为前端学习系列的笔记&#xff0c;代码的运行环境是在HBuilder中&#xff0c;小编会将代码复制下来&#xff0c;大家复制下来就可以练习了&#xff0c;方便大家学习。 HTML系列文章 已经收录在前端专栏&#xff0c;有需要的宝宝们可以点击前端专栏查看&#xff01; 系…

MongoClient和AsyncIOMotorClient的区别和用法

示例代码&#xff1a; from motor.motor_asyncio import AsyncIOMotorClient from pymongo import MongoClient&#x1f50d; 这两个库分别是&#xff1a; 名字说明举个例子pymongo.MongoClient同步版 的 MongoDB 客户端&#xff08;常规阻塞式操作&#xff09;你在主线程里一…

5.15打卡

浙大疏锦行 DAY 26 函数专题1 知识点回顾&#xff1a; 1. 函数的定义 2. 变量作用域&#xff1a;局部变量和全局变量 3. 函数的参数类型&#xff1a;位置参数、默认参数、不定参数 4. 传递参数的手段&#xff1a;关键词参数 5. 传递参数的顺序&#xff1a;同时出现三种参数…

针对面试-mysql篇

1.如何定位慢查询? 1.1.介绍一下当时产生问题的场景(我们当时的接口测试的时候非常的慢&#xff0c;压测的结果大概5秒钟))&#xff0c;可以监测出哪个接口&#xff0c;最终因为是sql的问题 1.2.我们系统中当时采用了运维工具(Skywalking就是2秒&#xff0c;一旦sql执行超过2秒…

window 显示驱动开发-报告图形内存(三)

图形内存报告示例 示例 1&#xff1a;笔记本电脑上的 128 MB 专用板载图形内存 以下屏幕截图显示了使用 Intel Iris 离散图形适配器运行 Windows 11 的 Surface 笔记本电脑的计算图形内存数。 适配器的可用内存总数为 16424 MB&#xff0c;用于图形用途&#xff0c;细分如下&…

极简主义现代商务风格PPT模版6套一组分享下载

现代商务风格PPT模版下载https://pan.quark.cn/s/12fbc52124d9 第一张PPT模版&#xff0c;简约风&#xff0c;橄榄绿背景&#xff0c;黑色竖条装饰&#xff0c;文字有中英文标题和占位符。需要提取关键元素&#xff1a;简约、橄榄绿、对称布局、占位文本的位置。 风格​&#…

SpringBoot中10种动态修改配置的方法

在SpringBoot应用中&#xff0c;配置信息通常通过application.properties或application.yml文件静态定义&#xff0c;应用启动后这些配置就固定下来了。 但我们常常需要在不重启应用的情况下动态修改配置&#xff0c;以实现灰度发布、A/B测试、动态调整线程池参数、切换功能开…

嵌入式自学第二十二天(5.15)

顺序表和链表 优缺点 存储方式&#xff1a; 顺序表是一段连续的存储单元 链表是逻辑结构连续物理结构&#xff08;在内存中的表现形式&#xff09;不连续 时间性能&#xff0c; 查找顺序表O(1)&#xff1a;下标直接查找 链表 O(n)&#xff1a;从头指针往后遍历才能找到 插入和…

高并发内存池(三):TLS无锁访问以及Central Cache结构设计

目录 前言&#xff1a; 一&#xff0c;thread cache线程局部存储的实现 问题引入 概念说明 基本使用 thread cache TLS的实现 二&#xff0c;Central Cache整体的结构框架 大致结构 span结构 span结构的实现 三&#xff0c;Central Cache大致结构的实现 单例模式 thr…

Ubuntu 安装 Docker(镜像加速)完整教程

Docker 是一款开源的应用容器引擎&#xff0c;允许开发者打包应用及其依赖包到一个轻量级、可移植的容器中。本文将介绍在 Ubuntu 系统上安装 Docker 的步骤。 1. 更新软件源 首先&#xff0c;更新 Ubuntu 系统的软件源&#xff1a; sudo apt update2. 安装基本软件 接下来…

【深度学习】数据集的划分比例到底是选择811还是712?

1 引入 在机器学习中&#xff0c;将数据集划分为训练集&#xff08;Training Set&#xff09;、验证集&#xff08;Validation Set&#xff09;和测试集&#xff08;Test Set&#xff09;是非常标准的步骤。这三个集合各有其用途&#xff1a; 训练集 (Training Set)&#xff…

Mysql刷题 day01

LC 197 上升的温度 需求&#xff1a;编写解决方案&#xff0c;找出与之前&#xff08;昨天的&#xff09;日期相比温度更高的所有日期的 id 。 代码&#xff1a; select w2.id from Weather as w1 join Weather as w2 on DateDiff(w2.recordDate , w1.recordDate) 1 where…

鸿蒙OSUniApp 制作个人信息编辑界面与头像上传功能#三方框架 #Uniapp

UniApp 制作个人信息编辑界面与头像上传功能 前言 最近在做一个社交类小程序时&#xff0c;遇到了需要实现用户资料编辑和头像上传的需求。这个功能看似简单&#xff0c;但要做好用户体验和兼容多端&#xff0c;还是有不少细节需要处理。经过一番摸索&#xff0c;总结出了一套…

科技的成就(六十八)

623、杰文斯悖论 杰文斯悖论是1865年经济学家威廉斯坦利杰文斯提出的一悖论&#xff1a;当技术进步提高了效率&#xff0c;资源消耗不仅没有减少&#xff0c;反而激增。例如&#xff0c;瓦特改良的蒸汽机让煤炭燃烧更加高效&#xff0c;但结果却是煤炭需求飙升。 624、代码混…