采用光线跟踪绘制场景 c++_光线追踪的相干性聚集:硬件光线追踪的优势

尽管在理论上实现现代GPU的方法是无限的,但真正有效的方法是切实地了解问题并着手将方案变为现实。制造现代高性能半导体器件以及试图加速当前可编程光栅化技术所面临的问题揭示了GPU硬件行业发展的未来趋势。

例如在现代GPU中SIMD处理和固定功能纹理单元是必不可少的,以至于不使用它们来设计的GPU方案几乎肯定意味着在研究之外不具有商业上的可行性和实用性。即使是过去20年来,任何一个GPU最疯狂的愿景也没有舍弃这些核心原则(安息吧,Larrabee(英特尔公司GPU 的芯片代号))。

过去15年来实时光线追踪加速一直被默认为是GPU设计中最令人烦心的问题,关于光线追踪应该如何在GPU上实现的主流规范是微软推出的DXR,它要求的执行模型却不能真正融入GPU的工作模式,这无疑给任何需要支持它的GPU设计者带来一些严重的潜在问题。如果实时光线追踪是它们过去十年时间没有考虑过的事情,那么这个问题会更加明显,而Imagination一直在关注这个问题。

光线追踪面临的关键挑战

如果你遵循DXR规范并考虑需要在GPU中实现些什么从而提供计算加速性能,那么你将很可能快速梳理出以下这几个不管采用何种设计方案都需要解决的问题:

首先,你需要一种方法来生成和处理一组包含几何体的数据结构,从而能以更有效的方式根据几何体来跟踪光线。其次,当追踪光线时,GPU要测试光线是否与之相交,要提供一些用户可定义的编程接口。第三,被跟踪的光线可以发出新的光线!DXR规范定义的实现方案还需要考虑其他问题,但是从全局来看这三个因素是最重要的。

2982b5e37187ca748bf23274de1c1d0b.png

PowerVR光线追踪混合渲染效果

生成和使用加速数据结构来有效地表示需要做相交测试的几何体意味着GPU可能要完成一个全新的执行阶段,然后我们需要用全新的接口函数处理这些新的数据结构,测试是否相交,之后在程序员的控制下根据相交测试的结果实现一些功能。GPU是并行的设计,所以同时处理一堆光线意味着什么?这样做是否发现了新挑战,而这些挑战与传统的几何和像素并行处理所带来的挑战却大不相同?

上一个问题的答案是非常肯定的,的确这些差异对如何将光线追踪映射到现有的GPU执行的模型中有着深远的影响。这些GPU存在计算资源和内存资源的不平衡,导致内存访问成为一种宝贵的资源,而浪费这些资源是导致效率和性能低下的最主要原因之一。

哦不——我们做了些什么?

GPU被设计成可以任何形式充分利用与之连接的DRAM的访问,利用内存访问的空间或时间局部性来作为实现这一目的的方法。值得庆幸的是,最常见和最现代化的光栅化渲染有一个很好的特性,即在着色期间(尤其是像素着色通常是任何给定帧的主要工作负载)三角形和像素顶点有可能与它们的近邻共享相关数据。因此,您访问一组像素所需的任何缓存数据,很可能下一个相邻的组将需要使用您已经从DRAM中提取并缓存的部分或全部内存数据。对于当今大多数栅格化渲染工作负载而言,这都是正确的,因此我们都可以松一口气,并围绕该属性设计GPU架构。

当我们使用光线追踪,这些就都失效了。光线追踪使所有空间局部性消失。下面让我们来分析其中的原因。

物体表面的问题

最简单的思考方式就是观察四周,在你坐下来阅读这篇文章时注意光线在你所处环境中的作用。由于光线追踪建模了光线从所有光源传播时的属性,因此它必须处理光线照射在场景中任何表面时发生的情况。也许我们只关心光线照射哪些物体,也许物体的表面以均匀的方向散射光线,但它也可能完全是随机的。也许表面吸收了所有的光,因此不会有次级光线的传播。也许表面有一种材质属性,使它能够部分吸收几乎所有照射来的光线,然后随机散射它不能捕获的少量光线。

c526562eba5380e31130dfd02609e88b.png

只有第一种场景可以映射到GPU的利用内存访问局部性的工作模式,即使如此也只有当所有并行处理的光线都照射到同一类型的三角形时才可以。

正是这种明显分歧的可能性导致了这些问题,如果并行处理的任何光线相互之间可能会有不同的作用,包括撞击不同的加速数据结构或发出新的光线,那么GPU能高效工作的基本前提就会被破坏,而且这通常比在传统的几何图形或像素处理中遇到的发散现象更具有破坏性。

相干性聚集

PowerVR对光线追踪硬件加速的实现所做的是硬件光线追踪和排序,它与当今行业内任何其他硬件光线追踪加速相比都是独一无二的,这对软件方面来说是完全透明的,确保硬件上并行追踪的发射光线具有潜在的相似性。我们称之为相干性聚集。

硬件维护了一个数据结构,用于层次化的存储软件发出的正在被硬件处理的光线,并能够根据它们的方向按它们在加速结构中前进的位置进行选择和分组。这意味着当它们被处理时更可能共享存储器中被访问的加速数据结构中的数据,且额外的优势是能够最大化随后要并行处理的光线-几何体相交计算的数量。

通过分析由硬件调度的光线,我们可以确保以GPU友好的方式对它们进行分组,从而更高效地进行后续处理,这些是该系统成功的关键,有助于避免打破GPU行业为高效的光栅化渲染而精心设计的运行模式,这就避免了光线追踪硬件对特殊类型存储系统的需求,因此提供了与GPU的其他部分更容易集成的方案。

4c1ac0bed39c8dd063e15dddb79f6eb0.png

相干性聚集机制本身相当的复杂,因为它需要快速的追踪,排序和调度所有被提交到硬件中处理的光线,从而不会反压前级用于发射光线的调度系统,也不会造成后级以排序好的光线和加速数据结构为输入的硬件的空闲。

如果没有硬件系统来帮助GPU处理光线排序,那么就需要依赖应用程序或游戏开发人员以某种方式在主机上处理光线的相干性问题,或者在GPU上加入一个中间的计算环节来处理光线排序——前提是这种方式被硬件所支持,以上假设的方式中没有一个能在实时的硬件平台上提升效率和性能,然而Imagination是市场上唯一拥有这种硬件光线追踪系统的GPU IP供应商。

紧跟潮流

Imagination之所以成为行业内唯一针对硬件光线追踪提供解决方案的供应商是因为我们已经致力于解决这个问题很长时间了。与行业中其他一些正在缓慢进展的技术相比,光线追踪已经成为当今图形技术广泛采用API之一。

我们的相干性聚集特性与目前行业的光线追踪相互兼容(如果光线恰好发射出新的光线,堆栈将会被释放也可能发射出新的光线等等),在每个阶段进行相干性聚集处理并确保我们尽可能地实现硬件光线追踪的强大性能。

在现代的硬件光线追踪系统中最重要的是测量光线束、峰值并行测试率或空光线发射和未命中率,这些是描述光线追踪硬件性能的简单方式,但是也并不是非常的有用,毕竟开发人员并不只关心高峰值并行测试率或漏测率。

我们的目标是在整个加速系统中使用全面的光线追踪,这样开发人员就可以用光线束预算要实现哪些有用的功能。我们的相干性聚集系统与我们提供的解决方案共同实现了这个目标,与行业内的其他方案相比是独一无二的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/559359.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ajax请求php省略后缀,如何在PHP中更安全地处理Ajax请求?

在谷歌搜索了很多次后,回答结束了!步骤1:为所有Web服务生成令牌系统:生成令牌:session_start();$token md5(rand(1000,9999)); //you can use any encryption$_SESSION[token] $token; //store it as session variable?>步骤2:发送Ajax调用时使用它:var form_data {data…

python编写字符串查找函数_Python 简明教程 --- 8,Python 字符串函数

好代码本身就是最好的文档。当你需要添加一个注释时,你应该考虑如何修改代码才能不需要注释。—— Steve McConnell目录字符串有很多操作函数,所以,这里我们专门用一节来介绍这些函数。建议:由于字符串函数较多,对于新…

php汽车之家数据api,基于聚合数据的全国违章直连查询接口示例-PHP版

前言从聚合数据官网的接口文档中我们可以看出全国违章直连查询的调用一般来说需要两个步骤获取支持城市参数接口&#xff0c;即获取到不同城市的需要的参数的长度规则请求违章查询接口&#xff0c;即获取到车辆的违章记录我们以无锡城市为例代码部分<?php // 请求的接口URL…

xxljob 配置具体定时任务_分布式任务调度: XXL-Job

1 任务调度中心搭建、部署、任务管理与监控[1]任务调度中心页面2 SpringBoot 集成 xxl-job&#xff1a;创建调度任务maven项目pom.xml引入依赖:<dependency><groupId>com.xuxueli</groupId><artifactId>xxl-job-core</artifactId><version>…

php 判断同时存在英文跟数字,php判断输入是否是纯数字,英文,汉字的方法

本文实例讲述了php判断输入是否是纯数字&#xff0c;英文&#xff0c;汉字的方法。分享给大家供大家参考。具体分析如下&#xff1a;这里利用php的mb_strlen和strlen函数就可以轻松得知字符串的构成是全英文、英汉混合、还是纯汉字。简要说明如下&#xff1a;1、如果strlen返回…

前端白屏问题_深入理解前端性能监控

在同样的网络环境下&#xff0c;有两个同样能满足你的需求的网站&#xff0c;一个唰的一下就加载出来了&#xff0c;另一个白屏转圈转了半天内容才出来&#xff0c;如果让你选择&#xff0c;你会用哪一个&#xff1f;页面的性能问题是前端开发中一个重要环节&#xff0c;但一直…

java in action,java 7 in action

《JAVA语言程序设计》期末考试试题及答案7_远程、网络教育_成人教育_教育专区。《JAVA语言程序设计》期末考试试题及答案7 一、选择题 1. 请说出下列代码的执行结果......v alidateTree Methods inherited from class javaponent action, add, addCom ponentListener, addFocus…

信号的采样与恢复matlab实验报告,实验七 连续信号的采样与恢复

一、实验目的通过MATLAB仿真验证抽样定理&#xff0c;进一步加深对抽样定理的理解。二、实验原理1. 连续信号的采样对某一连续时间信号f(t)的采样原理图为&#xff1a;由图可知&#xff0c;&#xff0c;其中&#xff0c;单位冲激采样信号的表达式为&#xff1a; 其傅里叶变换为…

treegrid 如何获取getchanges inserted_如何避开Vue性能优化之路的荆棘?

随着这几年前端技术快速发展&#xff0c;Vue框架在国内普及率极高&#xff0c;人人都会用&#xff0c;那Vue如何写得比别人优雅&#xff1f;如何写得比别人漂亮&#xff1f;鉴于一线互联网大厂在前沿技术领域的持续研究和大规模投入&#xff0c;直接向他们取经&#xff0c;是最…

matlab+信号+mpf,Python和Matlab中平均频率的差异

我有这个EMG signal&#xff0c;我想根据这个article绘制平均功率频率。我使用以下代码在Matlab中实现它&#xff1a;clear all;close all;EMGload(EMG.txt);N1000; %my windowz1;fs200 %sampling ratefor i1:length(EMG)-NDUM0;NUM0;FTfft(EMG(i:iN-1));psdFT.*conj(FT);NFFTl…

matlab和vlfeat关联,VLFeat在matlab和vs中安装

转&#xff1a;http://blog.csdn.net/u011718701/article/details/51452011博主最近用vlfeat库做课题&#xff0c;网上搜索使用方法&#xff0c;一大片都会告诉你说&#xff1a;run(/vl_setup) 然后就好啦哈哈哈哈哈哈~~~~~~~~~~~~~~But!理想很丰满&#xff0c;现实很骨感&…

document.createelement如何绑定点击事件_番外篇-EXCEL如何使用宏(VBA)

小编&#xff0c;会在后续推送一些关于VBA(宏)相关的文章(之前其实也推送了一些&#xff0c;其中也大概说了一下如何使用)&#xff0c;所以我们今天就专门写一篇如何使用宏&#xff0c;方便大家使用已经写好的宏。如何使用宏&#xff1a;常规宏VBA-一般都是此类1、调出-开发工具…

mysql --max_allowed_packet=32m,如何修改MySQL-max_allowed_packet

首先查找my.cnf的配置文件(为了让配置永久生效)mysql --help | grep my.cnf修改mysql配置文件&#xff0c;找到vim /etc/my.cnfmax_allowed_packet 1024M >改为2048M保存退出&#xff0c;重新启动mysql服务、/etc/init.d/mysqld restart登录mysql通过本地地址mysql -uroot…

局域网打印机反应慢_为什么你的Excel这么慢,这些原因必须要知道!

Excel是很多人的高频办公工具&#xff0c;但大家或多或少地遇到过&#xff0c;有时自己电脑的Excel很慢&#xff0c;导致工作的效率不高&#xff0c;可能就会导致要加班加点&#xff0c;也压缩了自己其他方面的时间。本文将介绍一些常见的Excel”慢“的情况及其解决方案&#x…

php密码安全检测,php – 密码安全随机字符串函数

目标&#xff1a;找到最加密的安全随机字符串生成器.在字符串中使用字母,数字和可能的特殊字符.我一直在这里和其他地方读书,但我仍然听到很多不同的答案/意见.那些对安全性和加密技术有最新知识且知识渊博的人可以在这里发出声音.以下函数将用于生成8个字符的随机密码,并生成1…

linux挂载fc存储有超级坏块_Nand Flash基础知识与坏块管理机制的研究

欢迎FPGA工程师加入官方微信技术群点击蓝字关注我们FPGA之家-中国最好最大的FPGA纯工程师社群概述Flash名称的由来&#xff0c;Flash的擦除操作是以block块为单位的&#xff0c;与此相对应的是其他很多存储设备&#xff0c;是以bit位为最小读取/写入的单位&#xff0c;Flash是一…

php 设置agent,限制某个目录禁止解析php及user_agent、php相关配置

一、 限定某个目录禁止解析php1、 核心配置文件内容php_admin_flag engine off2、curl测试时直接返回了php源代码&#xff0c;并未解析二、 限制user_agent1、 user_agent可以理解为浏览器标识2、核心配置文件内容RewriteEngine onRewriteCond %{HTTP_USER_AGENT} .curl. [NC,O…

python 打印xml文档树_[Python]xml.etree.ElementTree处理xml文档

需求&#xff1a;在实际应用中&#xff0c;需要对xml配置文件进行实时修改&#xff0c;1.增加、删除 某些节点2.增加&#xff0c;删除&#xff0c;修改某个节点下的某些属性3.增加&#xff0c;删除&#xff0c;修改某些节点的文本xml源文件格式[例]path"/tmp">out…

oracle最快访问行,Oracle技术网—在Oracle快速进行数据行存在性检查

在Oracle快速进行数据行存在性检查当在应用程序的业务逻辑中需要检查一个外键是否有相关的主键时&#xff0c;往往使用Select Count(*)类型的SQL语句。这是一个很显而易的方法&#xff0c;但却不是最快的方法。Count(*)函数调用可能会引起对整个表的进行扫描&#xff0c;这是一…

carsim中质心加速度_振动CAE分析在空调压缩机支架设计中的应用

【摘要】本文运用有限元分析方法分析空调压缩机系统模态&#xff0c;并通过分析引起振动的激励源&#xff0c;找出压缩机支架和安装螺栓断裂的根本原因&#xff0c;并根据分析提出了解决措施。关键词&#xff1a;空调压缩机支架模态激励共振一、引言发动机轮系需要驱动的工作部…