首页>>互联网 >>内容

SER提高了UE5Lumen在GeForceRTX4000GPU上的硬件RT性能

发布时间:2022-10-16 09:09:43编辑:愉快的缘分来源:

GeForceRTX4000系列显卡引入的主要新功能之一是SER,即ShaderExecutionReordering的简写。随着光线追踪缓慢但肯定会变得越来越普遍,SER旨在通过减轻执行和数据发散来提高着色器效率。正如其名称所暗示的,它通过实时重新排序线程以增强连贯性来实现此结果。它还解耦了光线相交和着色操作。

NVIDIA在简短的问答中向Wccftech证实,SER(就像OpacityMicro-Maps和DisplacedMicro-Mesh,另外两个性能增强)需要在游戏中显式集成开发人员,并带有自己的NVAPIAPI扩展。幸运的是,NvRTXUnrealEngine5分支将很快更新到5.0.3版本,在最流行的下一代引擎中增加了对SER的支持。据NVIDIA称,ShaderExecutionReordering可以在光线追踪操作中提供高达40%的帧速率优化,而不会影响质量。

有趣的是,在启用硬件光线追踪时,SER还提高了UE5Lumen的性能。NVIDIA提供了三个示例用例。路径跟踪是第一个也是最简单的,性能提升可以在20%到50%之间。

路径追踪呈现出高度不同的工作流程,使其成为应用SER的绝佳候选者。应用SER允许路径跟踪器减少其材料评估中的分歧,而不仅仅是反弹次数。

据NVIDIA称,由于SER,该场景的渲染速度提高了40%。

除了重新排列着色器以减少发散之外,SER还很有用。例如,NVIDIA表示,当使用Lumen的硬件光线追踪全局照明时,工作压缩可以产生有意义的好处。

对于大型场景,例如UE5城市示例,跟踪分为近场和远场,它们作为单独的跟踪通道运行,其间有压缩。多次传递和压缩可以由单个NVReorderThread调用代替。这避免了GPU上需要压缩近场追踪结果然后发射远场光线的空闲气泡。

消除存储、压缩和重新启动工作的额外开销通常值得节省20%。由于原始代码中的假设(使用宏来置换行为而不是参数的函数),着色器更改可能会更加密集。但是,逻辑上的更改相当于添加了两个重新排序调用,其中包含一个布尔表达式,用于判断跟踪是否命中或未命中。

最后,NVIDIA详细介绍了Lumen的硬件光线追踪反射的第三个(尽管更复杂)用例。这里通常有两种不同的光线追踪管道,一种用于近场和远场追踪,另一种用于命中照明。

启用SER后,可以合并通道,因为不再需要单独的压缩和排序阶段。通道大致变成跟踪近场,如果不是命中跟踪远场,则如果任一命中则使用命中对象评估材质并执行照明。由于跟踪和着色的解耦,这是可能的。

上述实施使GPU上的流明反射速度提高了20-30%,这是在对UE5CitySample中的典型工作负载进行分析时测量的。

如果您是一位有兴趣为您的引擎添加SER支持的开发人员,您可能需要查看完整的。目前尚不清楚哪些游戏将在不久的将来支持着色器执行重新排序(或不透明微地图和置换微网格),但我们将与NVIDIA和游戏工作室一起进行调查。