随着虚拟现实的不断发展, 人们在使用虚拟现实系统的过程中, 对虚拟场景的真实性及实时渲染性的要求也逐步增高, 而随之虚拟场景也变得越来越复杂, 这就意味着所需要渲染的数据会大得惊人. 现如今随着游戏产业的蓬勃发展, 虚幻引擎的免费开放吸引了无数游戏开发人士以及学生的使用, 在虚幻引擎中创建一个具有真实感的场景势必包含地形、植被、建筑、氛围、特效等, 为了使场景的真实感更强, 不会出现场景卡顿的现象, 最重要的是需要在庞大复杂的虚拟场景中提高渲染效率.
随着计算机显卡处理能力的不断提高, 在游戏场景中, 越来越多的开发人员倾向于使用三维场景的光影、动画、粒子特效等, 使场景画面渲染的真实度越来越高, 让用户有身临其境的感觉[1]. 引擎中的优化占据着尤为重要的地位, 其可优化的覆盖范围非常广泛, 涉及到内存的分配、多线程加载、层次细节算法(LOD)[2]等, 要想高效率解决引擎优化问题, 必须要找出实际瓶颈所在, 然后对症下药, 提高工程渲染运行效率.
本文在虚幻引擎中进行三维重建天津理工大学, 对整个工程进行渲染加速, 提出了将游戏线程与渲染线程并行计算和双层裁剪算法, 主要贡献可以概括为:
(1) 将虚幻引擎中游戏线程与渲染线程同步并行执行, 节省渲染时间;
(2) 提出了淡入淡出层次细节算法, 使用高度补偿的方法, 使每个层级之间过渡平滑, 从而解决传统的层次细节算法所出现的“突越”现象;
(3) 提出了缓慢剔除算法, 使用两个剔除距离, 利用不透明度来实现缓慢剔除, 从而解决传统的剔除算法所出现的“突越”现象;
(4) 提出了双层裁剪算法, 使用淡入淡出层次细节算法进行第一层裁剪, 再使用缓慢剔除算法进行第二层裁剪, 从而加快了渲染速度.
1 相关技术介绍近年来在复杂的三维虚拟场景中最常用的优化算法主要有: 层次细节算法[3]和剔除算法[4], 这两种算法都是单层裁剪算法, 本文主要对这两种算法进行了改进, 并提出了双层裁剪算法.
1.1 层次细节算法层次细节算法, 简称LOD(Levels of Detail)[2], 是根据模型的节点在显示环境中所处的位置和重要度, 决定物体渲染的资源分配, 降低非重要物体的面数和细节度, 它的目的是通过保留重要视觉特征来生成简化的模型, 以降低场景复杂度, 实现场景实时绘制, 从而获得高效率的渲染运算[5].
在现实世界中, 人眼视角是有一定盲区的, 并不能看到360度的场景, 并且随着视线向远处延长, 看到的东西会越来越模糊. 因此在虚幻引擎中也会选择视野范围内的物体进行绘制, 将场景中的目标模型按照一定的区域划分法进行快速分割, 并将模型对象组织到树结构中, 然后从根节点开始进行视域剪裁测试, 当某些节点测试失败, 表示其位于视域体制外, 可在渲染之前将其剔除, 其子孙节点无需再进行测试, 可直接剔除[6].
传统的LOD算法将每个层级的三角面片数进行了大量的裁剪, 该方法虽然能提高渲染效率, 但在视觉上会出现“突越”现象, 即在层级之间切换不平滑. 故本文针对该问题提出了淡入淡出层次细节算法.
1.2 剔除算法传统的剔除算法[7], 简称CULL, 保证在远距离的时候对植被不进行渲染, 以及被遮挡的植被不进行渲染, 从而提高渲染效率. 传统剔除算法需要对每个单元进行两次可见性剔除判断, 从而避免了遮挡部分也进行渲染, 提高了渲染效率[8].
目前的遮挡剔除研究算法主要可以分为动态遮挡剔除算法和静态遮挡剔除算法[9]. 由于本文的实验场景是虚拟校园, 不考虑动态物体, 故采用了静态遮挡剔除算法. 静态遮挡剔除算法需要对场景进行预处理, Zaugg[10]等人提出了将基于区域的室内静态场景的方法扩展到了地形场景等. 将场景进行等单元划分, 依据视野向量与三角面片的平面法向量的夹角
虽然传统的剔除算法能提高渲染效率, 但其在计算过程中将考虑到的向量为三维向量, 其计算量比二维向量增加很多; 且其只设置一个剔除距离, 若视野从一个可见去区域移动到一个不可见区域, 就会出现“突越”现象, 这样显得就很突兀, 故本文提出了缓慢剔除算法.
2 线程优化在虚幻引擎中, Frame时间是一帧所花费的总时间, Game是游戏线程, 它不与渲染直接关联, 如若游戏线程很慢, 则通常是工程内程序不够优化, 占据内存过多; Draw是渲染线程, 包括图形应用程序编写接口API (Application Programming Interface)以及绘图调用的设置, 若渲染线程很慢, 则说明工程中需渲染的三角面片过多. 在虚幻引擎中使用的是单线程, 游戏线程和渲染是串行的, 由于渲染中的数据通常依赖于游戏逻辑线程, 所以通常会先进行游戏逻辑的任务, 然后再进行渲染, 如图1(a)所示, 此时一帧所占的时间是Game和Draw两个线程执行帧数的总和, 所以场景的渲染效率相对较慢.
本文在虚幻引擎中将游戏线程和渲染分离成两个单线程, 如图1(b)所示, 并行起来执行, 此时一帧的时间就是Game和Draw各自执行时两个中耗时最长的帧数, 这样整个工程的运行效率就会得到显著的提升.
将游戏线程与渲染线程并行之后还需要将其进行同步处理, C++中常用锁或临界区的方式来解决同步问题. 本文采用的是栅栏的技术即Render Command Fence机制. 所谓的栅栏技术就是指在下一次进行读取操作前, 所有的写操作都被写入了内存, 因而每次的读操作都是更新后的内存, 从而用来防止游戏线程和渲染线程运行相差过大, 导致整个工程运行错乱.
3 双层裁剪算法 3.1 第一层裁剪—淡入淡出层次细节算法传统的层次细节算法在随着不同LOD等级之间进行切换时, 会出现顶点高度值的突然变化, 从而导致视觉上出现“突越”现象, 本文提出了淡入淡出层次细节算法, 对顶点的高度值进行缓慢变化处理即高度补偿来解决该现象.
现假设由一层切换到另一层时, 某一顶点由A切换为
$ {h_{A'}} = {h_A} + \frac{{\Delta t}}{t} \cdot \Delta t $ | (1) |
在大规模的虚拟场景中使用层次细节算法可以有效地裁剪掉所设置的视野范围外的模型, 同时根据模型在视野范围内的比例可以选择精裁剪或是粗裁剪, 故本文采用淡入淡出层次细节算法进行第一层裁剪.
3.2 第二层裁剪—缓慢剔除算法传统的剔除算法主要是进行三维向量的计算, 且在剔除不可见面时会出现“突越”现象, 本文提出了缓慢剔除算法, 将传统的剔除算法中三维向量的计算优化为二维向量的计算, 同时设置了两个剔除距离, 利用不透明度来解决“突越”现象.
二维向量的计算主要是通过投影变换将视野向量坐标归一化为
$ \overrightarrow n = \overrightarrow {AB} \times \overrightarrow {BC} = \left| {\begin{array}{*{20}{c}} {\overrightarrow x }&{\overrightarrow y }&{\overrightarrow z }\\ {{x_2} - {x_1}}&{{{\rm{y}}_2} - {y_1}}&{{{\rm{z}}_2} - {z_1}}\\ {{x_3} - {x_1}}&{{{\rm{y}}_3} - {y_1}}&{{{\rm{z}}_3} - {z_1}} \end{array}} \right| $ | (2) |
将
$ \overrightarrow n \cdot \overrightarrow v = \left( {{x_2} - {x_1}} \right)\left( {{y_3} - {y_1}} \right) - \left( {{y_2} - {y_1}} \right)\left( {{x_3} - {x_1}} \right) $ | (3) |
由式(3)可以看出此时的点乘结果与Z轴坐标无关, 将其转换成了二维向量坐标的计算, 此时由公式(4)计算角度
$ \overrightarrow n \cdot \overrightarrow v = \left| {\overrightarrow n } \right| \times \left| {\overrightarrow v } \right| \times \cos \theta $ | (4) |
根据
由于在虚拟场景中会出现大量的遮挡现象, 而剔除算法会根据每个三角面片进行可见性判断再进行剔除, 故本文采用缓慢剔除算法进行第二层裁剪, 对遮挡部分及模型背面进行二次裁剪, 从而提高渲染效率.
3.3 总结假设淡入淡出层次细节算法的层级为3层, 其对应模型所需占屏幕尺寸(Screen Size)分别为M1、M2、M3, 根据模型所占屏幕尺寸进行相应比例裁剪, 且在每个层级之间切换时使用高度补偿的方法解决“突越”现象, 缓慢剔除剔除算法的视野向量与三角面片的平面法向量的夹角
现将淡入淡出层次细节算法、缓慢剔除算法以及双层裁剪算法进行简称、特点的总结, 方便实验时进行简单表述, 总结如表1所示.
4 实验结果与分析 4.1 线程串行、并行对比实验本文将大量的场景组件的位置计算放到异步线程中, 利用动态组件处理将其转移到异步纹理流任务, 使它们能够与其他游戏线程任务得到并行的处理, 从而提高渲染效率, 本文对游戏线程与渲染线程的串行、并行做了多组实验, 用Frame数据来表示对比结果, 对比实验结果如图3所示.
由图3可以看出游戏线程与渲染线程串行时的Frame在15上下浮动, 而游戏线程与渲染线程并行时的Frame在9上下浮动, 一帧所花费的时间减少了40%左右. 但是仅依靠线程并行, 大规模的虚拟场景的渲染并不能有很大的改善.
4.2 LOD和FLOD实验对比本文以天津理工大学为整个实验场景, 设置三个LOD等级, 为了对比明显, 将分别对建筑物和植被的Screen Size参数设置一样, 如表2所示.
在每个层级之间进行切换, 看是否会出现“突越”现象, 实验结果如表3所示.
由表3可以看出在进行相邻等级之间切换时, 本文提出的淡入淡出层次细节算法很好的解决了“突越”现象.
4.3 CULL和FCULL对比实验由于本文是利用缓慢剔除算法进行第二层剔除, 故同样需要保证其不会发生“突越”现象, 本文将传统的剔除算法的剔除距离设置为400 cm, 将缓慢剔除算法的剔除的起始距离S设置为400 cm, 剔除终止距离E设置为600 cm, 来进行实验对比, 实验结果如表4.
由表4可看出, 采用缓慢剔除算法设置两个剔除距离, 利用不透明度可以实现模型的缓慢剔除, 避免了“突越”现象.
4.4 双层裁剪算法与单层裁剪算法对比实验本文提出的双层裁剪算法, 首先对整个场景进行淡入淡出层次细节算法裁剪, 对不在设置视野范围内的远处物体进行剔除, 仅仅加载渲染视野范围内的物体; 然后对视野范围内的物体进行单元分割进行第二次可见性判断, 将在视野盲区进行二次裁剪, 如建筑物的背面等.
在游戏引擎中最能体现渲染效率的就是帧率(Frame Per Second, FPS)了, FPS越大表示其渲染效率越高, 反之亦然, 故本文将仅使用FLOD进行单层裁剪、仅使用FCULL进行单层裁剪和本文提出的双层裁剪进行FPS的实验对比. 现设置三层LOD等级, Screen Size的参数设置如表3, 缓慢剔除算法的起始距离为S设置为400 cm, 剔除终止距离E设置为600 cm. 由于每个LOD等级的FPS不同, 故本文对三个等级的FPS做了均值处理. 实验结果如图4所示.
由图4可以看出仅进行FLOD单层裁剪的FPS在30左右, 仅进行FCULL单层裁剪的FPS也在30左右, 但本文提出的双层裁剪FPS达到了55左右, 很大程度上提高了渲染效率.
5 总结本文对虚幻引擎中单线程的游戏线程和渲染线程进行了同步并行化处理, 加快了一帧所需要的时间; 针对传统的层次细节算法提出了淡入淡出层次细节算法, 实验证明解决了层级切换所出现的“突越”现象; 针对传统的剔除算法提出了缓慢剔除算法, 实验证明解决了在超过剔除距离后出现的“突越”现象; 针对单层裁剪提出了双层裁剪, 首先使用淡入淡出层次细节算法进行第一层的裁剪, 裁剪掉在视野范围外的模型, 再使用缓慢剔除算法进行第二层裁剪, 裁剪掉被遮挡的模型部分, 从而很大程度上减少了所需渲染的三角面片数, 提高了渲染效率.
[1] |
符清芳, 张茹. 基于虚幻4的自然场景制作. 电脑知识与技术, 2016, 12(31): 188-189. |
[2] |
Hoppe H. Smooth view-dependent level-of-detail control and its application to terrain rendering. Proceedings Visualization ’98. Research Triangle Park, NC, USA, USA, 1998, 35-42. |
[3] |
刘晓, 刘镇, 梅向东. 基于实时LOD简化绘制的渲染优化方法. 湖南科技大学学报(自然科学版), 2015, 30(4): 92-96. |
[4] |
刘宗香. 图形生成过程中遮挡问题的解决方法. 计算机时代, 1997(10): 16. |
[5] |
费红辉, 王毅刚. 大规模场景分割及LOD结构生成算法研究. 计算机应用与软件, 2012, 29(7): 227-230. DOI:10.3969/j.issn.1000-386X.2012.07.066 |
[6] |
袁畅. GPU加速的可见性剔除方法研究[硕士学位论文]. 长沙: 中南大学, 2013.
|
[7] |
Hillesland K, Salomon B, Lastra A, et al. Fast and simple occlusion culling using hardware-based depth queries. Technical Report UNC-CH-TR02-039. Chapel Hill, NC, USA: University of North Carolina at Chapel Hill, 2002. |
[8] |
冉光灿, 谢晓尧, 景凤宣. 复杂3D地形的遮挡剔除算法研究. 福建电脑, 2012, 28(8): 4-7. DOI:10.3969/j.issn.1673-2782.2012.08.003 |
[9] |
额尔敦达来. 基于GPU的大规模地形场景绘制关键技术研究[硕士学位论文]. 长沙: 国防科学技术大学, 2005.
|
[10] |
Zaugg B, Egber P. Voxel column culling: Occlusion culling for large terrain models. Proceedings of The 3rd Joint EUROGRAPHICS-IEEE TCVG Conference on Visuali-zation. New York, NY, USA. 2001. 85–93.
|