Unreal Engine 虚幻引擎,性能分析,优化(一)

目录

一、Frame 帧

二、理想情况下,做性能分析时,当寻找游戏存在的瓶颈时,游戏的运行环境越接近目标硬件和目标平台,获得的数据越准确。

三、线程

四、Analysis of a frame ,“CPU”线程,“Game”线程

 怎么查看.ue4stats文件

五、Game Thread 游戏线程

六、Draw thred 绘制线程

七、GPU Thread

八、Light Complexity光照复杂度


一、Frame 帧

        帧的时间并不是其他数字的总和,并不是其他时间的总和。原因就是,这些线程,它们都是不同的线程,是并行运行的,每个线程都是按照顺序的,它们需要上一个线程的内容和结果。

二、理想情况下,做性能分析时,当寻找游戏存在的瓶颈时,游戏的运行环境越接近目标硬件和目标平台,获得的数据越准确。

        如果可以的话,要避免在编辑器里进行性能分析。一定要使用合适的打包版本,并且在目标硬件上运行。如果开发的是PC游戏,并且必须在编辑器里做性能分析,记得在独立模式(standalone mode)下运行,记得最小化编辑器,还有切记关闭帧率平滑(frame rates smoothing),并用控制台命令r.VSync=0关闭垂直同步。

三、线程

        它们是并行运行的,当游戏按图中的流程执行时,游戏线程会计算所有的游戏逻辑。“Game”(游戏)线程计算的所有数据,都会被储存起来,并被“Draw”(绘制)线程使用,它会算出所有不需要渲染的内容,这些内容不会显示在屏幕上,在这一步完成后。“GPU”线程会在屏幕上实际渲染出最终的像素。

如果这些线程,这些数据,如果它们计算每个线程的这些帧都需要耗费时间,那下一个步骤当然就要等待上一个步骤来完成工作,这样它才能开始工作。

四、Analysis of a frame ,“CPU”线程,“Game”线程

        “CPU”线程,“Game”线程,正如名字所示,负责整个游戏的模拟,所有的东西,从游戏逻辑,所有Actor的位置,场景中所有物体的位置,动画,实际动画帧,物理效果,AI,一切与场景最终效果有关的计算。与场景在某一帧中最终状况有关的计算,在进行处理时,都会在“Game”线程中计算。这步完成后,整个游戏世界就被计算完毕了,引擎就会知道什么东西该干什么,在下一步“Draw”(绘制)线程它会被过滤掉,它会剔除掉所有不在摄像机范围内,却还需要引擎去渲染的对象。我们有很多方法来做到这点,基本来说,所有不在摄像机范围内的东西,都会被我们过滤掉。然后我们创建一个列表,包含所有的Object对象、Shaders着色器、Materials材质、Textures纹理,所有需要发送给GPU的数据,然后GPU会处理这些数据。包括Vertex顶点、Shaders着色器、Textures纹理等各种数据,然后在屏幕上绘制最终的像素。

        4.1、有一种工具可以使用:有两条命令StartFPSChartStopFPSChart,它主要会获取stat unit的输出结果,把它们全程记录到一个文本文件里,也就是CSV文件。你可以用自己常用的表格编辑器打开它,然后创建一个图表,这非常有用,例如,可以帮助你找到游戏过场动画中出现卡顿的原因。或者,你甚至可以执行一些自动化任务。例如让摄像机扫拍整个关卡,然后记录所有数据,并导出到CSV文件中。你可以每周或者每晚定期做一次,检查是否有潜在问题,或导致性能不稳定的各种问题。

        4.2、CPU Profiler也非常有用,你可以利用stat Startfilestat Stopfile记录引擎的所有操作,引擎侦测到的每条命令,甚至是绘制调用的情况。这适用于任何开发版本或测试版本,所以你也可以在移动和主机平台上这么做。最棒的一点在于,这还会留下一个记录文件,你可以在电脑上加载它。在虚幻前段打开,然后你就能按照Tick组分析,或者逐帧分析,深入探索游戏线程。找到可能导致故障和性能问题的地方。

生成的file文件路径:项目文件夹\Saved\Profiling\UnrealStats\

后缀名.ue4stats文件

 怎么查看.ue4stats文件

Window——>DeveloperTools——>Session Frontend

Session Frontend——>Load,打开.ue4stats文件

打开.ue4stats文件之后,Session Frontend视图

        4.3、Unreal Insights有点类似Profiler,但这是个独立应用,独立程序。它可以在电脑上作为另一个进程运行,或者,你可以在另一个电脑上运行它。在使用体验上有一些改进,它能利用代码中的踪迹,让你更容易的添加自己的性能分析数据,它还能远程记录数据。

五、Game Thread 游戏线程

        要计算所有的逻辑,变换,动画,对象位置基本上与游戏逻辑有关与构建世界有关的一切,都要有”Game”游戏线程来计算,都要在你的CPU上进行计算。

         5.1、通常“Game”线程中的性能问题,元凶就是“Tick”函数中的复杂逻辑,众所周知“Tick”每一帧都要执行,它实际上就是计算引擎中everything所有东西状态的函数。但事实是,Blueprints蓝图,至少是Gameplay蓝图,它们很少需要每帧更新,因为大部分gameplay scripting游戏脚本都是event based基于事件的,或者不一定需要每帧都更新。当然,也有例外情况,但大部分情况下,你不需要那么做。

        5.2、要记住,如果你的场景和世界中有许多Actor在“Tick”函数,那就会严重拖累游戏的流畅度。你可以用一些命令,stat game很好用,它能查阅游戏逻辑在特定情况下的每帧更新耗时。还有dumpticks命令它能列出正在更新的所有Actor以及它们的总数。

        5.3、Alternatives to Tick:在tick函数中,添加复杂逻辑之前,要谨慎评估是否真的需要这么做,去每帧更新逻辑。有很多替代方法,你可以采用基于事件的方法,因为有些游戏逻辑未必会像你假设的那样频繁更新。或者,如果真的需要以固定频率更新,你可以使用计时器,甚至降低蓝图Tick函数的调用频率。你可以使用计时器,比如也许可以每帧四分之一,甚至十分之一秒更新一次。这会有助于你,减少性能开销。你还可以使用TimeLine,你可以手动禁用Tick,比如禁用那些距离玩家太远的Actor,它们不在摄像机里。如果它们太远,就停止每帧更新,在你靠近它们的时候再重新启用。对于大多数的游戏逻辑来说,都应该能够通过事件驱动的系统来实现。

        5.4、另外有一些内容,例如视觉效果。每帧都更新它们会让我们更舒服,这通常要用到Timeline,或者tick函数,这个函数在每次更新时会更新材质参数,从而实现某些像素着色效果。

        5.5、假如是这种简单的淡出效果或动画,你实际上可以用GPU,也就是像素着色器实现这类效果,这是个很简单的例子。只要经过了开始时间点,算法就会完成剩下的工作,即在两个值之间插值,你就完全不会用到CPU线程,这都在GPU上运行。对于这类效果来说,运行速度会非常快。

        5.6、性能开销很大的函数,尽量避免使用那些本来就开销巨大的函数,假如你真的要使用这些函数,一定要多加谨慎。如果你真的要调用这个函数,请在event based基于事件的逻辑中调用它。比如在游戏启动时调用它,或者编写某种基于事件的逻辑,在只有需要访问数据的时候才调用这个函数,然后把数据全部缓存到数组中,所以请记住这些好习惯。

        此外,如果你需要用到For循环,尤其是在涉及多重循环时,记得要及时中断循环,这样等你找到需要的对象后,就不用运行其余的循环了。

        SpawnActor 在生成Actor时,还是会占用很多资源,因为这同样需要占用当前平台的IO接口,如果你在游戏中需要频繁生成Actor,你就要多加小心了。你可以考虑把场景中的Actor保存到缓存池中,还有,你要注意,construction script构造脚本会增加每个Actor的生成耗时。

        5.7、如果你真的要在Tick函数中,实现复杂算法和运算,请考虑使用原生代码,或者C++。屏幕中的不是游戏逻辑代码,而是源自《堡垒之夜》的某个Animation Blueprint动画蓝图,不过动画蓝图有点类似于每帧执行复杂的数学运算。在使用动画蓝图时,你会用到一些向量,然后进行数学运行获得算法的结果,并用它来更改动画。所以,如果你真的在Tick函数中实现复杂的运算,可以考虑使用C++,使用原生代码,你可以试着使用蓝图原生化功能来这么做。

如果你想精益求精,实现最佳的性能表现,那就用C++和原生代码。 

六、Draw thred 绘制线程

        Draw thred会获得游戏世界的计算结果,也就是“Game”线程的计算结果,这个结果包含了整个游戏世界的逻辑计算结果。Draw thred会过滤掉所有不需要渲染的内容,其中会用到多种技巧,比如“Frustum culling”视锥剔除,根据平台不同,我们还能使用hardware occlusion queries硬件遮挡查询,这在移动平台上行不通。一般来说,场景中的对象越多问题就越多。这在开放式或大型场景中尤为重要,总的来说,你应当知道,如今的硬件极限是渲染10000到15000个对象。接着,在引擎获知要渲染哪些对象后,它就会创建一个命令列表,并发送给GPU让它去渲染,这些命令会渲染场景的这一部分。一个接一个的draw call绘制调用,那什么是draw call呢?

每个draw call都有固定的开销,draw call越多,你来回绘制所耗费的时间就会呈线性增加,情况会越来越糟糕。可以使用stat scenerendering 命令随时查看场景绘制。

        6.1、Draw thred 绘制调用会对性能造成极大影响,这方面要小心,再来回调用时,每当renderer渲染器需要发送命令,或者你增加了开销,它实际上的影响有时比ploycount多边形数量的影响还要严重。要想知道场景的绘制调用情况,一个好的入手点就是使用RenderDoc来调试draw call,这是个开源工具。

        6.2、如何避免draw call,大体上,为了减少draw call目前唯一的办法,就是使用更少、更大的模型。把不同的模型,不同的对象合并成一个模型,这是此类情况的常用解决办法。但问题是,你不能做的太多,因为这基本上会影响到游戏的everything方方面面,它可能会不利于occlusion。这对lightmapping 光照贴图不利,如果你使用了static lighting静态光照,你就需要更大的光照贴图以便显示细节效果。这对collision calculation碰撞计算不利,因为相比拆分成多个小型模型,碰撞效果的精度会差一些。当然,这对内存也不利,你要加载更大资源,可能会导致卡顿。

        6.3、LOD ,主要用来减少场景和模型的复杂度以及模型的顶点复杂度。但LOD也可用于减少draw call绘制调用,在常用的流程中,某个网格体上往往会有多种材质

 

七、GPU Thread

        要想找出这个阶段中的问题,一个简单的方法就是,关掉各个功能特性,关掉Static mesh静态网格体,关掉Skeletal骨骼网格体,关掉Particles粒子效果。ShowFlag命令对此非常有用,如果你开发的是PC项目,也许你可以把这些操作都绑定上快捷键,然后把它们混合搭配。试着找出可能导致GPU问题的原因。有一个建议给你,如果你把帧缓存区设置为0,就能直截了当的展示可能存在的填充率的问题。

  

        7.1、GPU Profiling,不仅可以在编辑器中运行它,还能在开发版本李运行ProfileGPU会生成一个文件。所有发送给GPU的命令,它的时间戳都会显示在其中,让你能轻易的检查特定帧的每一步渲染过程,它会按照时间顺序排列命令。并且显示相关命令的处理时间,以及那一帧的耗时,也许你就能找到场景中某个特定部分的问题原因。它也可以通过快捷键Ctrl+Shift+,来使用。这很简单,能帮你找出游戏中的后期处理反射或者体积雾是否会导致问题。

        7.2、GPU上常见的问题是过度着色,在屏幕上绘制像素时,对于GPU要绘制的每一个像素,屏幕上只能同事显示一个ploygon多边形中的一部分。目前还没有从中间切分像素的技术,可能永远都不会这么做。但无论你的模型有多精细,如果它离玩家离摄像机很远的话,它就只占屏幕的一小部分,但你仍然需要处理所有的vertices顶点,从而绘制出少数的像素。或者说,一堆你最终无法看到的细节,所以解决Overshading过度着色的通用方式就是使用LOD。

        7.3、Quad Overdraw四边形过度绘制对于美术师来说,解决过渡着色的一大方法就是在检查创作内容时,使用所谓的“Quad Overdraw”四边形过度绘制模式,这个模式还能在很多其他平台上运行。它基本会显示所有可以用LOD简化的区域,以及需要用LOD大量优化的区域,它是一个渐变的形式从蓝到白,越接近白色情况就越糟糕。

        7.4、Shader Complexity 着色器复杂度,也很好用。它能将你在屏幕上绘制的每个像素的着色器的复杂度以视觉化形式呈现出来,它还能视觉化呈现潜在的过度绘制问题。过度绘制不仅有可能在你处理屏幕上众多顶点时发生,也有可能在你使用很多alpha通道时,在你需要处理alpha通道的各个图层时发生。引擎并不知道哪个在哪个的下面,所以引擎会处理所有的表面,才能绘制像素的最终色彩。所以着色器复杂度可以用来显示着色器的开销,要尽量避免红色和白色斑块的出现,因为它们会导致性能问题。

解决着色器复杂度问题的技巧,要计算的内容越多,着色器越复杂它的函数也越多,这么做的时候一定要谨慎。

程序化函数,例如noise噪点,procedural noise 程序化噪点可能会开销很大。如果你在开发PC游戏,并且你知道你面向的是高端平台,那这没什么问题。如果你面向移动平台或低端主机,你可能就要改为使用烘焙纹理以达到效果。众所周知,If语句的开销很大。

有一个通用的原则,尽量将复杂运算用vertex based顶点着色器而非pixel base像素着色器实现,这在移动平台上挺重要的,因为移动平台上你用的屏幕更小,所以很难看到所有的着色器效果细节,但这对PC游戏很有用。这取决于它所创建的效果种类,你不用修改模型和着色器的每一个像素,你可以通过顶点来进行所有的插值计算这样可以省去很多算力。

八、Light Complexity光照复杂度

        光照会让游戏的GPU开销大幅增加,“Light Complexity”视图模式非常适合用来发现问题,光照方面的性能问题。最重要的是,你能鉴别游戏中所有已知的静态、动态、和固定光源。颜色越接近大红色,场景的光照就越复杂,这样就便于美工和其他人发现问题。

关于光照复杂度,通用的建议是要尽量减少动态光源的数量,它们是实时渲染的,每帧都是。GPU需要做大量处理和运算,才能得出像素在光照影响下得最终色彩。所以要尽量减少动态光源的数量,如果你真的要用到它,你应该尽量缩小它的范围。这样它只会照亮对你比较重要的区域也就是关卡的某一部分,你还可以减少动态光源所影响的对象数量。你可以让对象和光源使用light channel光照分层功能,阴影投射的开销也很大。所以如果你有动态光源,但又不是真的需要投射阴影,那就关掉它。

        固定光源,尽量避免固定光源的范围发生重叠,最多只能有三个重叠的固定光源,如果你在添加一个,引擎就会显示一个红X标志,它的意思就是,它现在会变成动态光源,它的开销会大很多。我们也可以尽早的剔除动态光源,在场景中调整动态光源的开启或关闭,关闭动态光源它们就不渲染了,它们不会被计入渲染过程。总体上,如果你用的静态光源越多,性能表现就越好。当然,静态光源和动态光源的取舍关系,如果你使用静态光源,就意味着你需要将lightmaps光照贴图写入硬盘,增加内存使用量,所以这是一种取舍和平衡,你需要把握好这种平衡。

总结:“Game”游戏线程优化,主要是C++和蓝图。CPU线程优化,主要是Draw call 绘制调用。GPU线程优化,主要是材质。

资料来源:[虚幻独立开发日2019]UE4里的性能分析和优化(官方汉化)_哔哩哔哩_bilibili

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/17324.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UE4 虚幻引擎 GitSourceControl源码解析

效果功能图 背景与目标 资产的工作量很大,并不是个人在短时间内可以独自完成的,需要大量美术人员长时间的进行团队合作完成的,并且完成一版之后,后续也还有更新维护的需求。所以UE的Editor也提供了对资产版本管理的功能&#xff…

虚幻4与Unity: 哪个游戏引擎是开发者的最爱?

转自: http://www.narkii.com/club/thread-335184-1.html 虚幻4与Unity: 哪个游戏引擎是开发者的最爱? 虚幻4 (UE4) 和Unity是目前市场上最热门的游戏引擎,也各自拥有为数众多的开发者,虽然一些大型的游戏公…

【UE4】虚幻引擎运行流程

前言 当前版本:4.26.2 本文原创 说明:有些名词保持英文可能更容易理解 目录 游戏流程总览 各个平台启动引擎的入口函数 引擎入口函数 GuardedMain() EnginePreInit 引擎预初始化 EngineInit 引擎初始化 EngineLoop 引擎主循环 EngineExit 引擎退…

【虚幻引擎】UE4/UE5插件

一、插件分类 插件分为七大类 Blank:空白插件,可以从头开始自己定义想要的插件风格和内容,用此模板创建的插件不会有注册或者菜单输入。BlueprintLibrary:创建一个含有蓝图函数库的插件,此模板函数都是静态全局函数&…

虚幻引擎5 C++游戏开发教程

虚幻引擎5 C游戏开发教程 与 Epic Games 合作创建。从基础开始学习 C,同时在 Unreal 中制作您的前 5 个视频游戏 课程英文名:Unreal Engine 5 C Developer Learn C & Make Video Games 此视频教程共5.5小时,中英双语字幕,画…

【虚幻引擎】带你了解UE4

行业前景 越来越多的开发者,开发商投入到UE4中,简单来说就是使用UE4的人越来越多,许多独立游戏,大型的游戏,大公司例如“腾讯,网易”都在使用UE4来开发,加上UE4对开发者来说使用完全免费&#…

【虚幻引擎】UE4/UE5 后期处理盒子(PostProcessVolume)

B站教学链接:https://space.bilibili.com/449549424?spm_id_from333.1007.0.0 一、简介 PostProcessVolume(后期处理盒子):UE4非常强大的一个后期处理,可以调节画面的色彩,相机的景深,视频的输…

芒格-“永远不要有受害者心态”

我们应该以什么样的心态去对待我们的生活? 我不是受害者,我是幸存者。(ps :芒格深处利益之中,手握财富,应该见到过很多阴暗的人性。 他 可能也有魔鬼的一面)受害者的感觉:我认为这是一种反其道而行之的人类思考方式&…

巴菲特+查理芒格+投资理论+经典语录+给韭菜的启示

巴菲特查理芒格投资理论经典语录给韭菜的启示 巴菲特: 一个老年人在零售店里发现老婆丢了,恰好遇到一个年轻人也在找自己的另一半,老人问:你妻子长什么样?年轻人答:“她可真是个金发美人啊,身材…

git多账号切换

参考文档: https://blog.csdn.net/lqlqlq007/article/details/80613272 https://blog.csdn.net/qq_36602939/article/details/79794686 1.ssh-keygen -t rsa -C "你的邮箱" 回车,查看rsa目录,先进入该目录,将里面已…

git 用户的切换

需求场景: 某天已入职了 发现电脑上已经存在一个git的账号 这时候你需要登录你的 也就是账号切换 再比如 你的git换号了 养了个小的git号 或是从新建号了 但是电脑还存在老的号怎么办 就是需要账号的切换 目的就是登上我的账号 拉取我的私有仓库 第一步 准备 查看当前的git用配…

Git切换账号

用了新的电脑需要切换git到自己的账户 winR 输入 CMD 后运行以下命令 查看用户名: git config user.name查看用户邮箱: git config user.email修改用户名和邮箱,user.name/email后面千万记得加空格 git config --global user.name "…

拥抱生产力变革!GPT4接入Office,动嘴就能Excel到PPT!

梦晨 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 一觉醒来,工作的方式被彻底改变。 微软把AI神器GPT-4全面接入Office,这下ChatPPT、ChatWord、ChatExcel一家整整齐齐。 CEO纳德拉在发布会上直接放话:今天,进入人机交互的新时代…

零代码编程:用ChatGPT合并多个表格中的内容到一个excel中

电脑有几百个excel表格: 表格里面表头是一样的,但是数据不一样 现在,想把每个表格中的内容合并到一张表中,然后进行数据处理分析,该怎么办呢? 用ChatGPTPython,很快就可以搞定。在ChatGPT中选中…

巴比特 | 元宇宙每日必读:美版权局判定用AI工具生成的图片不受版权保护,官方解释:AI生成具有不可预测性,但并非一刀切...

摘要:据GameLook报道,一名图书作者Kristina Kashtanova此前为其创作的漫画书《Zarya of the Dawn》向美国版权局提起注册,书中使用了部分由Midjourney创作的插图。版权局此前曾接受了这一注册,但在近日却宣布撤销这项授权。该机构…

虚拟邮箱怎么设置方法_商务邮箱一般用什么邮箱正式?VIP邮箱名怎么设置好?...

不管你处在什么身份,邮件都是对外沟通的重要途径之一,虽然你可能很早就接触了电子邮件,用过QQ邮箱、TOM邮箱等,但学生时代用到的真的也不多,很多时候用的也不讲究。不过,你一旦转变角色到职场,邮…

PHPMailer 发送163网易企业邮箱和个人邮箱, 163邮箱可能无法发送gmail邮箱,可使用qq邮箱解决问题

第一步:注册邮箱,获取客户端授权码 (个人邮箱步骤类似) 企业邮箱设置:客户端设置->开启客户端授权密码->生成授权密码->保存授权密码 第二步: 上代码 composer require phpmailer/phpmailer /…

mysql开启邮件服务_邮件服务之实现基于虚拟用户的虚拟域邮件系统

postfixdovecotSASLmysqlapacheextmailextman实现基于虚拟用户的虚拟域邮件系统 声明:省略了前面的基础配置包括安装MYSQL,postfix等,这里用的Apache,MYSQL是rpm的,postfix,courier-authlib是编译安装的&am…

基于虚拟用户的邮件系统配置

基于虚拟用户的邮件系统配置 实验说明: 操作系统:redhat5.8_x64bit 由postfix sasl courier-authlib MySQL(实现了虚拟用户、虚拟域) dovecot Webmail {extmail(extmain)} 组成的虚拟用户。 需要准备以下软件包: postfix-2.9.6.tar.gz co…

效果达OpenAI同规模模型96%,发布即开源!国内团队新发大模型,CEO上阵写代码...

明敏 发自 凹非寺量子位 | 公众号 QbitAI 国内自研大模型迎来新面孔,而且发布即开源! 最新消息,多模态大语言模型TigerBot正式亮相,包含70亿参数和1800亿参数两个版本,均对外开源。 由该模型支持的对话AI同步上线。 写…