Cocos Creator3.8 项目实战(八)2D UI DrawCall优化详解(上)


游戏开发的朋友都知道,在游戏开发过程中,DrawCall 是我们优化性能的一个非常重要的指标,直接影响游戏的整体性能表现,DrawCall数量越多,帧率会降低,能明显感觉到卡顿。


那今天我们就来聊一聊,2D UI DrawCall优化方法。

本文的主要内容: 什么是Draw call ? Draw Call 中造成性能问题的原因是什么?以及在 Cocos Creator 项目中如何减少DrawCall?


一、Draw Call 介绍


1、什么是Draw Call?

通常我们把 CPU提交数据给GPU,向GPU下渲染命令的过程,称为DrawCall,也叫同一批次渲染。一次 Draw call 就代表一次图形绘制命令。


例如:

CPU调用DirectX中的DrawIndexedPrimitive命令,进行渲染的操作。

CPU调用OpenGL中的glDrawElement命令,进行渲染的操作。


2、Draw Call 中造成性能问题的原因?


CPU和GPU能并行工作,有一个命令缓冲区(Command Buffer),命令缓冲区包含了一个命令队列,当CPU需要渲染对象时,它可以向命令缓冲区添加命令,而GPU完成了上次的渲染任务后,可以继续从命令队列里取出一个命令并执行。


从以上流程,可以看出,性能问题的原因有两个方面:

  • CPU 方面

    CPU在每次调用Draw Call 之前, 需要向GPU 发送很多内容,包括数据、状态和命令等。

    在这一阶段, CPU 需要完成很多准备工作,例如检查渲染状态等,一旦CPU 完成了这些工作, GPU 就可以开始本次的渲染。

    如果Draw Call 的数量太多, CPU 就会把大量时间花费在提交Draw Call 上,造成CPU的性能瓶颈。


  • GPU 方面

    由于CPU的频繁调用绘图指令,那么GPU 也会进行频繁的渲染状态切换。渲染状态就包括:纹理状态,Blend 模式,Stencil 状态,Depth Test 状态等等,也会带来GPU的性能消耗。


那么综合以上的原因,一个很显然的优化想法:就是通过批次合并(后面简称合批)来降低 Draw call 的调用次数。


合批的本质:在一帧的渲染过程中,保证连续节点的渲染状态一致,将尽可能多的节点数据合并一次性提交,从而减少绘图指令的调用次数,降低图形 API 调用带来的性能消耗,同时也可以避免 GPU 进行频繁的渲染状态切换。


需要注意

由于我们需要在CPU 的内存中合并Draw Call,而合并的过程也需要消耗时间。

因此,合并技术更加适合于静态的物体,对于静态物体只需要合并一次即可。

当然,也可以对动态物体进行合并,但由于这些物体是不断运动的,每一帧都需要进行合并然后再发送给GPU,这对空间和时间都会造成一定的影响。


二、合批的条件


1、节点的 Layer 相同才能合批,不同的 Layer 之间不能合批

在游戏运行时,Cocos 引擎是按照节点树的渲染方式,即按层级顺序,从上往下由浅到深进行渲染。

理论上每渲染一张图像(文本最终也是图像)都需要一次 DrawCall。


例如:

下图(1),猜一下DrawCall 次数是多少?

在这里插入图片描述


DrawCall 次数结果是: 5

为什么是5呢? 因为4个item 子对象,每一次都是一次drawcall, 再加上本身引擎有一次drawcall 。

在这里插入图片描述


下图(2),调整了一下排列顺序,猜一下DrawCall 次数是多少?

在这里插入图片描述


仅仅调整了一下顺序,将相同Layer的放在一起,drawcall 次数变成了4 。


在这里插入图片描述


因此,根据上面介绍的游戏渲染按顺序可知,合批的条件之一是:节点的 Layer 相同,不同的 Layer 之间不能进行合批。


2、部分组件无法合批,且会打断其他组件合批


需要进行分模块管理节点树布局,以达到更好的合批效果,无法合批的组件:

  • 内置组件 Mask、Graphics 和 UIMeshRenderer 组件由于材质不同和数据组织方式的差异,无法与其他组件合批。
  • TiledMap、Spine 和 DragonBones 这三个中间件组件遵循自己的内部合批机制。

了解了DrawCall的原理和合批的条件后,接下来就是今日的重点,2D UI DrawCall 优化方法有哪些?


三、2D UI DrawCall 优化方法有哪些?


1、Label 组件DrawCall 优化


(1)、 将要使用的文字制作成图片,然后使用自动图集或 TexturePacker 对文字图片合并到图集

比如游戏中常用的 26个英文字母 、 数字 0-9 , 建议美术可以根据不同颜色、不同大小、不同风格分别制作一张文字图片。


(2)、Cache Mode 缓存类型的合理选择

官方 Cache Mode 说明:

类型功能说明
NONE默认值,Label 中的整段文本将生成一张位图。
BITMAP选择后,Label 中的整段文本仍将生成一张位图,但是会尽量参与动态合图。只要满足动态合图的要求,就会和动态合图中的其它 Sprite 或者 Label 合并 Draw Call。由于动态合图会占用更多内存,该模式只能用于文本不常更新的 Label。此模式在节点安排合理的情况下可大幅降低 Draw Call,请酌情选择使用。
CHAR原理类似 BMFont,Label 将以“字”为单位将文本缓存到全局共享的位图中,相同字体样式和字号的每个字符将在全局共享一份缓存。能支持文本的频繁修改,对性能和内存最友好。不过目前该模式还存在如下限制,我们将在后续的版本中进行优化: 1. 该模式只能用于字体样式和字号(通过记录字体的 fontSize、fontFamily、color、outline 为关键信息,以此进行字符的重复使用,其他有使用特殊自定义文本格式的需要注意)固定,并且不会频繁出现巨量未使用过的字符的 Label。这是为了节约缓存,因为全局共享的位图尺寸为 2048 * 2048,只有场景切换时才会清除,一旦位图被占满后新出现的字符将无法渲染。 2. Overflow 不支持 SHRINK。 3. 不能参与动态合图(同样启用 CHAR 模式的多个 Label 在渲染顺序不被打断的情况下仍然能合并 Draw Call) 4. 目前暂不支持 IsBoldIsItalicIsUnderline 属性。

对上表的实践说明:

  • NONE 一个贴图单独创建一个文本贴图,不能重用,单个贴图占用一个drawcall,不参与动态合批。即使两个相同文本的label也不能合批渲染。

    最佳实践:适用于用完即删且可能会频繁更新大批量文本的需求,如: 聊天功能。


  • BITMAP:动态合图只能往图集上加贴图,而不能继续重用上次的,更不会删除已经作废的子贴图,改变一次就多生成一张文字贴图添加到大小为 2048*2048的通用动态图集中。如果频繁使用动态的文字,则会占用大量内存。

    最佳实践:适用内容不会改变的静态文本,如:界面标题


  • CHAR: 每个字符绘制一次,并添加到大小为2048*2048 的字符图集中,场景不切换时,纹理不会重建,因为纹理大小是有限的,
    导致能显示的字符数也有限。

    最佳实践:适用频繁更新且文本字符内容有限的文本如:分数、倒计时


2、Sprite 组件 Drawcall 优化


对于 Sprite 组件,有静态合图和动态合图两种合批方案。


(1)、静态合图

静态合图就是在开发时将一系列碎图整合成一张大图

图集对于 DrawCall 优化来说非常重要,但是并不是说,把所有图片不管三七二十一,全部打成图集就万事大吉了,这里面也有门道,胡乱打图集的话说不定还会变成负优化。


这个门道就是:尽量将处于同一界面(UI)下的相邻且渲染状态相同的碎图,打包成图集,才能达到减少 DrawCall 的目的。


整合成大图有两种方式:

  • 使用手动图集资源

  • 使用自动图集资源


以上两种整合大图的方式,在往期文章 CocosCreator3.8研究笔记(十)CocosCreator 图像资源的理解,有详细介绍,这里就不再细说。


(2)、动态合图

Cocos Creator 提供了 动态合图(Dynamic Atlas)的功能,能在项目运行时动态地将贴图合并到一张大贴图中。

当渲染一张贴图的时候,动态合图系统会自动检测这张贴图是否已经被合并到了图集(图片集合)中,如果没有,并且此贴图又符合动态合图的条件,就会将此贴图合并到图集中。


动态合图是按照 渲染顺序 来选取要将哪些贴图合并到一张大图中的,这样就能确保相邻的 DrawCall 能合并为一个 DrawCall

动态合图遵循上述第二点的合批的条件


启用、禁用动态合图

Cocos Creator 在初始化过程中,会根据不同的平台设置不同的CLEANUP_IMAGE_CACHE参数,当禁用 CLEANUP_IMAGE_CACHE 时,动态合图就会默认开启。


强制开启动态合图

macro.CLEANUP_IMAGE_CACHE = false;
dynamicAtlasManager.enabled = true;

强制禁用动态合图

dynamicAtlasManager.enabled = false;

注意:

(1)、这些代码请写在项目脚本中的最外层

不要写在 onLoad/start 等类函数中,才能确保在项目加载过程中即时生效。

否则如果在部分贴图缓存已经释放的情况下才启用动态图集,可能会导致报错。

(2)、只有纹理开启了 Packable 选项的精灵才能够参与动态合图,该选项默认开启。

在这里插入图片描述


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/154996.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

零售超市商家怎么做微信小程序

随着互联网的发展,越来越多的零售超市商家开始关注如何借助微信小程序引流,以提高销售额和客户满意度。下面将介绍几个策略,帮助零售超市商家借助微信小程序实现引流。 首先,商家需要开发一款适合自己的微信小程序。小程序是一种轻…

pyqt 划线标注工具

效果图: 代码: import osfrom PyQt5.QtWidgets import QWidget, QApplication, QVBoxLayout, QPushButton, QLabel from PyQt5.QtGui import QPainter, QPen, QColor, QImage, QPixmap from PyQt5.QtCore import Qt, QPoint import sys import jsonclass ImageLabel(QLabel)…

centos7下 编译coreboot生成真机可用的bios固件, 并在真机上演示 (上篇)

看了国内的corebot相关文章以及b站的corebot视频, 大不部分都是编译 用于虚拟机(qemu)或者模拟器上运行的 很少有编译corebot项目 出可以再真机上使用的的 bios 本教程应该是全网最详细的了, 真机版的coreboot bios固件, 所以有点长, 希望对你有帮助 #coreboot编译总说明文档…

论文阅读——Large Selective Kernel Network for Remote Sensing Object Detection

目录 基本信息标题目前存在的问题改进网络结构另一个写的好的参考 基本信息 期刊CVPR年份2023论文地址https://arxiv.org/pdf/2303.09030.pdf代码地址https://github.com/zcablii/LSKNet 标题 遥感目标检测的大选择核网络 目前存在的问题 相对较少的工作考虑到强大的先验知…

深度学习基础知识 使用torchsummary、netron、tensorboardX查看模参数结构

深度学习基础知识 使用torchsummary、netron、tensorboardX查看模参数结构 1、直接打印网络参数结构2、采用torchsummary检测、查看模型参数结构3、采用netron检测、查看模型参数结构3、使用tensorboardX 1、直接打印网络参数结构 import torch.nn as nn from torchsummary im…

从裸机启动开始运行一个C++程序(七)

前序文章请看: 从裸机启动开始运行一个C程序(六) 从裸机启动开始运行一个C程序(五) 从裸机启动开始运行一个C程序(四) 从裸机启动开始运行一个C程序(三) 从裸机启动开始运…

Httpd(一)

介绍 httpd是apache超文本传输协议(HTTP)服务器的主程序。被设计为一个独立运行的后台进程,它会建立一个处理请求的子进程或线程的池。 特性 高度模块化:core modules DSO:Dynamic Shared Object 动态加载/卸载 MPM:multi-p…

【工作流引擎】Activiti的使用03

流程定义查询 // 获取部署时的信息ProcessEngine processEngine ProcessEngines.getDefaultProcessEngine();RepositoryService repositoryService processEngine.getRepositoryService();ProcessDefinitionQuery processDefinitionQuery repositoryService.createProcessDe…

人工智能在教育上的应用2-基于大模型的未来数学教育的情况与实际应用

大家好,我是微学AI ,今天给大家介绍一下人工智能在教育上的应用2-基于大模型的未来数学教育的情况与实际应用,随着人工智能(AI)和深度学习技术的发展,大模型已经开始渗透到各个领域,包括数学教育。本文将详细介绍基于大模型在数学…

【ARM AMBA5 CHI 入门 12.1 -- CHI 链路层详细介绍 】

文章目录 CHI 版本介绍1.1 CHI 链路层介绍1.1.1 Flit 切片介绍1.1.2 link layer credit(L-Credit)机制1.1.3 Channel1.1.4 Port1.1. RN Node 接口定义1.1.6 SN Node 接口定义1.2 Channel interface signals1.2.1 Request, REQ, channel1.2.2 Response, RSP, channel1.2.3 Snoop…

MongoDB 笔记

1 insert 、create、save区别 insert: 主键不存在则正常插入;主键已存在,抛出DuplicateKeyException 异常 save: 主键不存在则正常插入;主键已存在则更新 insertMany:批量插入,等同于批量执行 insert create&#x…

PowerShell pnpm : 无法加载文件 C:\Users\lenovo\AppData\Roaming\npm\pnpm.ps1

1、右键点击【开始】,打开Windows PowerShell(管理员) 2、运行命令set-ExecutionPolicy RemoteSigned 3、根据提示,输入A,回车 此时管理员权限已经可以运行pnpm 如果vsCode还报该错误 继续输入 4、右键点击【开始】,打…

【gmail注册教程】手把手教你注册Google邮箱账号

手把手教你注册Google邮箱账号 写在前面: 要注意,注册Google邮箱必须要确保自己能够 科学上网,如果暂时做不到,请先进行相关学习。使用的手机号是大陆(86)的。 在保证自己能够科学上网后,在浏…

基于ChatGPT+词向量/词嵌入实现相似商品推荐系统

最近一个项目有个业务场景是相似商品推荐,给一个商品描述(比如 WIENER A/B 7IN 5/LB FZN ),系统给出商品库中最相似的TOP 5种商品,这种单纯的推荐系统用词向量就可以实现,不过,这个项目特点是商品库巨大,有…

上海亚商投顾:沪指探底回升 华为汽车概念股集体大涨

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 一.市场情绪 三大指数昨日探底回升,早盘一度集体跌超1%,随后震荡回暖,深成指、创业板指…

idea 插件推荐(持续更新)

文章目录 Material Theme UIcodeium(建议有梯子的使用)Key Promoter XCodeGlanceRainbow BracketsMarkdown NavigatorRestfulToolkitString Manipulation Material Theme UI 谁不想拥有一款狂拽炫酷 吊炸天 的编码主题呢,给你推荐Material Theme UI Plugin Material Theme UI是…

地产三维实景vr展示的功能及特点

随着科技的不断发展,VR(虚拟现实)技术也越来越成熟。VR技术的广泛应用,已经逐渐渗透到各个领域,其中引人注目的就是虚拟展馆。虚拟展馆是一种利用VR技术构建的线上展示空间,让观众可以在家中就能参观展览,带来了极大地…

那些年,我们一起发现的Bug

一、背景 在这篇文章中,分享一些自己在工作中或别人发现的一些常见Bug,与大家共同成长~ 二、常见Bug分类 1、前后命名不一致 举个例子 接口入参中的名称是:aslrboot Java代码中使用的名称是:aslrBoot Codis中存储的名称是&…

[硬件基础]-双稳态多谐振荡器配置

双稳态多谐振荡器配置 文章目录 双稳态多谐振荡器配置1、概述2、双稳态多谐振荡器的内部运行原理 在上一篇文章中,我们深入了解了555定时器在单稳态模式下的内部工作原理。 如果您已经理解了上一篇文章,那么本文对您来说将会非常简单。 我们将研究 555 定…

京东数据接口|电商运营中数据分析的重要性

在电商运营中,数据分析是非常重要的一环,它可以帮助电商企业更好地了解市场、了解消费者、了解产品、了解销售渠道等各种信息,从而制定更为科学有效的运营策略,提高销售效益。 数据方面用户可以直接选择使用数据接口来获取&#…