对话芯动科技 | 助力云游戏 4K级服务器显卡的探索与创新

2021年芯动科技推出了基于IMG BXT GPU IP的风华1号显卡。单块风华1号显卡可在台式机和云游戏中实现4K级别的性能,渲染能力达到5 TFLOPS,如果在服务器中同时运行两块显卡,性能还可翻倍。该显卡是为不断扩大的安卓云游戏市场量身定制的,通过云端提供卓越的成本优势与杰出的能效比,以获得完美的移动娱乐体验。

现在,芯动科技团队分享了他们在风华1号显卡上取得的最新成就:在一块显卡上同时支持44个实例,每款游戏的运行速度约为30帧/秒。

这是他们发展历程中的一个重要里程碑,彰显了他们产品的能力,以及数据中心企业探索更新的显卡解决方案对其服务的益处。在下面的访谈中,与芯动科技的SoC首席架构师何颖探讨了他们的愿景、如何取得这些成果以及下一步的发展方向。

1、芯动科技认为云游戏的最新趋势是什么?

游戏内容的多样化和质量的提高。游戏画面、交互方式、声音体验、延迟改进等等,都在不断升级,以满足用户对游戏体验越来越高的要求。

第二个趋势是多终端协同,即无论使用什么设备,都能实现无处不在的游戏体验:智能电视、平板电脑、个人电脑和智能手机都是云游戏的有效选择。

云游戏正在逐步融合其他技术领域,推动技术创新。目前,许多城市已经实现了 5G 覆盖,使游戏玩家能够以更快的速度、更低的延迟串流畅玩更多更精细的内容。令人信服的人工智能生成内容的出现,为游戏开发商提供了差异化游戏的新方法。新推出的元宇宙应用要求同类型的处理与交互基础设施,而这些需求在云端业已得到或者得到证明。

游戏开发商正在探索创建云原生内容的方法,而不仅仅只是向用户从云端提供传统游戏的服务能力,以提高每用户平均营收。这些内容可以利用云计算更强的处理能力,为高分辨率显示器提供更复杂、帧率更高的大型游戏渲染,或在游戏中渗透人工智能生成内容等高级功能,以改变游戏玩法。

 2、数据中心企业在为其服务选择合适的显卡时需要考虑哪些因素?

在挑选显卡时,数据中心运营商会考虑显卡供应商的生态系统及其在特定领域(如云游戏)的接受程度。他们会关注显卡的渲染运算、可实现的准确性、人工智能的训练和推断运算,以及显卡的目标应用和云基础功能。此外,绿色数据中心的趋势也在不断发展,它鼓励以安全、低能耗、环保的方式来满足企业的需求--从而反向通过降低功耗成本以获取更好的成本优势。

3、使用 IP 解决方案是如何帮助你们为客户打造最佳显卡的?

我们决定基于 Imagination 的 GPU IP开发我们的图形卡,以加快产品上市时间,并确保我们采用的基本图形架构是经过验证的领先技术。这一决定使我们的工程团队有时间专注为显卡添加新功能,帮助我们的产品在云游戏市场脱颖而出。

在我们的 GPU 研发过程中,GPU 设计部门和 IP 设计部门紧密合作,为 GPU 产品打造了一套高性能、高可靠性、低功耗和兼容性强的 IP 解决方案。

例如,风华二号采用的 LPDDR IP 不仅兼容 LPDDR4/4x/5/5x,我们还针对 GPU 的数据访问特性,设计并优化了 DDR 的内部请求调度机制。这为 GPU 核提供了更大的内存访问带宽,并降低了处理关键任务的时延。DDR 控制器的内部请求调度机制同样为 GPU  Core更大的内存访问带宽和更低的关键任务时延而提供了专用设计。

由于 CoreActive 拥有适用于不同代工厂不同工艺节点的成熟强鲁棒性的 IP 库,因此我们在设计 GPU 芯片时可以更灵活地选择工艺节点,而不受 IP 选型的限制。

4、您选择在哪些方面集中工程力量来创建适用于安卓云游戏的芯片?

为安卓云游戏调整芯片的重点包括支持虚拟化、支持新版本的 OpenGL® ES 或 Vulkan® API、优化多客户端场景的线性度和可靠性。

在硬件开发方面,我们集中了更多的架构、算法和设计资源,用于研究和实施虚拟化和 API 升级所需的硬件修改。其次,我们加大了对软件驱动程序开发部门的资源投入,为更高版本的安卓系统创建驱动程序,并优化其稳定性和性能。最后,我们将部分测试工作集中在新功能上,以确保在主流游戏场景中的可靠性和性能,从而保证硬件能够与安卓设备进行良好的通信和运行。

5、在扩大风华1号可容纳的游戏玩家数量方面有哪些挑战?你们是如何克服的?

对于我们的商业客户来说,扩大显卡可容纳的游戏玩家数量是一个重要目标,但也存在一些困难。主要挑战之一是软件调度的线性。随着客户数量的增加,发送到 GPU 的请求数量以及随之而来的数据也会呈指数级增长。我们的驱动程序工程师在优化数据处理调度方面投入了大量精力:最大限度地利用片上数据处理引擎,同时优化图形控制器的数据吞吐效量,缩小任务调度中的间隙和浪费,这也减少了系统 CPU 负载和等待时间。

客户端数据的隔离和保护是另一个需要解决的问题。为了保证多个客户端的数据互不干扰,我们设计了一种高效/灵活配置的内存映射机制来管理不同客户端的内存空间,从而在不降低访问效率的前提下实现客户端数据的物理隔离。我们的解决方案是 Imagination HyperLane 虚拟化技术的演进,它为每个核创建了多达八个独立的控制通道,每个通道都在内存中安全隔离,并采用灵活的性能管理技术。

6、IMG BXT 的哪些功能为风华1号带来了最大价值?

Imagination基于分块的延迟渲染架构以及硬件虚拟化技术为风华系列GPU带来了显著的能效优势,使我们能够在相同功耗水平下比竞争对手拥有更多方式支持云游戏。

风华1号和风华2号只是开端,产品推出后效果非常好。我们下一步将继续开发两条产品线:一条面向低功耗市场,一条面向服务器市场。

在低功耗市场,除了继续提升性能外,我们还将积极探索不同行业的应用场景,推出更加注重节能、低成本、高性价比的产品。

在服务器市场,我们将继续推出技术更先进、性能更强大的产品。例如,我们将采用Chiplet (芯粒)技术,突破工艺瓶颈的限制,更好地提高性能。

 7、客户和市场对 "风华 1号 "的反响如何?

风华1号一经推出,就迅速获得了市场的好评。经过测试和评估,我们的客户发现,在典型的云游戏场景中,与竞争对手的解决方案相比,"风华1号 "在能效比、单卡支持客户数量和性价比方面都具有突出优势。

8、芯动创新的下一步计划是什么?

风华1号和风华2号只是开端,产品推出后效果非常好。我们下一步将继续开发两条产品线:一条面向低功耗市场,一条面向服务器市场。

在低功耗市场,除了继续提升性能外,我们还将积极探索不同行业的应用场景,推出更加注重节能、低成本、高性价比的产品。

在服务器市场,我们将继续推出技术更先进、性能更强大的产品。例如,我们将采用Chiplet (芯粒)技术,突破工艺瓶颈的限制,更好地提高性能。

END

欢迎加入Imagination GPU与人工智能交流2群

f7b990cd5e985aa164493c5b4c6edd48.jpeg

入群请加小编微信:eetrend89

(添加请备注公司名和职称)

推荐阅读

对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数

在线课程 | Imagination中国区技术总监全面解读IMG DXD GPU

e5411286793f911aa78e866c38a20912.png


Imagination Technologies 是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/198986.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

趣学python编程 (四、数据结构和算法介绍)

数据结构和算法在编程中非常重要。数据结构是组织和存储数据的方式,而算法是解决问题的方法和步骤。你要挑战的蓝桥杯,实际也是在设计算法解决问题。其实各种编程语言都只是工具,而程序的核心数据结构算法。犹如练武,数据结构和算…

Qt HTTP 摘要认证(海康球机摄像机ISAPI开发)

接到一个需求是开发下海康的球机,控制云台,给到我的是一个开发手册,当然了是海康的私有协议 ISAPI开发手册https://download.csdn.net/download/qq_37059136/88547425关于开发这块读文档就可以理解了,海康使用的是摘要认证,当然了海康已经给出使用范例 通过libcurl就可以直接连…

SQL单表复杂查询where、group by、order by、limit

1.1SQL查询代码如下&#xff1a; select job as 工作类别,count(job) as 人数 from tb_emp where entrydate <2015-01-01 group by job having count(job) > 2 order by count(job) limit 1,1where entrydate <‘2015-01-01’ 表示查询日期小于2015-01-01的记录…

【Flink 问题集】The generic type parameters of ‘Collector‘ are missing

错误展示&#xff1a; Exception in thread "main" org.apache.flink.api.common.functions.InvalidTypesException: The return type of function main(CollectionDemo.java:33) could not be determined automatically, due to type erasure. You can give type in…

第二证券:今日投资前瞻:小米汽车引关注 全球风光有望持续高速发展

昨日&#xff0c;两市股指盘中轰动上扬&#xff0c;深成指、创业板指一度涨超1%。到收盘&#xff0c;沪指涨0.55%报3072.83点&#xff0c;深成指涨0.72%报10077.96点&#xff0c;创业板指涨0.53%报2015.36点&#xff0c;北证50指数涨2.64%&#xff1b;两市算计成交9900亿元&…

快速排序知识总结

快速排序思维导图&#xff1a; 快速排序算法模版&#xff1a; #include <iostream>using namespace std;const int N 1e5 10;int n; int q[N];void quick_sort(int q[], int l, int r) {if (l > r) return;int x q[(l r) / 2], i l - 1, j r 1;while (i < …

2023下半年软件设计师考试知识点大全思维导图

软件设计师考试知识点大全思维导图 2023年下半年第一次机考 复习资料 以上是我在学习过程中根据自己的知识结构的特点及刷到的考题 做的导图&#xff0c;有需要的可以留言发原版的 mmap格式文件 方便自己拓展. 软考资料 这是网上找的资料 汇总免费放在这里 吧![ 链接&#x…

数据结构【DS】图的应用

图的连通性问题 最少边数 最多边数 无向图非连通 &#x1d48e;&#x1d7ce; &#x1d48e;&#x1d48f;−&#x1d7d0;∗(&#x1d48f;−&#x1d7cf;)/&#x1d7d0; 无向图连通 &#x1d48e;&#x1d48f;−&#x1d7cf; &#x1d48e;&#x1d48f;∗(&#…

springboot使用MongoTemplate根据正则表达式查询日期数据

一、日期正则表达式测试 匹配HH:mm:ss正则表达式写法有很多列举两个 .(点)代表任意匹配 ^必须以xxx开头, 如^[a-z],必须以a-z的字母开头 : 精确匹配,必须是: ([0-1]?[0-9]|2[0-3]).([0-5][0-9]).([0-5][0-9]) ^([0-1]?[0-9]|2[0-3]).([0-5][0-9]).([0-5][0-9])$ ([0-1]?…

小程序游戏、App游戏与H5游戏:三种不同的游戏开发与体验方式

在当今数字化的时代&#xff0c;游戏开发者面临着多种选择&#xff0c;以满足不同用户群体的需求。小程序游戏、App游戏和H5游戏是三种流行的游戏开发和发布方式&#xff0c;它们各自具有独特的特点和适用场景。 小程序游戏&#xff1a;轻巧便捷的社交体验 小程序游戏是近年来…

从硬件到软件:揭秘磁盘结构和文件系统组织

&#x1f4df;作者主页&#xff1a;慢热的陕西人 &#x1f334;专栏链接&#xff1a;Linux &#x1f4e3;欢迎各位大佬&#x1f44d;点赞&#x1f525;关注&#x1f693;收藏&#xff0c;&#x1f349;留言 本博客主要内容讲解了从磁盘的硬件结构&#xff0c;再到操作系统内部是…

C语言之深入指针及qsort函数(五)(详解介绍)

C语言之深入指针 在这篇博客看不懂的可以看看这篇C语言之深入指针&#xff08;四&#xff09;在上篇博客中介绍了&#xff1a; 函数指针变量函数指针数组简易计算器的实现\ 文章目录 C语言之深入指针1 回调函数2 qsort函数的使用2.1 使用冒泡排序排序整型数组2.2 使用qsort函数…

使用Sqoop命令从Oracle同步数据到Hive,修复数据乱码 %0A的问题

一、创建一张Hive测试表 create table test_oracle_hive(id_code string,phone_code string,status string,create_time string ) partitioned by(partition_date string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ,; 创建分区字段partition_date&#xff0c…

mysqlbinlog使用记录

首先要确认mysql启用了binlog功能。一般默认启用。 mysql> select log_bin; ----------- | log_bin | ----------- | 1 | ----------- 然后确认binlog目录 mysql> select log_bin_basename; ---------------------------- | log_bin_basename | -----…

xlua源码分析(三)C#访问lua的映射

xlua源码分析&#xff08;三&#xff09;C#访问lua的映射 上一节我们主要分析了lua call C#的无wrap实现。同时我们在第一节里提到过&#xff0c;C#使用LuaTable类持有lua层的table&#xff0c;以及使用Action委托持有lua层的function。而在xlua的官方文档中&#xff0c;推荐使…

<b><strong>,<i><em>标签的区别

1. b标签和strong标签 b标签&#xff1a;仅仅是UI层面的加粗样式&#xff0c;并不具备HTML语义 strong标签&#xff1a;不仅是在UI层面的加粗样式&#xff0c;具备HTML语义&#xff0c;表示强调 2. i标签和em标签 i 标签&#xff1a;仅仅是UI层面的斜体样式&#xff0c;并不…

Django学习日志08

如何开启事务 事务的目的&#xff1a;为了保证多个SQL语句执行成功&#xff0c;执行失败&#xff0c;前后保持一致&#xff0c;保证数据安全 ACID属性&#xff1a; A&#xff1a;原子性&#xff08;Atomicity&#xff09;&#xff1a;指事务是原子的&#xff0c;对事务中的操…

系统设计之通讯协议

一、通讯协议 架构风格定义了应用程序编程接口 (API) 的不同组件如何相互交互。因此&#xff0c;它们通过提供设计和构建 API 的标准方法来确保效率、可靠性以及与其他系统集成的便捷性。以下是最常用的样式&#xff1a; 1. SOAP 成熟、全面、基于XML 最适合于企业应用 可扩展…

STM32获取最大堆栈空间

参考 stackflow相关讨论 原理 通过参考链接&#xff0c;可知探测Stack的最大深度是先在stack中填充不常用的特定值&#xff0c;然后实时检测这些值哪些发生了变化&#xff0c;变化的表示使用到了这个空间&#xff0c;如果程序完全遍历后&#xff0c;有些值还是没变&#xff…

网络运维与网络安全 学习笔记2023.11.19

网络运维与网络安全 学习笔记 第二十天 今日目标 STP工作原理、STP高级配置、MSTP工作原理 MSTP配置案例、MSTP负载均衡 STP工作原理 单点故障 PC之间的互通链路仅仅存在1个 任何一个设备或链路出现问题&#xff0c;PC之间都会无法通信 解决方案 增加冗余/备份设备 增加冗…