AI技术颠覆游戏开发:谷歌DeepMind GameNGen实时生成《DOOM》探秘

引言

近年来,生成式人工智能(AIGC)在图像和视频生成领域取得了巨大突破。然而,谁能想到,这项技术正逐渐渗透进游戏开发领域,且潜力巨大。2023年8月29日,谷歌DeepMind发布了名为《扩散模型是实时游戏引擎》(Diffusion Models Are Real-Time Game Engines)的论文,提出了全新的AI游戏生成引擎GameNGen。令人惊讶的是,GameNGen无需传统的游戏引擎与预设代码逻辑,仅依赖神经网络和提示词,即可实时生成复杂的游戏内容。在此研究中,GameNGen成功复现了经典游戏《DOOM》,并在单个TPU上实现了每秒20帧的实时渲染。此举有望彻底颠覆传统游戏开发流程。

本文将详细剖析GameNGen的技术原理、创新点及其对游戏行业的潜在影响。

GameNGen的工作原理

游戏开发的传统逻辑

传统的电子游戏开发流程,通常涉及复杂的预设逻辑,遵循用户输入、更新游戏状态、渲染画面的固定循环。无论是经典的贪吃蛇还是复杂的3D游戏,都依赖开发者预设的代码逻辑来控制游戏的运行。因此,游戏引擎通常通过固定的编程规则来响应用户输入并更新游戏画面。

然而,DeepMind提出了一种革命性的想法——通过生成式AI模型完全抛弃这些预设逻辑,依赖AI实时生成游戏的内容与状态更新。这种创新不仅有望降低游戏开发的技术门槛,还可以大幅减少开发成本和时间。

扩散模型与GameNGen架构

GameNGen的核心技术基于扩散模型(Diffusion Models),这是一种生成式模型,最早被应用于图像和视频生成任务,如Stable Diffusion和DALL-E等。GameNGen则对这一技术进行了改进,使其可以高效生成游戏场景和逻辑。

数据集与训练

为了训练一个能够高效玩游戏的AI,研究人员首先构建了一个900M帧的数据集。这些数据包括游戏角色的动作、玩家视角等关键信息。通过深度强化学习方法(如PPO训练),并结合卷积神经网络(CNN)提取特征,研究团队成功地训练了一个可以理解游戏逻辑的AI agent。

模型架构改进

GameNGen的模型基础是Stable Diffusion 1.4,原本是一个生成文本到图像的扩散模型。在此基础上,研究团队做了几项关键的改动:

  1. 动作数据嵌入:将游戏中的动作序列作为token嵌入到模型中,使得模型能够理解游戏角色的动作。
  2. 交叉注意力机制改进:通过将编码后的动作序列替换原有的文本输入,模型得以从玩家的输入和先前的帧信息中生成下一帧画面。
  3. 去噪采样优化:GameNGen使用了名为“速度参数化”的新技术来最小化扩散损失,并通过在上下文帧中添加高斯噪声,优化了模型的帧生成质量。

高效实时渲染

与传统生成模型不同的是,GameNGen仅需要4次DDIM去噪步骤即可生成高质量的游戏帧,而非通常需要的20次采样。这极大提升了游戏的生成效率,使其能够稳定在每秒20帧的速度下运行。

实际效果与局限性

复现《DOOM》:AI与人类难辨的游戏体验

GameNGen首次被应用于复现经典射击游戏《DOOM》,该游戏以其复杂的3D场景和快节奏的战斗著称。实验表明,GameNGen在生成《DOOM》游戏画面的质量上几乎与原版游戏无异。研究人员甚至组织了多名评估者进行盲测,让他们判断哪一个画面来自真实游戏,哪一个来自AI生成的GameNGen。结果显示,约60%的情况下,评估者无法分辨AI生成的游戏与真实游戏之间的差异。这种几乎以假乱真的效果,证明了GameNGen在生成游戏画面和模拟复杂游戏逻辑上的能力。

当前存在的挑战

尽管GameNGen展示了极大的潜力,但其仍存在明显的局限性:

  1. 通用性不足:目前,GameNGen仅在《DOOM》这款特定游戏上表现出色。模型需要针对特定游戏进行大量训练,尚未实现对多种游戏的普适性支持。
  2. 帧率限制:虽然GameNGen已经实现了每秒20帧的速度,但这远未达到现代游戏普遍要求的60帧甚至更高帧率。这意味着当前的技术水平尚不足以支持实时生成复杂的现代游戏。
  3. 无法创造新内容:虽然GameNGen能够高效生成现有场景,但其并不能创造新的场景或游戏机制,限制了其在创新型游戏开发中的应用。

GameNGen对游戏开发的影响

开发成本与时间大幅降低

通过AI生成游戏内容,开发者可以节省大量编写逻辑和设计关卡的时间。未来的游戏开发可能只需要给出一个提示词,AI就能够生成完整的游戏场景和交互逻辑。这不仅简化了开发流程,也大大降低了开发成本。

游戏行业的颠覆与机遇

AI生成游戏的出现,预示着未来游戏行业的潜在变革。正如米哈游前董事长蔡浩宇所言,未来的游戏开发者可能只有两类:极少数顶尖天才和大量纯粹的爱好者。通过AI,人人都可能成为游戏开发者,甚至无需任何编程知识。这对传统的游戏开发公司和开发者将带来巨大冲击。

未来展望

虽然GameNGen目前仍处于早期阶段,面临诸多挑战,但其展示出的颠覆性潜力不容忽视。随着AI技术的不断进步,游戏开发的门槛将继续降低,开发者可以将更多精力放在游戏创意与创新上,而不再局限于技术实现。

正如英伟达CEO黄仁勋所预言的那样,未来5至8年内,AI生成的每个像素都可能达到实时渲染水平。届时,游戏开发将进入全新时代,每个人都有可能通过AI工具创造属于自己的虚拟世界。

结论

GameNGen作为世界上首个由神经网络驱动的实时游戏引擎,展示了AI技术在游戏开发中的巨大潜力。虽然它目前仍面临通用性和性能上的挑战,但这一技术有望在未来几年内彻底改变游戏开发流程,为游戏行业带来全新的可能性。

随着AI技术的快速发展,游戏开发者将不再局限于编写复杂的逻辑与代码,而是可以通过简单的提示词让AI生成出完整的游戏世界。GameNGen

的出现,预示着我们正在逐步走向一个完全由人工智能主导的游戏开发时代。这不仅为开发者提供了强大的工具,也为玩家们带来了更多创意和定制化的游戏体验。今后的游戏开发将会越来越智能化,游戏行业也将面临更多的创新机遇与挑战。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/417340.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

打造安心宠物乐园:EasyCVR平台赋能猫咖/宠物店的智能视频监控解决方案

随着宠物经济的蓬勃发展,宠物店与猫咖等场所对顾客体验、宠物安全及健康管理的需求日益提升。然而,如何确保这些场所的安全与秩序,同时提升顾客体验,成为了经营者们关注的焦点。引入高效、智能的视频监控方案,不仅能够…

浏览器百科:网页存储篇-如何在Chrome打开localStorage窗格(五)

1.引言 在前面的章节中,我们详细介绍了 localStorage 的基本概念、特性及其常用方法,帮助开发者在网页应用中实现数据的持久化存储。为了更好地管理和调试这些存储的数据,了解如何打开和使用浏览器的 localStorage 窗格是非常重要的。本篇文…

【大模型实战篇】大模型显存资源计算以及GPU如何选择

1. 背景介绍 针对我们今天要讨论的话题,从第一性原则出发,要回答的第一个问题就是,为什么要计算大模型占用的显存资源?一句话概括:显存太小,模型无法运行;显存太大,浪费金钱。所以…

深度学习⑧Meta-Learning Introduction

Motivation 人类学习: 当我们学习新任务时,通常会应用从相关任务中学到的知识。我们通常可以从少量示例中学习,并能够快速适应新任务。我们可以随时刷新或更新自己的知识。 机器学习: 学习仅从少量示例中获得知识(少样…

8. GIS数据分析师岗位职责、技术要求和常见面试题

本系列文章目录: 1. GIS开发工程师岗位职责、技术要求和常见面试题 2. GIS数据工程师岗位职责、技术要求和常见面试题 3. GIS后端工程师岗位职责、技术要求和常见面试题 4. GIS前端工程师岗位职责、技术要求和常见面试题 5. GIS工程师岗位职责、技术要求和常见面试…

软件测试学习笔记丨Pytest+Allure测试计算器

本文转自测试人社区,原文链接:https://ceshiren.com/t/topic/31954 项目要求 3.1 项目简介 计算器是近代人发明的可以进行数字运算的机器。 计算器通过对加法、减法、乘法、除法等功能的运算,将正确的结果展示在屏幕上。 可帮助人们更方便的…

【GD32】---- 使用GD32调试串口并实现printf打印输出

1 复制工程模板 直接复制工程模板里的系统文件和固件库文件到新的工程文件01_USART_Printf 2 新建keil工程 参考上一篇博文:【GD32】---- 移植工程模板及点灯测试 3 编写代码 3.1 创建USART文件 创建一个USART.c文件,放于05_UserDriver文件夹中 …

Rust 赋能前端:PDF 分页/关键词标注/转图片/抽取文本/抽取图片/翻转...

❝ 我从不幻想成功。我只会为了成功努力实践 大家好,我是柒八九。一个专注于前端开发技术/Rust及AI应用知识分享的Coder ❝ 此篇文章所涉及到的技术有 WebAssembly Mupdf Pdf操作( 分页展示/文本抽离/文本标注/获取超链接/Pdf转图片/翻转/截取) 因为,行文…

新型PyPI攻击技术可能导致超2.2万软件包被劫持

一种针对 Python 软件包索引(PyPI)注册表的新型供应链攻击技术已在野外被利用,并且目前正试图渗透到下游组织中。 软件供应链安全公司 JFrog 将其代号定为Revival Hijack,并称这种攻击方法可用于劫持 2.2万个现有 PyPI 软件包&am…

6、LVGL控件-线条、图片、按钮矩阵

本篇文章目录导航 ♠♠ LVGL控件-线条、图片、按钮矩阵 ♣♣♣♣ 一、LVGL 线条部件 ♦♦♦♦♦♦♦♦ 1.1 线条部件组成部分 ♦♦♦♦♦♦♦♦ 1.2 线条部件基本API ♦♦♦♦♦♦♦♦ 1.3 实验小演示 ♣♣♣♣ 二、LVGL 图片部件 ♦♦♦♦♦♦♦♦ 2.1 图片部件组成部分 ♦♦…

前端框架有哪些?

前言 用户体验是每个开发网站的企业中的重中之重。无论后台有多方面的操作和功能,用户的视图和体验都必须是无缝的最友好的。这需要使用前端框架来简化交互式、以用户为中心的网站的开发。 前端框架是一种用于简化Web开发的工具,它提供了一套预定义的代…

基于蜣螂优化最小二乘支持向量机的数据分类预测Matlab程序DBO-LSSVM 多特征输入多类别输出 含基础程序

基于蜣螂优化最小二乘支持向量机的数据分类预测Matlab程序DBO-LSSVM 多特征输入多类别输出 含基础程序 文章目录 一、基本原理DBO(Dung Beetle Optimization)算法原理LSSVM(Least Squares Support Vector Machine)模型原理DBO-LSS…

C语言 | Leetcode C语言题解之第388题文件的最长绝对路径

题目: 题解: #define MAX(a, b) ((a) > (b) ? (a) : (b))int lengthLongestPath(char * input){int n strlen(input);int pos 0;int ans 0;int * level (int *)malloc(sizeof(int) * (n 1));memset(level, 0, sizeof(int) * (n 1));while (po…

iOS——Block与内存管理

需要内存管理的情况 1、对象类型的auto变量。 2、引用了 __block 修饰符的变量。 三种block类型 全局类型 (NSGlobalBlock) 如果一个block里面没有访问普通局部变量(也就是说block里面没有访问任何外部变量或者访问的是静态局部变量或者访问的是全局…

SpringBoot+Vue实现大文件上传(断点续传-后端控制(一))

SpringBootVue实现大文件上传(断点续传) 1 环境 SpringBoot 3.2.1,Vue 2,ElementUI,spark-md5 2 问题 在前一篇文章,我们写了通过在前端控制的断点续传,但是有两个问题,第一个问题&…

AUTOSAR Adaptive与智能汽车E/E架构发展趋势

AUTOSAR Adaptive是一个面向现代汽车应用需求的标准,特别适用于那些需要高计算能力和灵活性的应用。以下是AUTOSAR Adaptive的典型特性: 高计算能力:AUTOSAR Adaptive支持使用MPU(微处理器),这些处理器的性…

嵌入式开发学习路线(25届校招学习) 嵌入式学习路线七年规划:从大一小白到校招大佬 (学习路线汇总)

嵌入式开发学习路线(25届校招可以参考) 嵌入式系统作为当前最热门且最有发展前途的IT应用领域之一,吸引了大量有志于从事该行业的学习者。为了系统地掌握嵌入式开发技能,以下是一条详细的学习路线,旨在帮助初学者逐步…

CodeSys中动态切换3D模型

文章目录 需求研究结果 需求 在前面的【CodeSys开发3d机械臂显示控件】中,我们已经实现了一个可以显示3d模型的控件。但是这个控件是和使用的3d模型绑定死的,在安装这个控件时就已经将模型文件于控件一起安装到codesys中。 假如我想在不同的工程中&…

智能家居系统(基于STM32F103C8T6标准库+FreeRTOS+Qt串口开发实现)

视频演示:基于STM32F103C8T6标准库FreeRTOSQt串口开发实现的智能家居项目_哔哩哔哩_bilibili 基于STM32F103C8T6标准库FreeRTOSQt串口开发实现的智能家居项目: https://pan.baidu.com/s/1f41gAfOOnlcQoKoMx3o84A?pwd6j2g 提取码: 6j2g 注:本项目为学习完…

Meta关闭Spark AR平台:未来规划与影响分析

Meta宣布将关闭其移动AR创作平台Spark AR,这一消息在业界引起了广泛关注。尽管Snap和TikTok在AR滤镜领域取得了巨大成功,但Meta却选择了另一条发展道路。本文将探讨这一决策背后的可能原因及其对未来的影响。 关闭Spark AR平台的背后 硬件为主&#xff…