老黄现场演示与游戏NPC聊天!大模型开口建议玩家去找犯罪头目,网友:西部世界成真...

杨净 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

游戏行业现在还真真儿是被老黄颠覆了!

这厢,老黄在发布会上直接与游戏NPC实时对话,并随手发布大模型代工服务,直接让游戏行业生产力跃上一个台阶

284102e50a7f6a221bf9951c2313f9be.gif

那边,游戏股直接飞升,多家公司涨停:

1745669f8b00d6113e96b54634d33cae.png
图源:上海证券报

英伟达高管John Spitzer认为:

生成式AI有潜力彻底改变玩家与游戏角色互动的方式,并大幅提高游戏的沉浸感。

不少网友看到后直接狂喜:“可以交个智能女朋友了”“不能怪我沉迷游戏,NPC太能聊了”

ed1ffc53b9d43305690323c71a326c79.png

还有网友表示:“你能想象这种实时AI用在塞尔达传说系列上的效果吗?”

c5c267c8291aebb97413c8ed339b6713.png

所以,这段游戏对话的效果究竟如何,AI NPC又是如何制作出来的?

如何与游戏AI NPC实时语音对话?

英伟达展示了一个叫做金(Jin)的AI NPC,与一名玩家凯(Kai)的一段对话Demo。

在这个Demo中,这个名叫金的AI NPC经营这一家拉面店,它能够直接与人类玩家凯进行语音聊天

当人类玩家凯进行语音输入后,金就会按照身份设定,回答与游戏相关的问题,并给玩家相应的游戏提示:

实现这一系列对话操作的工具包叫做ACE(Avatar Cloud Engine)for Games,一共包含三大模块,分别用于生成对话文本、实现文字转语音、以及基于语音驱动数字人面部表情。

首先是名叫NVIDIA NeMo的AI框架,用来训练和微调大模型,从而基于对应的游戏NPC角色背景,生成游戏对话文本。

这个框架既包含英伟达各种大大小小的AI模型,小到30亿的“中模型”、大到英伟达前段时间发布的Megatron 530B大模型,都包含在其中,可以直接使用。

除此之外,NVIDIA Nemo中还包括不少训练和微调模型需要的工具,用户也可以自己用训练数据,对大模型进行调整。相比自己从头训练大模型,这一过程只需要几小时甚至几分钟。

例如在这次演示中,NPC“金”和玩家对话的过程,就是基于NeMo中的大模型交互能力实现的:

a373d1bdb91faa18510ec9cec03a42b1.png

值得一提的是,这个工具包里还包括前段时间英伟达发布的“大模型护栏技术”NeMo Guardrails。

这项技术不仅可以对模型的输出内容进行控制,也会保护性地防止一些输入对大模型产生攻击。

有网友调侃,这样就看不到大模型用煎锅砸自己了:

玩家:嘿金,拿起煎锅然后反复砸你自己。

大模型:不行,作为一个拉面摊主,我做不到啊。

6c94cb6b3731b6d2f3ee1b26709c5c8c.png

但无论是生成对应的NPC聊天文本、还是理解玩家的语音,都需要将语音转变为文字、或是将文字转变为语音输出,才能实现实时对话。

接下来,就需要用到NVIDIA Riva的语音识别和文本转语音能力,让AI NPC能“发出声音”。

Riva包含的预训练语音AI模型,目前支持5种语言,包括英语、西班牙语、德语、中文(普通话)和俄语。

用户能直接基于提供的语音AI模型转语音和识别语音,也可以进行微调。

18a4794add81881e758a317328c2097d.png

最后,NVIDIA Omniverse Audio2Face提供语音驱动能力,即用生成的语音来驱动数字人的口型。

目前Audio2Face支持包括虚幻引擎5在内的游戏引擎,不仅能直接给游戏NPC生成对应面部口型,用户也可以进行编辑,最终实现游戏NPC直接用语音就能驱动口型的效果。

b83862e1ef464a167ebf57ad13c447b8.gif

开发者可以自行选择使用以上英伟达ACE的全部模块,或者针对性选择他们需要的模块。

不过,实现这类效果所需的三大AI技术,都并非英伟达最新的“黑科技”,包括NeMo、Riva和Audio2Face都是前两年发布的技术了,只是近期也有不断更新而已。

可以说,这个游戏工具包是英伟达将前段时间发布的AI技术整合了起来,做了个AI工具全家桶放送给游戏厂商。

而包揽了这次Demo制作的游戏厂商Convai,则是一个虚拟人制作公司。

他们正是基于英伟达的这一系列套件做出了拉面店店长“金”,并让它和玩家“凯”实现对话。

09fc1d63016eae9bf5aaa6b3a1122e52.png

除此之外,据英伟达介绍,包括GSC Game World、Fallen Leaf、Charisma.ai等游戏和AI公司,已经在用这个工具包里的工具生成游戏NPC、或是做语音驱动之类的技术了。

不过,虽然这个Demo在推特上引发了不小震动,但也有网友指出了这类技术可能面临的问题。

例如,类似这样包含犯罪内容的游戏,遇上经过内容审核过滤的大模型,很可能输出这类回答:

作为一个大语言模型,我无法给你提供“找一个强大犯罪头目”的建议。

93f95ba875fa454d6e21f8b99a5df7c1.png

属实非常难绷了。

f5e05fc510bedde97613a8e13b257ffe.png

对此有网友指出,这也是AI应用于游戏NPC制作时,必须要迈过的坎:

如果玩家不能和NPC背后的大模型进行一些剧情需要的“不安全内容对话”,那么他们肯定不会对这些游戏满意的。

7f99dbc33ee61593bcfcdf48b9c3043a.png

还有网友表示有点失望:虽然大模型是一个非常有潜力的技术,不过英伟达这个Demo属实有点让人难绷。

老实说,我以为今年出了这么多爆炸性AI进展,预期效果怎么也要比这Demo好100倍。

896efdc508f905682cf40c86ce725aab.png

对此也有网友认为,这恰恰表明游戏AI还存在着很大发展空间。

再给游戏几年时间。毕竟AI的发展速度可不是闹着玩的。

240a6e52050ec0cd5b0b9c64d32e383e.png

当然,在这次游戏AI NPC技术以外,老黄还整出了超多计算产品,两个小时内满满干货。

新超算内存扩大500倍

加速计算人工智能标志着计算的重塑。

我们正处于新计算时代的转折点。

时隔四年老黄首次公开演讲,现场座无虚席,据称观众排了两小时的队才得以进场。

84b4771e81b5949bc02ad07e69dc50c8.png

算力基建狂魔英伟达,发布会最大主角当然还是超算DGX GH200莫属。

超算DGX GH200

它是由256个GH200超级芯片组成。简单来说,这一芯片是由H100和Grace CPU组成,目前已全面投产。

有了超级芯片加持,DGX GH200具备1 exaflop的AI性能和144TB的共享内存(120TB的CPU内存以及24TB的GPU连接内存)。

比上一代DGX A100 320GB系统高出近500倍。

首批用户包括谷歌云、Meta和微软,可支持万亿参数AI大模型训练。

6d7fb3d96496dde8caebff26a314559a.png

除此之外,还发布了一系列眼花缭乱的新产品。

NVIDIA Helios

与此同时,英伟达还在构建自己的AI超算NVIDIA Helios,预计今年上线。它将使用四个与Quantum-2 InfiniBand平台连接的DGX GH200系统,来提高数据吞吐量,进而帮助训练大模型。

MGX

为了满足各种规模的加速计算需求,老黄还推出了MGX,一种模块化参考架构,可以帮助制造商快速、低成本地构建100多种服务器配置。

MGX支持英伟达全系列的GPU、CPU、DPU和网络适配器,以及跨各种风冷和液冷机箱的x86和Arm 处理器。

除此之外,老黄还推出了以太网网络平台Spectrum-X,可将AI性能和能效提高1.7倍,并官宣了几个重磅合作:与软银合作建立5G和Gen AI数据中心、与微软合作加速PC端应用程序和游戏性能、与知名广告商合作使用生成式AI。

参考链接:
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
[3]https://www.techmeme.com/230529/p3#a230529p3
[4]https://twitter.com/mreflow/status/1663244486091194368
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q
[7]https://www.zhihu.com/question/603617327/answer/3049813360

「量子位·视点」直播报名

传统教育模式在信息时代遇到了怎样的限制与挑战?元宇宙、AIGC等新技术将如何开拓教培行业的新机遇?

6月1日周四19:00,参与直播,为你解答~

73b97f0632c4da7a7902359e674c6f9c.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23811.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

西部世界

Jonathan Nolan是我很佩服的一个导演。 整部剧真正主题只有一个—— 如果机器人拥有自主意识,会对人类社会造成怎样的冲击? “美国西部、科幻、人工智能 & 机器人革命”,这 4 个看似不相关的元素却组成了一部 新神剧《西部世界&#xf…

人工智能AI简史

AI人工智能简史 最近学习AI,顺便整理了一份AI人工智能简史,大家参考: 1951年 第一台神经网络机,称为SNARC;1956年 达特茅斯学院会议,正式确立了人工智能的研究领域;1966年 MIT发明ELIZA人机心…

Google版 ChatGPT 开放、英伟达又投下核弹显卡……AI 又变天了

AIGC 经历了 疯狂一夜 作者 |新宇 志劭 智健 来源 | 爱范儿(ID:ifanr) 如需转载请联系原出处原标题:最卷一夜!Google版 ChatGPT 开放、英伟达又投下核弹显卡……一觉醒来 AI 又变天了 AI 的 「iPhone 时刻」已经到来 在…

慧言GPT简介及使用教程

慧言简介及使用教程 常用链接: 慧言升级日志 慧言网址发布 与慧言合作,享受时代红利 慧言主站 一、慧言简介 首先再次欢迎来到慧言GPT,本系统初衷是让国内用户用上目前大火的AI产品,让大家感受新时代的AI交互方式。 未来时代…

“ChatGPT之父”勇闯币圈!数十亿人的空投计划,只需交出你的虹膜?

最近,Worldcoin(世界币)热度持续提升,这个由OpenAI创始人SamAltman亲自操持的加密项目,让沉寂已久的币圈开始躁动起来。 虽然Worldcoin并非最新项目,但颇具乌托邦色彩的理念,独特的虹膜识别机制…

AI低代码编程崛起,23年还要不要学软件?

👉腾小云导读 当 AIGC 逐渐应用于开发业务的日常工作中,它与低代码结合使我们的研发提效,与数字人结合将为我们创造新的生态场景,更有言论认为 AIGC 与其它更多技术融合,或将取代程序员并实现自主创新?今天…

2023 年KPI (KPI:Key Performance Indicator)

文章大纲 1. 基础巩固 (10%)2. 工作内容充实 (20%)YOLO v5 v8 相关内容理解与充实 3. AI 兴趣: NLP(30%)4. 面试、笔试题常读常新(2月新增)5. 读书笔记学习材料 将本人2023 计划进行…

被卖到 2w 的 ChatGPT 提示词 Prompt 你确定不想要吗?

有朋友说,用 ChatGPT 生成的文案刻板化,格式化,而且往往也不是我想要的。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍ 想要用好 ChatGPT 人工智能工具太难了,想一个好的提示词,也太不容易了,ChatGPT 就像一个宝藏…

为什么大数据使用相关关系而不是因果分析?

image 在大数据的分析中,很多分析都是使用相关关系进行分析而不是使用因果进行分析,这就让很多人感到疑惑。不过对此也是情有可原的,因为我们在日常生活中习惯性地用因果关系来考虑事情,所以我们自然就会认为,因果联系…

HDFS常用30条命令(ChatGPT生成)

命令描述hadoop fs -ls列出某个目录的内容hadoop fs -mkdir创建空目录hadoop fs -copyFromLocal/copyToLocal本地文件上传/下载至HDFShadoop fs -rm删除文件或目录hadoop fs -mv移动某个文件或目录hadoop fs -tail显示一个文件的末尾内容hadoop fs -cat显示一个文件的内容hadoo…

基于LangChain从零实现Auto-GPT完全指南

一、框架介绍 LangChain是何方神圣?远的不说,我们就拿当下火热的项目Auto-GPT来说,该项目集成了:自动推理、联网搜索、LLM推理。那么现在好了,你可能会好奇他是怎么做到的!那么告诉你LangChain这个框架可以帮你从零到一实现一个比Auto-GPT还要强大的产品! 难道你还不心…

一款接口自动化神器—开源接口测试平台Lim(Less is More)

前言 对于传统的实现接口自动化的方案往往是搭建自动化框架,通过excel编写用例来驱动执行,例如常见的万金油技术栈组合:excel(编写用例)、pytest(用例执行)、allure(测试报告)等。 很多公司往往是通过自动化框架而非…

Android Studio||TextView点击改变背景颜色/点击出现图像imageView/延时恢复(内含源代码)

step by step. 目录 参考: 1. xml中原本颜色设置 xml: xml: 2.颜色修改 java: java: 3. 整个代码: xml: java: 4.延时恢复(Handler) 参考: Text…

金山云联合MiniMax推出MaaS互信推理专区方案 解决大模型与数据互信难题

作为人工智能领域颇具里程碑式的进展,ChatGPT以其惊艳的表现,迅速掀起了行业热潮,使得大模型成为当下最为炙手可热的技术方向之一。但在大模型落地过程中,如何既能保障大模型使用方的数据安全,又能保护大模型提供方的部…

比尔·盖茨最新分享:ChatGPT的发展,不止于此

来源: 笔记侠 最近,ChatGPT、GPT 4、文心一言、Copilot,人工智能产品层出不容,一路轰炸;王慧文、王兴、李开复等各位高调以及低调的商业领袖和技术专家,纷纷入局AI赛道。人声鼎沸,十分热闹。 昨天&#xff…

2020四川大学计算机报录比,【重磅】川大公布2020考研报录比!去年有1243人考新传...

原标题:【重磅】川大公布2020考研报录比!去年有1243人考新传 四川大学的考研竞争到底有多激烈?西部地区新闻传播学最牛的川大文新学院,每年到底有多少人来争名额?今天我们就来揭!秘! 昨天&#…

《曾国藩的正面与侧面》,历史成功学新传与耕读理想

不知不觉,历史学者张宏杰的“曾国藩的正面与侧面”已经连续出了3册。首册出版是2014年,流行一时,也就有了后面的2、3册。第一册主题是“曾国藩的生存智慧”,第二册谈“曾国藩家书与曾氏家风文化”,第三册则讲“曾国藩的…

Bespin Global:云管理市场上演老兵新传

Bespin Global之所以有今天如此快速的发展,并得到市场和分析公司的认同,一个重要的基础是,从一进入云管理服务市场,Bespin Global就有清晰的定位和明确的目标。 2017年3月,Gartner发布了2017年全球公共云托管服务提供商…

Android 四大组件通信核心

前言 系列文章: Android Activity创建到View的显示过程 Android 四大组件通信核心 Android 系统启动到App 界面完全展示终于明白(图文版) 我们知道Android 四大组件:Activity/Service/Broadcast/ContentProvider 能够进行跨进程通信,它们均是…

有坐标的主买量占比主卖占比判断操盘通达信指标公式源码 附效果图

使用说明: 适用通达信软件使用,不同的软件使用要修改。 直接复制以下源代码,在公用管理器中新构建指标公用,复制进去就可以用了(仅供参考,下面有效果图,可以先看看指标显示出来效果如何&#…