基于WebGPU的AI原生3D引擎将会迎来新机遇!Orillusion在GOTC上做主题演讲

全球开源技术峰会(Global Open-source Technology Conference) GOTC 2023 由开放原子开源基金会、 Linux 基金会亚太区、上海浦东软件园和开源中国联合发起, 于 5 月 27 日至 28 日在上海顺利举行。

GOTC是面向全球开发者的一场盛大开源技术盛宴,大会以行业展览、主题发言、专题论坛、开源市集的形式展现,与会者将一起探讨元宇宙、3D 与游戏、eBPF、Web3.0、区块链等热门技术主题,以及开源社区、AIGC、汽车软件、AI 编程、开源教育培训、云原生等热门话题,探讨开源未来,助力开源发展。

北京鸥睿零世科技有限公司创始人&CEO白景文受邀出席Web3元宇宙世界专题论坛,发表了题为《元宇宙时代Web3D的生态优势及WebGPU引擎的机遇》的演讲,并参与了《游戏与3D渲染引擎》圆桌讨论。

圆桌会议

一、AIGC在3D行业的突破

随着ChatGPT的出现,LLM的多模态能力已经在文字和图片的生成上表现出了非常好的效果。下一个被LLM覆盖的场景,必然是3D内容的生成。AIGC在3D行业的突破,我们理解为两种表现形式:生成派和调用派。

生成派:资产的生成

比如ChatGPT,Jasper,Imagen,Dall·E 2,Stable Diffusion,Midjourney等,都是在文字或图片的场景里,从0到1的直接创造内容。对于3D资产,通过AI最终也一定可以实现从0到1的直接创造。从当前3D内容生产工作流兼容性的角度,考虑到3D资产需要应用到渲染管线,3D资产最流行的representation就是Mesh,除此之外还包括NeRF,体素,点云,SDF等。当下,可以基于3D数据集直接训练AI模型,实现3D Mesh资产的创作,也可以基于2D图片信息,来生成各种representation的3D资产。虽然目前来看,3D资产的生成还是处于相对早期的阶段。但是,这些不同的representation最终都会通过AI,实现从0到1的直接生成创造。

调用派:资产的产品化

在3D应用场景中,LLM是否可以学习各种DCC软件(通过教程、案例、代码等),通过“调用”的方式,完成3D内容的创作。比如我们是不是未来可以教会LLM使用Unity引擎工具,通过prompt,就可以直接生成我们需要的3D应用。LLM本身更擅长的是对文字内容的理解,而复杂繁琐的专业性工作,有很多成熟的工具可以完成。这好比我们的大脑只需要完成思考,再通过控制我们的手脚来完成工作一样。这种调用派的逻辑更像是ChatGPT当下的插件机制,如果想购买机票,只需要告诉ChatGPT我们的意图,然后通过插件调用成熟的机票购买服务就好了。

生成派解决的是资产创造的问题,但是3D资产创造完,需要有去处,有场景。调用派解决的资产转换为3D资产,产品化的问题。

二、带有AI大脑的3D引擎必然出现

功能级:AI能力独立调用

⾕歌在5月10号召开的I/O⼤会,展示了AI和安卓系统的结合能力:生成式AI的壁纸应用和智能短信助手Magic Compose。这些AI能力的应用还都是属于一个个独立功能的存在,不是系统级的接入。

这种结合AI的形式和运用3D游戏引擎的AI能力开发游戏类似。当下,我们开发游戏也用到了很多AI能力:传统AI能力应用包括语音生成,语音生成面部表情,AI视频动捕等等;大模型AI能力应用包括生成原画素材,游戏剧本,智能NPC等等。我们认为这种AIGC的应用的确可以大大加速3D内容的生成效率,但是都不是系统级别的。

系统级:3D内容工具的范式转变

微软在5月23号召开Build开发者大会,推出了Windows Copilot,这对微软有重大战略意义。它的本质是给windows安装了一个大脑,而且它可以慢慢进化的。虽然现在能做的事情有限,但是这可能是新⼀代AI操作系统的雏形,通过自然语言的方式,完成人和操作系统(机器)的交流。

在这个AIGC的时代,我们需要给3D引擎装上一个大脑,大语言模型,必须系统级的理解3D引擎,这将是3D内容创作工具的范式转变。

充分发挥AI的先发优势,需要像微软一样从战略上重视。半年来,我们对AI大语言模型了解的还非常浅显,战略上愈加重视,才能理解的更为深刻,才有可能制定出更加领先且正确的战术计划。

3D应用的开发必须有3D引擎的支持,是非常不容易被大模型替代的。在这个相对的垂直场景,一定会出现一个带有AI大脑的3D引擎,为3D创作提供系统级的AIGC能力。

专题演讲

三、WebGPU和AIGC对3D引擎的影响

简单回顾游戏引擎30多年的发展史,每个时代都会有不同的3D内容需求,不同的需求又会催生出不同的引擎公司,进而站上历史舞台。

第一款游戏引擎,是由ID Software在1993年发布的《德军总部3D》,创始人John Carmack也被称为“FPS游戏之⽗”。同年,经过优化后,ID发布了《DOOM》,最终成为了游戏引擎技术的代表。但是,这两款引擎都是伪3D。真正的3D引擎是ID在1996年发布的《Quake》,它开始⽀持模型,动画和粒子特效。1997年的《Quake2》,开始⽀持OpenGL。

1998年,Epic公司的Unreal诞生。当时游戏的开发已经变的相对复杂,需要很多功能模块。Unreal当时最主要的特征是集成了游戏开发的很多模块,包括物理、⾳效、碰撞等。所以,从游戏引擎通用性角度,Unreal要好很多。但是这还不够,Unreal真正能⽐肩Quake,是经过几轮的代码重构和迭代后,发布的Unreal3。这个过程中,Epic公司做的最成功的决定就是全力拥抱微软的生态,努力适配Widows的图形API接口DX。最终在Xbox上发布了《战争机器》,也奠定了它在PC主机这个时代的引擎霸主的地位。这个时代对3D内容的需求,就是渲染逼真,效果好。

2004年,伴随着让游戏引擎大众化的口号,Unity成⽴。Unity成功的很大原因是借助于移动互联⽹的浪潮,尤其是2007年iPhone发布的时候,当时只有Unity一款引擎可以为IOS开发游戏应用。最终Unity凭借它的跨平台特性,很快的成为了移动互联网时代的主流引擎⼯具。这个时代对3D内容的需求,就是人们可以通过移动⼿机,随时随地的快速进⼊3D世界。

随后,各家游戏引擎开始普遍的去游戏化标签。比如,Unity的口号从“game development platform”变成了“real-time 3D content platform”,Unreal也开始深⼊到各个⾏业,包括影视,⼯业,仿真,⾃动驾驶等等。随着覆盖场景的增多,协作的需求也多了起来。所以英伟达推出的Omniverse,横向打通了各种3D内容制作工具,让不同的角色可以快速协作,进而提升工作效率。

在这个发展的过程中,出现过3D内容轻量化的阶段。曾经的Flash被抛弃后,很多优势都被WebGL所借鉴,也出现过非常火爆的页游。但是,从商业角度,并没有出现特别成功的引擎公司。

我们也尝试做过分析,首先Web技术不只是可以用来做网页,一样可以打包发布成移动端和桌面端的应用,甚至是未来的VR/AR/MR的应用。其次,Web在2D内容有《羊了个羊》,在工具层面上有Figma。3D场景上没有特别成功的案例,一个很有可能的原因就是Web上的3D天花板WebGL的性能问题。这导致在Web上很难开发出高质量,高性能,高留存的3D应用。

但是,这样⼀种局⾯,很有可能随着WebGPU的出现被彻底打破。2023年5⽉2号WebGPU正式发布,它本质上是释放了GPU的⽣产⼒,在浏览器上可以进⾏⾼性能的计算和渲染。

WebGPU增加了计算着色器,可以把GPU的通用计算能力独立出来,不再需要通过 fragment shader和vertext shader进⾏模拟;同时WebGPU取消了全局状态机,把内存管理交给技术人员,大大提高了灵活度,可以针对不同的需求进行自由调整。这两个技术上的变化,也表现在两个⽐较实际的场景上。第一个场景是,浏览器通过WebGPU可以直接运行大模型,比如Stable Diffusion。第⼆个场景式, 浏览器中可以更加轻松的实现桌⾯级的渲染效果算法,实现更加逼真的3D内容呈现。

浏览器的全球安装量是非常巨大的,Chrome一家在全球就有30亿用户。WebGPU带来的技术和场景的变化,意味着几十亿人,可以⼏乎0成本的获得超强的计算和渲染能⼒。再配合上浏览器天然的跨平台,易传播的属性,便可以轻松的让⽤户体验到各种AI能力和高质量3D内容。

大模型的训练是需要巨大算力支持的,因此我们在当下体验AI服务的时候,经常因为云端资源的限制而被“卡”住。有了WebGPU的技术,它可以轻松的释放端侧的算力,未来AIGC服务表现为“训练在云测,推理在端测”的模式很有可能成为新的趋势。

以ChatGPT为代表的⼤语⾔模型,已经改变了人们的习惯和认知。当下,是一个AIGC普众化需求爆发的时代,更多的⼈都渴望更方便快捷的获得AI的能⼒,获得AIGC的3D创作能⼒。 我们认为不久的将来,⼀定会出现⼀个轻量级的、易传播的,系统级集成AI能⼒的AI原⽣3D引擎。

欢迎大家加入开发者社区交流群(tips:已在123群的就不要重复加入哦,所有的信息每个群都会同步滴!)

如果出现扫码进群已达到上限,请加大添加小鸥微信(图右),我们会邀请您进群~


欢迎大家关注我们官号,加入 Orillusion 开发者社群,陪我们一起见证 WebGPU 的发展。快来成为 Orillusion 社区第一批“源”住民吧!让一起打造有价值、有活力、有温度的共创社区!


Orillusion 致力于打造全世界第一款完全开源基于 WebGPU 标准的一种轻量级渲染引擎,目标是在浏览器中实现桌面级的渲染效果,支持超大复杂场景的 3D 呈现。易上手,易分享,易迭代,易协作、成本低,跨平台是我们的核心优势,我们将为 3D 场景爆发时代提供引擎基础工具。

未来我们将会持续把最干货最前沿的 WebGPU 技术分享给每一位社区成员,也欢迎大家为 Orillusion 开源社区做出自己的贡献。我们一直坚信,开源社区的技术留痕是每一位技术人员最崇高的追求!因此,我们尊重,我们认可,我们更期待,加入 Orillusion,让我们共同进步!

——Link uncharted, 链接未来世界

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20248.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

就ChatGPT最近这情况......大家还是多一手准备吧

大家期待的经济繁荣,没有来。 往年的金三银四,跳槽涨薪,也没有来。 最近硅谷的大公司裁员了17万,三个月的裁员数,超过了去年一整年的。 中国估计也没好太多,只不过很多公司没有爆出来而已,大家都…

由浅入深之字符串的算法题(vs: chatGPT做算法)

背景 俗话说,温故而知新。chatGPT效果太惊艳了!简直就是碾压的效果。但是还要有希望,先拾取,再创新。先了解,再超越吧。 ps: 再刷最后一遍算法题思路。顺便基于chatGPT3.5感受一下大模型的魔力。 字符串基础 C/C每个字…

Postman的使用:测试Excel文件导入导出

1.导入的测试方法 选择form-data,key值填写方法对应的参数,选择File,Value处上传文件即可。 2. 导出的测试方法 在导出文件的时候,响应结果是乱码,然后在测试的时候选择下载,下载完成的Excel文件不是乱码

postman 导出导入文件excel 请求方式设置

导出: 正常发送请求: 发送请求设置: 导入: post请求,接口参数 RequestParam("file") MultipartFile file

导入/导出 Postcat 格式文件,打通数据不再难

导入 Postcat 插件。 使用 导入功能有多个入口,你可以在 API 分组处点击加号导入 API: 也可以在点击设置,然后选择导入选项 导出 Postcat 插件 支持导出 Postcat JSON 文件。 使用 进入空间页面,可以看到导出功能,点…

chatgpt赋能python:Python怎么导入CSV文件?

Python怎么导入CSV文件? 导入CSV文件是Python编程中的一项非常常见的任务。CSV文件是一种结构化文件格式,通常用于存储表格形式的数据。Python提供了多种方法来导入CSV文件,如以下三种: 1. 使用csv模块 Python的csv模块是一种简…

postman测试Excel文件导入导出功能

导入Excel核心代码 ApiOperation("导入Excel")PostMapping("/importExcel")public ActionResult importExcel(RequestParam("file") MultipartFile file){if (file.getOriginalFilename().contains(".xlsx")) {ImportParams params n…

chatgpt赋能python:Python中的文件导入方法

Python中的文件导入方法 在Python编程中,需要经常导入外部的文件,以增强程序的功能和可读性。本文将介绍常见的Python中的文件导入方法。 import语句 Python通过import语句来导入其他.py文件中的模块,语法如下: import module…

搭建自己的学术科研专用ChatGPT

前言 最近在github上看到有大佬开源了一个科研工作专用ChatGPT,为此很感兴趣就根据说明自己在本地搭建了一下,此文章用来记录一下。github地址:科研工作专业ChatGPT 科研工作专用ChatGPT拓展,特别优化学术Paper润色体验&#xff…

ChatGPT prompt engineering for developers 笔记

最近好多人在推荐这个课程,学习记录一下~ 原视频 【中文完整版全9集】ChatGPT提示工程师|AI大神吴恩达教你写提示词|prompt engineering_哔哩哔哩_bilibili 完整笔记 prompt-engineering-for-developers/content at main datawhalechina…

latex的Windows安装教程:texlive和texstudio—经验汇总内含详细图文链接

最近因为有文章被外国某同行出版商(医学相关)看中,邀请把文章内容编成一个小章节,发过来一个tex文件,需要按照他们的要求进行排版,于是本小白开启了两天的卸载和安装过程。 结合大家的安装经验和我自己在安…

electron + vue3 + element-plus + blockly项目记录

目录 项目背景 框架版本 框架的个人理解 项目搭建 electron搭建 blockly(大坑) 开发 blockly 吐槽 electron loadFile和loadURL BrowserWindow.getAllWindows() 项目背景 笔者之前主要是做后端,前端只了解一点点,用…

C++ MFC 学习笔记+小型通讯录系统实现

MFC 最详细入门教程 [MFC常用函数总结](https://www.cnblogs.com/jiu0821/p/4606639.html) [C & MFC]https://www.cnblogs.com/gaohongchen01/p/4176963.html [MFC入门(一)]https://www.cnblogs.com/yangyuqing/p/10283641…

古月居《ROS入门21讲》零基础学习笔记

文章目录 前言1.课程简介2.Linux系统介绍及安装3.Linux基础操作(操作集)命令结构常用命令快捷操作 4.cpp&python极简基础(操作集)简单对比安装编译器编译和运行 5.安装ROS6.ROS是什么7.ROS的核心概念节点与节点管理器节点&…

【对话ChatGPT】如何看待java行业内卷的问题?

本文首发自「慕课网」,想了解更多IT干货内容,程序员圈内热闻,欢迎关注"慕课网"! 作者:ccLoveStudy 当今大环境,编程行业火热,而java行业更是首当其冲,但是为此&#xff0…

Windows 11的最新人工智能应用Windows Copilot面世!

Windows Copilot是Windows 11预览版中的一项AI辅助功能。 Windows 11还包括设置应用程序的更改,更广泛的支持压缩文件格式。 上个月,微软宣布将继续其将ChatGPT应用于所有产品的冒险之旅,推出了名为Copilot的新Windows 11功能。几个月前&…

State of GPT:大神Andrej揭秘OpenAI大模型原理和训练过程

来自:Web3天空之城 进NLP群—>加入NLP交流群 前言 OpenAI的创始人之一,大神Andrej Karpthy刚在微软Build 2023开发者大会上做了专题演讲:State of GPT(GPT的现状)。 在这个朴实无华的题目之下,Andrej带来…

OpenAI大神Andrej爆火演讲,官方第一次揭秘大模型原理和训练过程!

来源 | Web3天空之城 作者 | 天空之城城主 OpenAI的创始人之一,大神Andrej Karpthy刚在微软Build 2023开发者大会上做了专题演讲:State of GPT(GPT的现状)。 在这个朴实无华的题目之下,Andrej带来的是一场超级精彩的分…

Huntly: 一款超强大的自托管信息管理工具,支持管理RSS、自动保存网页、稍后阅读...

公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! ​ 今天推荐的这个项目是「Huntly」,一个自托管的信息管理工具。 简单来说,它包含以下功能: RSS 订阅和阅读;自动保存浏览过的网页&a…

带你从零开始入门AI绘画神器Stable Diffusion

一、本地部署 Stable diffusion 1. 前言 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney(简称 MJ),另一个叫 Stable-Diffusion(简称 SD)。MJ 需要付费使用,而…