前端3D技术概述

43175c59ec18c242fa3f590b41f50142.gif

操作系统、编译原理、计算机图形学被传为程序员的三大浪漫,每个方向都易懂难深,但作为程序员对每个方向还是要有基本的认识和判断,毕竟贯穿虚拟和现实生活的桥梁是搭建在抽象之上的,这三大浪漫是抽象化的课代表。本次我们认识下计算机图形学中的3D渲染部分,目的是沉淀下最近接触到的一些3D知识,同时能帮助大家有一个简单的认识也是惊喜的收获吧。

41f20fdae377ded96140b56e2cc21bee.png

3D绘制引擎技术

在对3D模型进行渲染绘制的时候我们很关心底层使用的是什么样的技术,在web前端工作中webgl技术也有着广泛的应用,那么webgl、opengl、opengl es等等技术之间的关系是什么呢?我们在web和端上绘制3D图形的时候使用的是哪个引擎?下面我们先对这两个问题简单讨论下,首先分别讲下各个技术的概念和用途。


  OpenGL (Open Graphics Library)

OpenGL是最早普及的跨平台图形绘制接口,自1997年发布以来已经广泛应用在了各个平台。目前还是主要的绘图引擎,OpenGL规范描述了绘制2D和3D图形的抽象API。尽管这些API可以完全通过软体实现,但它是为大部分或者全部使用硬体加速而设计的。OpenGL不仅语言无关,而且平台无关。规范只字未提获得和管理OpenGL上下文相关的内容,而是将这些作为细节交给底层的窗口系统。出于同样的原因,OpenGL纯粹专注于渲染,而不提供输入、音频以及窗口相关的API。

  OpenGL ES (OpenGL for Embedded Systems) 

OpenGL ES是从OpenGL裁剪定制而来的, 主要是针对手机、PDA和游戏主机等嵌入式设备而设计,去除了glBegin/glEnd,四边形(GL_QUADS)、多边形(GL_POLYGONS)等复杂图元等许多非绝对必要的特性。经过多年发展,现在主要有两个版本,OpenGL ES 1.x针对固定管线硬件的,OpenGL ES 2.x针对可编程管线硬件。OpenGL ES 1.0是以OpenGL 1.3规范为基础的,OpenGL ES 1.1是以OpenGL 1.5规范为基础的,它们分别又支持common和common lite两种profile。lite profile只支持定点实数,而common profile既支持定点数又支持浮点数。OpenGL ES 2.0则是参照OpenGL 2.0规范定义的,common profile发布于2005-8,引入了对可编程管线的支持。OpenGL ES 3.0于2012年公布,加入了大量新特性。

  1. OpenGL ES 1.0基于OpenGL 1.3,在2003年发布;

  2. OpenGL ES 1.1基于OpenGL 1.5,在2004年发布;

  3. OpenGL ES 2.0基于OpenGL 2.0,在2007年发布;

  4. OpenGL 2.0向下兼容OpenGL 1.5,而OpenGL ES 2.0和OpenGL ES 1.x不兼容。

  5. OpenGL 3.x 基于 OpenGL 3.x,在2012年发布

  WebGL

WebGL(Web 图形库)是一个 JavaScript API,可在任何兼容的 Web 浏览器中渲染高性能的交互式 3D 和 2D 图形,而无需使用插件。WebGL 通过引入一个与 OpenGL ES 2.0 非常一致的 API 来做到这一点,该 API 可以在 HTML5 <canvas>元素中使用。这种一致性使 API 可以利用用户设备提供的硬件图形加速。

OpenGL、OpenGL ES、WebGL关系用下图可以很好的表示,在实际应用过程中,前端的WebGL是通过JS语句,操作本地的OpenGL的部分接口,对于移动设备这是操作OpenGL ES的接口,来实现页面的图形的渲染,WebGL只是绑定外面接口的一层,内部的一些核心内容,如着色器,材质,灯光等都是需要借助GLSL ES语法来操作的。

三者关系图如下图所示

15fd2148cecb69c824897c75137bfde0.png

WebGL和OpenGL ES是封装调用关系本身只有较小的js运行时瞬时,但目前中端机体验来讲没有体感,webgl 相关的代码实现在代码实现有兴趣可以自己看下,只是对opengl的调用封装。

55cd39d94d527ab537f025ba05f0b237.png

OpenGL、OpenGL ES、WebGL的关系和区别还有篇文章可以比较好的说明,可参考:https://blog.csdn.net/qq_23034515/article/details/108283747

还需了解的是这些技术都利用了GPU的并行计算,相对于CPU的并行,GPU并行方式有很大不同,在多核 CPU 中,每个 CPU 可以并行运行另一个程序。而在GPU中,GPU的每个运算单元对不同的数据并行执行完全相同的程序。GPU 的运算单元设计用于高速执行简单处理,并且在条件分支方面很差。与 CPU 不同,它对可以执行的程序有相当大的限制。实际的GPU机制要复杂的多,但是暂时这种程度的理解对于OpenGL的介绍已经足够了。

3901c6346fd763ac0db56ba3c0b1b564.png

  着色器绘图语言GLSL(OpenGL Shading Language)

GLSL是不支持隐式类型转化、不支持静态编译的c语言的一个子集,是运行在显卡中的程序。主要作用是代替之前固定的渲染管线中顶点着色器、片源着色器部分使其可以灵活可可编程,以完成复杂的渲染定制任务。大致上替代的部分如下图所示

熟悉GLSL建议通过下面两个网址练习。

cb819fef6ce61e4dd8f983ec3233a889.png

https://thebookofshaders.com/edit.php

https://glslsandbox.com/

10ba29cf86dde0c8a60cb2f25f691328.png

渲染


3D模型的渲染简单来看的话其实就是根据模型本身的基础坐标参数和响应材质与环境光的关系进行图形渲染。但是相对于二维的照片渲染,3D渲染有了环境光与材质的反射结果计算和实时计算的需求,因此相对来说技术复杂度更高、计算量也更大。相信大家在日常也简单了解过3D相关的技术,在学习的过程中会听到大量的渲染管线、着色、材质、贴图、场景、光源、opengl、webgl等等专业的名词,如果不是从事相关的工作光这些名词就够学习一阵子了,因此本文章将简单讲解比较重要的渲染方式和名词,重点是讲应用,后期的文章中会更多的提及原理性的东西。目前来说3D渲染有两种主要的渲染方式 光栅化(rasterization),光线追踪(ray tracing)。

渲染管线实际上就是一个面对相机的投影计算过程,大致过程如下图所示,具体的每一部分是做了什么事情,感兴趣的可以自行了解下,本文只讲最易懂的部分。

9f5c9ed8a5260ff2fdb4c1d72dade98d.png

958ee8c0f6159c70f19cfdc3b6fdb332.png

光栅化是把矢量图形转换为光栅图像(也称为位图)的过程。该过程涉及将图像划分为小的、独立的像素,并根据原始矢量图形在该位置的颜色为每个像素分配颜色。结果是原始图像的网格状表示,可以在数字屏幕上显示。实际上就是把连续的几何图形投影到离散的像素矩阵的数学表示的过程。其中用到了透视、投影矩阵等相关的知识感兴趣的可以从https://github.com/QianMo/Real-Time-Rendering-3rd-Summary-Ebook/raw/master/%E3%80%8AReal-Time%20Rendering%203rd%E3%80%8B%20%E6%8F%90%E7%82%BC%E6%80%BB%E7%BB%93.pdf这本书上简单了解下。

bdcd6e6a0988402655b9d346cd186c05.png

光线追踪是最近30系列显卡带火起来的技术,本身是一个比较老的技术,提出是在80年代但是由于高昂的计算成本,最近才被大量的在离线渲染、游戏高还原度场景中使用。基本原理是从相机逆向推算到光源的光减少了工程复杂度、真实性也更加逼真。

3d98390a96b95f37edd16ff4bf025128.png

62254f2b490839cd0a30ccc14208aa72.png

  模型格式

所有的数据包都有对应的规范格式,在理解一个技术的时候了解对应的消费数据可以帮助我们快速看透整个流程所做的事情,目前比较流行的3D格式有obj、fbx、gltf、stl等等格式,其中fbx相当于模型界的jpeg应用相对广泛,也是本次模型渲染示例中使用的格式。在fbx中包含了模型所需要的材质、纹理、mesh、submesh等等绘图所需要的信息。

f60189adb0eadaf35dd93065d8ca5395.png

详细的格式数据查看 -> https://docs.fileformat.com/3d/fbx/https://mossec.eurostep.com/documentation/gui-user-guide/generic/bin-file-format.html

  前端渲染模型方式

  • threejs 汽车模型

前端调用webgl渲染3D库是比较复杂的一个事情,目前已经有了很多库做了封装如Threejs、Babylonjs、PlayCanvas等,应用最多最广泛的是threejs,threejs的用法和示例可以在其官网进行了解,这里不赘述了,https://threejs.org/

de97765c87ae99ba666463c6138eb167.png

955028326c029473d58978ec95f40790.png

88b6681eac691eef988efb735b48ab36.png


  • 其他引擎

其他引擎感兴趣的可以自己调研,下面给出一些参考。

web引擎: babylon.js、oasis-engine等

专业的游戏引擎unity、UE等

352bb6127a1520f5781ddf27ed86d284.png

建模

e44f7bed85462f316f1e29c6105abf76.png

现在大部分的模型建模方案都是手工精确建模,在近几年由于民用激光雷达、深度学习的发展,基于视觉+空间距离数据或纯视觉的3D模型辅助建模方式逐渐多了起来。

传统的建模方式先不提及了,相信在深度学习继续发展之下基于文本建模、草图建模、NERF建模的方式会越来越多,和chatgpt结合的工具也会越来越多从而极大的提高建模效率,这也许过不了5年就能在各个软件中实验起来,目前NVIDIA 建模软件已经有了比较好的落地,未来所见所得的方式会更加多样化,传统方式终将成为干预的手段补充。

在近几年的英伟达大挤牙膏和深度学习的快速发展下一种新的辅助建模方式-- NERF给快速建模带来了希望,相对于传统的手捏建模方式NERF直接通过拍摄视频的方式建模,如同二维时代的拍照一样可以快速产生一个模型,而且相对于手捏的模型更加的有“温度”,是真实的情况的客观反应,在极低的成本之下可以带来更加花样的玩法,如在汽车领域,对客户进行快速建模,绑定骨骼动画配合汽车模型进行线上的试驾体验,实现线上试车,解决车辆大小和人的匹配问题,让客户更加有购物体感。从而逐渐打破物理世界和虚拟世界的边界,互补两个世界的不足。

NERF的原理大家可以参考这篇文章https://blog.csdn.net/BIT_HXZ/article/details/128055763学习,这篇文章做了论文的翻译和简化,可以帮助快速理解。如果想试用也有比较轻量的方式,https://github.com/NVlabs/instant-ngp。

4c7fbf79f84faa5c01c26bc9e4c556bb.png

更简易的方式建议App Store搜索Luma进行使用,Luma背后也是使用了nerf技术的,可以比较简单的体验下。

7781d88cea0b9a5e53d5e9a82f4859ad.png

模型建模、查看工具

  blender

blender 是开源软件,免费且功能强大,推荐个人使用。https://www.blender.org/

662ec5c986cbd7328295377c1b53731d.png

  unity 3D

af2c2aea2c0cb6e8bef4ceb604347a9d.png

8a47d55be90ccf35e8413f6dbf5a317b.png

3D渲染带来的优势和适用范围

3D渲染相对于我们现在的二维web互联网世界来说还是未被大范围利用的土地。3D相对于2D的优势有以下几点:

  1. 提高的逼真度和深度感:3D图形提供了对物体和环境的更逼真的表示,增强了沉浸感,并更好地理解空间关系。

  2. 提高的视觉吸引力:3D图形比2D图形更具视觉吸引力和互动性,因此非常适合在高价值商品还原、广告和游戏中使用。

  3. 更灵活的表示:3D图形可以从任意角度旋转和查看,提供了对物体和环境的更灵活的表示。

  4. 更好的模拟能力:3D图形非常适合模拟,允许创建高度逼真的虚拟环境和场景,用于测试、培训和研究目的。

在家装、汽车行业有比较好的可落地性,家装行业已经广泛使用也比较符合直觉。汽车行业目前在阿里系外的懂车帝、汽车之家等app中已经引入3D已久,作为用户看车对比、提升用户停留时长的重要手段。

一些汽车方向的使用:

https://ezshine.gitee.io/www/showcase/smart3dh5/loader.html

https://car.taobaocdn.com/static/realibox/breeze/index.html?wh_weex=true&spm=acar.rb-gb.list.breeze

8d80b04bd99094c2b18f6eee551f0c0a.png

团队介绍

我们大淘宝技术团队,团队主要负责品牌业务发展中心的行业业务,基于行业纵深做业务模式的突破和能力的沉淀,更好的支持业务的发展,支持的业务包含但不限于天猫优品、天猫汽车、家装、消电、运动等行业。

我们团队正在多方向尝试新技术、新方法,提升用户体验帮助业务实现可持续增长,欢迎大家加入阿里大家庭,一起用技术帮助业务成长。

¤ 拓展阅读 ¤

3DXR技术 | 终端技术 | 音视频技术

服务端技术 | 技术质量 | 数据算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/69566.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能Python-python_nurbs

Python NURBS: 一种高级的曲线建模工具 如果你是一名3D建模工程师或者是开发了设计软件的工程师&#xff0c;你一定会了解NURBS。NURBS是非均匀有理B样条曲线&#xff08;Non-Uniform Rational B-spline&#xff09;的简称&#xff0c;是3D建模中使用最广泛的曲线建模工具之一…

chatgpt赋能python:Python好玩的程序代码

Python好玩的程序代码 Python作为一种高级编程语言&#xff0c;以其简洁易懂的语法、丰富的库以及广泛的应用赢得了广大程序员的热爱。除了在日常代码开发中&#xff0c;Python还可以用来编写一些有趣的程序&#xff0c;下面就让我们来看看Python好玩的程序代码吧。 1. 用Pyt…

卡塔尔世界杯门线技术(GOAL LINE TECHNOLOGY)背后的黑科技

现代职业足球运动员踢球时足球的行进速度&#xff0c;据国际足联统计数据&#xff0c;平均速度可达 60 英里/小时。极少数爆发力超强的职业球员&#xff0c;可以将这个速度刷新到超过 100 英里/小时。比如里斯本竞技队的巴西左后卫罗尼赫伯森在 2006 年以 131.82 英里/小时的速…

使用 JavaScript 模拟光标随机移动端

1.效果预览 https://jsfiddle.net/0qmaytco/https://jsfiddle.net/0qmaytco/ 2.代码运行 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge&…

如何实现同一IP的不同端口访问不同的网站

一&#xff0c;要求 1&#xff0c; 基于同一IP的不同端口访问不同的网站(可以通过域名去访问) ipport1 -> 对应一个域名 ipport2 -> 对应一个域名 使用域名1我应该访问到 ipport1对应的内容 使用域名2我应该访问到 ipport2对应的内容 2. …

社交登陆成功回调

1. 点击跳转至第三方授权 2. 这是使用gitee作为第三方授权进行验证 3. 授权成功则跳转至 redirect_url 4. 社交登陆回调逻辑 一、根据第三方授权提供的方式获取token &#xff08;1&#xff09;发送请求获取code码&#xff08;每次发送请求&#xff0c;code码会改变&#xff…

GTK之信号和回调函数

GTK之信号和回调函数 在 2.0 版&#xff0c;信号系统已从 GTK 移到 GLib&#xff0c;因此在函数和类型的说明中有前缀 “g_” 而不是 “gtk_”。   GTK 是一个事件驱动的工具包&#xff0c;意味着它会等在gtk_main() 那里&#xff0c; 直到下一个事件发生&#xff0c; 才把控…

极智AI | AIGC时代中AI巨头之间的博弈

欢迎关注我的公众号 [极智视界],获取我的更多经验分享 大家好,我是极智视界,本文来谈谈 AIGC时代AI巨头之间的博弈。 邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码下载,链接:https://t.zsxq.com/0aiNxERDq 下图是开复老师在 《AI 未来》演讲中一页…

基金经理二季度AI概念股操作分化

公募基金二季度仍在加仓AI板块&#xff0c;但不同于一季度全线加仓题材各环节&#xff0c;二季度对AI产业链的操作出现分化。 资金更加聚拢在业绩率先兑现的上游算力板块。其中光模块、服务器是加仓最为显著的两个领域&#xff1b;对于部分业绩短期兑现前景不明的AI板块&#…

调研27个模型后,代码生成的知识增加了

点击上方“AI遇见机器学习”&#xff0c;选择“星标”公众号 第一时间获取价值内容 来源&#xff5c;AINLPer 卷友们好&#xff0c;对于NL2Code任务相信大家都不陌生。它主要目的就是将自然语言转换成可执行代码来提高开发人员的工作效率&#xff0c;终极目标就是干翻所有程序员…

符尧:我想为 MOSS 正名

点击上方“AI遇见机器学习”&#xff0c;选择“星标”公众号 第一时间获取价值内容 知乎: Franx链接: https://www.zhihu.com/question/596908242/answer/2996276211编辑: 深度学习自然语言处理 公众号 我是符尧&#xff0c;是先前《拆解追溯 GPT-3.5 各项能力的起源》这篇文章…

inscode评测

文章目录 项目介绍首页使用反馈语言模板编辑AI模板​编辑网站模板编辑图形模板 编辑器使用反馈使用场景1---函数定位改进建议&#xff1a; 使用场景2---项目创建改进建议&#xff1a; 使用场景3---文件上传改进建议&#xff1a; 视觉反馈模板使用一些BUG反馈创建项目会较频繁出…

谷歌20年老员工叛逃,创立第二个OpenAI?

来源&#xff1a;新智元 硅谷独角兽&#xff0c;又来震撼世界了&#xff01; 这支名叫Character Technologies的独角兽的核心力量&#xff0c;来自前谷歌LaMDA团队。 他们的新产品在移动端上线不到一周&#xff0c;下载量就达到了170万&#xff0c;直接碾压了ChatGPT&#xff0…

技术无关性别,IT 界的“她”力量也能撬动半边天!

作者 | 朱珂欣 出品 | CSDN程序人生&#xff08;ID&#xff1a;coder_life&#xff09; 职业本无性别之分&#xff0c;但提到 IT 界的“程序员”&#xff0c;大家脑海中总会先浮现“格子衫、牛仔裤、戴眼镜”的模样&#xff0c;而并非人数比重较少的“程序媛”。据拉勾招聘数…

电脑同时登录多个微信

现在很多人手上都有多个手机号以及多个微信号&#xff0c;但我们发现&#xff0c;当我们想在电脑上同时登录多个微信&#xff0c;好像每次双击打开&#xff0c;都是跳出当前这一个&#xff0c;和QQ有很大的区别。 那我们可以通过bat文件来试试&#xff0c;通过执行bat文件里的…

电脑上同时登陆多个微信

电脑版微信默认只能登录一个微信&#xff0c;其实这里有个小技巧&#xff0c;无需安装任何软件&#xff0c;就能实现微信多开。 第一种方法&#xff1a; 按住键盘上的Shift键不要松手&#xff0c;然后鼠标快速多次点击微信图标&#xff0c;即可实现多开。&#xff08;这种方法…

电脑,从多人一台到一人多台

最早接触电脑是中学时&#xff0c;当时应该是APPLE-Ⅱ&#xff0c;固化的Basic&#xff0c;仅仅算是打了个照面&#xff0c;印象最深的就是空调机房&#xff0c;还有地毯&#xff0c;拖鞋&#xff08;当时还没有鞋套&#xff09;&#xff0c;功能倒是没有太多的概念。 到了大学…

19、两台电脑怎么就能互相通信了

今天的内容非常有趣,绝对让你涨知识~ 不知道大家是否好奇过这样一个问题,那就是,两台电脑怎么就能互相传递信息了呢?可能你觉得这是一件很正常的事情,就那样一发一接不就ok了嘛?可是真的让你说出个所以然,那绝对是触碰到你的知识盲区了~ 也许你学过之前的内容知道,这需…

多用户使用一台计算机 可设置,如何设置才能让一台计算机可以多个用户同时登陆?...

满意答案 adnx88234 2013.02.26 采纳率&#xff1a;55% 等级&#xff1a;13 已帮助&#xff1a;13511人 第一&#xff1a;共享的前提工作&#xff1a; 1.更改不同的计算机名&#xff0c;设置相同的工作组&#xff01; 2.我的电脑右键&#xff0d;管理&#xff0d;计算机管理…

chatgpt赋能python:Python数学建模:将数据转化为答案的利器

Python数学建模&#xff1a;将数据转化为答案的利器 随着数据时代的到来&#xff0c;数据的价值越来越受到人们的关注。但是单纯的数据没有意义&#xff0c;只有将他们转化成有意义的答案才有意义。在这个过程中&#xff0c;数学建模是一个非常重要的工具&#xff0c;而Python…