李飞飞空间智能来了:AI生成可探索交互的3D世界,颠覆游戏电影VR行业

目录

  • 前言
  • 图生世界
  • 摄影效果
    • 景深效果
    • 滑动变焦
  • 3D效果
    • 交互效果
    • 动画效果
  • 走进大师的艺术
  • 工作流
  • 总结

前言

12月3日,有AI“教母”之称的李飞飞发布了空间智能的一个项目,一经发布就立刻引爆了外网。这个项目是仅仅通过一张图片,AI就可以快速的构建一个3D世界,而且这个世界是可以探索和交互的,先来看一看效果:

空间智能:AI生成的3D世界

是不是非常酷炫,实际上空间智能还有更多的能力,下面详细来看一下

图生世界

当今AI发展非常迅速,用图来生成视频已经很逼真了,但是这次的空间智能更是超乎想象。

只需要将一张图片交给空间智能,空间智能就能够在短时间生成一个3D世界。可以在浏览器里进行实时绘制,实际上就是通过Three.js来实现的。这样我们就可以在这个世界里进行探索了,如下

图生世界,颠覆行业的产品

可以看到,除了正前方原图中的元素,AI还会自动生成补全其他方向上的元素。

目前这个项目的功能还没有对外开放,我们无法自己来生成世界。但是在空间智能官网(https://www.worldlabs.ai/blog)上提供了很多已经生成的世界,我们可以自己去探索
在这里插入图片描述

就跟我们玩的3D游戏一样,可以通过awsd这四个键来前后左右移动,通过鼠标拖动来调整视角。

看看我们在其中一个世界里的探索

一起来探索AI生成的世界吧

可以看到AI生成的这个世界确实让人惊艳,整体非常平滑,确实有真实世界的感受,尤其它的探索能力是其他AI无法比拟的。

但是在视频中也可以看到,虽然声称的是3D世界,但是其实只是一个小场景,而且我们在其中的行动也不是完全自由的,只能在一个很小的范围内进行移动。

不过这只是一个开始,相信随着空间智能的不断进化,后续会生成更宏大、更自由的世界。

在这些世界里探索的时候,其实也可以发现AI的痕迹,比如很多小细节上处理的还不够。比如下面这个凭空出现的小楼:
在这里插入图片描述

摄影效果

你以为这就是空间智能的全部么?当然不是,空间智能生成的世界还支持很多功能,比如一些摄影效果。

景深效果

空间智能可以模拟景深效果,对焦距离相机一定距离物体,这样这部分会清晰的显示,而其他部分则会变得模糊,如下:

空间智能的景深效果

滑动变焦

滑动变焦(Dolly Zoom)就是希区柯克变焦,是电影拍摄中一种很常见的镜头技法。希区柯克变焦的特点是:镜头中的主体大小不变,而背景大小改变。

空间智能支持滑动变焦这一效果,如下:

空间智能的滑动变焦效果

3D效果

相较于其他生成模型,空间智能生成的世界有很多优点:

  • 永恒性:一旦这个世界生成了,它就固定下来了,无论如何转变视角或移动后再返回,这个场景都不会改变了。

  • 实时性:这个场景生成后,你可以实时在这其中进行探索。

  • 正确性:生成的世界遵循3D几何的基本物理规律,有立体感和深度。其他AI模型生成的视频虽然很梦幻,但是缺乏这种效果。

空间智能通过深度图这种简单的方式来实现,简单来说就是每个像素的颜色是由它与摄像头的距离决定的。这部分大家有兴趣去官网看一下吧,这里就不展示效果了。

抬头仰望,那轮皎洁的明月,如同镶嵌在深蓝天幕上的明珠,静静地洒下银辉,照亮了每一个归家人的路。无论身在何方,心中那份对家的眷恋,都随着这轮满月,变得更加浓烈。

交互效果

空间智能生成的世界另外一个特点就是交互性,用户可以在这个场景中放置物体,也可以实现交互,如下:

与AI生成的3D世界交互吧

官网实现了三种效果,声纳、聚光灯和波纹效果。

部分用户提前获得了工具,已经进行了部分创作,他们利用这些生成的世界做了更多复杂的交互,实现了更多的效果。

动画效果

除了交互效果,还可以实现动画效果,如下:

让AI生成的世界动起来

这里就简单展示一下,大家有兴趣自行去官网体验。

走进大师的艺术

有了空间智能这个能力,我们就可以将那些大师的画作构建出来,比如漫游在梵高的《夜晚露天咖啡座》中:

一起漫游在大师的名画中

感觉就像是走进了一个抽象的世界中一样。

工作流

空间智能会保持原图的风格,这就使得它可以与其他AI生成工具结合使用。比如文生图,同一个prompt在不同的模型下生成的图片风格是不一样的,空间智能以这些图片为基准生成的世界风格一样会保持不变。

这里就不展示了,可以去官网体验。

总结

空间智能的发布结结实实的秀了一把,其强大的生成能力确实将AI带进了新的领域。虽然其中有一些瑕疵,而且目前局限于一个小小的场景,但是对于电影、游戏、VR等领域会产生一些颠覆性的改变。

最后的这个视频,是向大家分享空间智能如何在现有工作流中发挥强大的作用,甚至改变整个工作流的。

空间智能如何颠覆现有工作流

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/485605.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

dockerfile部署前后端(vue+springboot)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言0.环境说明和准备1.前端多环境打包1.1前端多环境设置1.2打包 2.后端项目多环境配置以及打包2.1后端多环境配置2.2项目打包 3.文件上传4.后端镜像制作4.1dockerf…

Numpy基础练习

import numpy as np 1.创建一个长度为10的一维全为0的ndarray对象,然后让第5个元素等于1 n np.zeros(10,dtypenp.int32) n[4] 12.创建一个元素从10到49的ndarray对象 n np.arrange(10,50)3.将第2题的所有元素位置反转 n[::-1]使用np.random.random创建一个10*10的ndarray对象…

MongoDB分片集群搭建及扩容

分片集群搭建及扩容 整体架构 环境准备 3台Linux虚拟机,准备MongoDB环境,配置环境变量。一定要版本一致(重点),当前使用 version4.4.9 配置域名解析 在3台虚拟机上执行以下命令,注意替换实际 IP 地址 e…

Java项目实战II基于微信小程序的亿家旺生鲜云订单零售系统的设计与实现(开发文档+数据库+源码)

目录 一、前言 二、技术介绍 三、系统实现 四、核心代码 五、源码获取 全栈码农以及毕业设计实战开发,CSDN平台Java领域新星创作者,专注于大学生项目实战开发、讲解和毕业答疑辅导。获取源码联系方式请查看文末 一、前言 随着移动互联网技术的不断…

数据结构与算法-03链表-03

递归与迭代 由一个问题引出 假设我们要计算 一个正整数的阶乘, N! 。 从数学上看 1! 1 2! 2 x 1 3! 3 x 2 x 1 4! 4 x 3 x 2 x 1 5! 5 x 4 x 3 x 2 x 1 : n! n x (n-1) x (n-2) x (n-3) x ... 1我们推出一般公式 f(1) 1 f(n) n * f(n-1…

Unity 设计模式-观察者模式(Observer Pattern)详解

观察者模式 观察者模式(Observer Pattern)是一种行为型设计模式,它定义了对象之间的一对多依赖关系。当一个对象的状态发生变化时,它的所有依赖者(观察者)都会收到通知并自动更新。这种模式用于事件处理系…

第四篇:k8s 理解Service工作原理

什么是service? Service是将运行在一组 Pods 上的应用程序公开为网络服务的抽象方法。 简单来说K8s提供了service对象来访问pod。我们在《k8s网络模型与集群通信》中也说过k8s集群中的每一个Pod(最小调度单位)都有自己的IP地址,都…

地瓜RDK X5上手ollama大模型测试

地瓜RDK X5上手ollama大模型测试 契机 ⚙ 上次逛ollama的时候发现有很多小参数的大模型,比如qwen2:0.5b,llama3.2:1b,甚至还有一个1.8b的多模态模型moondream,找公司1拿到一块RDK X5的开发板,官网查看算力可达10TOPS&#xff0c…

【Java】反射简介

框架的核心和架构师的核心 反射和代理是重中之重 反射 反射的作用 在运行的时候由代码获取类的信息 三种获取类信息的方式: 对象.getClass()Class.forName("类的路径")类.class Class :一个用来存储类信息的类 获取类信息是获取的整体的…

Windows电脑伪关机(快速启动模式),怎么真关机

Windows电脑在关机的时候,进入到一个伪关机的状态,也就是并没有真正的关机,但是在一些系统更新、变更了一些设置,进行重启等操作也会进入到真关机状态 这种一般是开启快速启动模式,开启了快速启动模式功能会在关机的时…

在c#控制台中使用Raylib-cs库,绘制控制小球和插入音频(附带c++中小球的控制代码)

下载网址 GitHub - chrisdill/raylib-cs: C# bindings for raylib, a simple and easy-to-use library to learn videogames programming 克隆库 克隆GitHub仓库-CSDN博客 1 .制作dll 点击 生成之后就会多出这些东西 2.在项目中添加dll 然后就导进来了 测试一下用例代码 …

【开源免费】基于Vue和SpringBoot的服装生产管理系统(附论文)

博主说明:本文项目编号 T 066 ,文末自助获取源码 \color{red}{T066,文末自助获取源码} T066,文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析…

【漫话机器学习系列】Adaboost算法

Adaboost(Adaptive Boosting)是一种经典的集成学习方法,主要思想是通过将多个弱学习器(通常是简单模型,如决策树桩)加权组合,来提升整体模型的预测能力。Adaboost 是一种自适应的学习方法&#…

WebStorm快捷键保持跟Idea一致

修改连续行局部多选 在WebStorm中同时按下ctrl alt s; 选择KeyMap 输入Column Selection Mode选择快捷键, 右键选择Add Mouse Shortcut 按下alt 鼠标左键 如果出现占用的情况,直接删除其他使用该快捷键的地方即可; 修改跨行局部多选 在…

图的遍历之DFS邻接矩阵法

本题要求实现一个函数,对给定的用邻接矩阵存储的无向无权图,以及一个顶点的编号v,打印以v为起点的一个深度优先搜索序列。 当搜索路径不唯一时,总是选取编号较小的邻接点。 本题保证输入的数据(顶点数量、起点的编号等…

如何解决java.lang.UnsatisfiedLinkError:org.hyperic.sigar.ProcStat.gather问题

在新装的centos7.4服务器上部署部署应用系统,应用系统系统启动报错:“java.lang.UnsatisfiedLinkError:org.hyperic.sigar.ProcStat.gather” 一、报错分析 java.lang.UnsatisfiedLinkError通常是由于Java程序无法找到、加载或链接到所需的本地库而引发的…

Qt Chart 模块化封装曲线图

一 版本说明 此文档会从头到尾演示创建初始化流程 二 完成示例 此文章包含:曲线轴设置,曲线切换,单条曲线显示,坐标轴。。。 三 曲线图UI创建 在UI界面拖放一个QWidget,然后在 Widget里面放一个 graphicsView 四 代码介绍 1 头文件 #include <QString> #includ…

【时时三省】(C语言基础)结构体内存对齐

山不在高&#xff0c;有仙则名。水不在深&#xff0c;有龙则灵。 ----CSDN 时时三省 我们已经掌握了结构体的基本使用了。现在我们深入讨论一个问题&#xff1a;计算结构体的大小。 这也是一个特别热门的考点&#xff1a;结构体内存对齐 示例&#xff1a; 第一个s如果根据字…

云数据库 MongoDB

MongoDB 是一个基于文档的 NoSQL 数据库&#xff0c;它与传统的关系型数据库不同&#xff0c;采用的是灵活的文档结构&#xff08;类似 JSON 格式&#xff09;。MongoDB 是开源的&#xff0c;且高度可扩展&#xff0c;通常用于处理大量的非结构化或半结构化数据。 云数据库 Mon…

第一个 JSP 程序

一个简单的 JSP 程序&#xff1a; 使用 IDEA 开发工具新建一个 maven 项目&#xff0c;具体操作如图所示&#xff1a; 配置 Tomcat 服务器 项目结构如下图所示&#xff1a; 3. 修改 index.jsp 页面的代码&#xff1a; <% page language"java" contentType&q…