逼人去学挖掘机：朱俊彦团队新AI模型发布，设计圈看了心慌慌

逼人去学挖掘机：朱俊彦团队新AI模型发布，设计圈看了心慌慌

news/2024/12/25 22:21:23/文章来源:https://blog.csdn.net/QbitAI/article/details/129134376

明敏发自凹非寺
量子位 | 公众号 QbitAI

CV大佬朱俊彦的新论文，让设计师们感觉危了。

事情是这样的：

量子位在微博上搬运了朱俊彦团队的新成果，一个能将2D草图一键变成3D模型的新算法，却意外引发设计圈盆友们的热烈转发讨论。

配文全是“沃日”、“？？？”……

简单来说，这个模型能让非常粗糙的简笔画，一键变成逼真3D模型。

还支持实时编辑，不满意的地方擦掉重画，立马生成一个新的：

要知道之前的“图转图”模型，基本都是停留在2D层面，这回直接变3D真是一个突破。

也确实是生产力利器。

但没想到，是设计圈先感到了危机。有圈内博主就觉得又要被AI抢饭碗了，随后也有很多人跟转了这一条。

所以论文成果到底说了啥？一起来看。

可从任意角度实时编辑

现在有很多图-图的转换模型，但基本上都是2D-2D。

这是因为从2D到3D，在训练和测试过程中都有很大挑战。

训练方面，想要把2D输入图像和3D输出图像配对，需要庞大数据集，成本会很高。

测试方面，为了得到不同角度的3D模型，需要输入图像的多个视角，但是二者之间可能存在不一致的情况，导致生成效果不好。

为了解决这些问题，朱俊彦团队提出了使用3D神经场景表示（3D neural scene representations）的条件生成模型。

它只需要给定一个2D标签图（如语义分割图和勾线图），能为每个3D点匹配标签、颜色和密度等。实现在渲染图像的同时，像素对齐标签图像。

通过构建一个交互式系统，用户能在任何视角修改标签图，并生成与之相对的输出。

为了实现跨视图编辑，需要将额外的语音信息编码为3D的，然后通过图像重建和对抗损失（adversarial losses）的2D监督，来学习上述3D表示。

重建损失可以确保2D用户输入和相应的3D内容对齐，像素对齐条件鉴别器（ pixel-alignedconditional discriminator）也进一步促使外观和标签对应合理，并在新视角时也保持像素对齐。

最后，方法还提出了跨视图一致性损失，强制潜码在不同视点保持一致。

和不同模型对比显示，pix2pix-3D能在保持多视角一致的情况下，生成高质量结果。

消融实验结果同样显示，该方法的生成结果能更好和输入图像对齐。

不过研究团队也提出了方法的一些局限性。

第一，目前它还只能针对于单个对象；

第二，模型在训练过程中，需要与每个训练图像关联相机姿态（camera pose），推理时不需要。如果能不依赖于相机姿态，可以进一步扩大模型的使用范围。

朱俊彦团队出品

该论文成果来自朱俊彦团队。

朱俊彦，现任CMU计算机科学学院助理教授，是AI领域知名的青年学者。

2008年，朱俊彦进入清华大学计算机科学系，学习计算机科学专业。在同专业140人中，朱俊彦排名第2。

2012年清华本科毕业后，朱俊彦奔赴美国，在CMU和UC伯克利经过5年学习，获得了UC伯克利电气工程与计算机科学系的博士学位，师从Alexei Efros。

其博士毕业毕业论文Learning to Generate Images，获得了计算机图形学顶会ACM SIGGRAPH 2018“杰出博士论文奖”。

博士毕业后，朱俊彦来到MIT计算机与人工智能实验室（CSAIL），成为一名博士后研究员。2020年秋季，他回到曾经的母校CMU（卡内基梅隆大学），担任助理教授一职。

曾提出CycleGAN、GauGAN等明星模型。

△GauGAN支持涂鸦变风景画

△vid2vid支持从语义图生成真实场景

论文一作为Kangle Deng。他现在是卡耐基梅隆大学机器人学院的一名在读博士。

2020年从北京大学本科毕业。他以第一作者身份发表的论文，曾被CVPR 2022、ICLR 2021接收。

论文地址：
https://arxiv.org/abs/2302.08509

— 完 —

《中国AIGC产业全景报告暨AIGC 50》调研启动

谁会是中国的“ChatGPT”？最有竞争力和潜力的AIGC力量位于何方？

量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集，期待有更多优秀的机构、产品、案例与技术能够被大众看到。

点这里👇关注我，记得标星哦～

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/68575.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

奇特！AI换脸让康熙本人出演电视剧；LLM超全综述资料；业内深聊游戏行业中AI应用实践；吴恩达联合Hugging Face再出新课 | ShowMeAI日报

奇特！AI换脸让康熙本人出演电视剧；LLM超全综述资料；业内深聊游戏行业中AI应用实践；吴恩达联合Hugging Face再出新课 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦！ 🤖 B站UP主再出「邪招」，让康熙本人出演电视剧名场面 B站UP主 PAC_松柏结合康熙画像和电视剧画面，对视频人物角色…

阅读更多...

星标破10万！Auto-GPT之后，Transformer越新里程碑

星标破10万！Auto-GPT之后，Transformer越新里程碑

来源丨新智元编辑丨桃子【导读】问世6年来，Transformer不仅成为NLP领域的主流模型，甚至成功向其他领域跨界，一度成为风靡AI界的机器学习架构。恰在今天，Transformers库在GitHub上星标破10万大关！ 2017年，…

阅读更多...

cuda各个版本的Pytorch下载网页版，还有各个链接

cuda各个版本的Pytorch下载网页版，还有各个链接

cuda各个安装包下载 https://developer.nvidia.com/cuda-toolkit-archive cuda对应的cudnn安装包 https://developer.nvidia.com/rdp/cudnn-archive cuda对应的pytorch版本包 https://download.pytorch.org/whl/torch_stable.html ChatGPT https://chatgpt.qdymys.cn/#/c…

阅读更多...

2019年房价调整是大概率事件，如果房价下跌，会出现什么问题?

2019年房价调整是大概率事件，如果房价下跌，会出现什么问题?

这里我们将没有房贷的人分为三种：一种是暂时没有能力买房但存款可观的人，一种是手上有房没有房贷的人，还有一种是既没房，没房贷，还没钱的人。首先，房价大跌，对于房地产行业的影响是十分严重的&…

阅读更多...

基础图表解读“东方甄选”爆火出圈数据

基础图表解读“东方甄选”爆火出圈数据

数据可视化越来越广泛，数据图表也越来越绚丽多彩，不管多高级多有趣的图表，都不及基础图表在图表界的地位，要说图表使用率，基础图表才是“永远的神”。接下来跟随平台用基础折线图、柱状图、面积图，来了解最…

阅读更多...

芯片算力（TOPS, GOPS, MOPS）与精度（int8，int16）

芯片算力（TOPS, GOPS, MOPS）与精度（int8，int16）

芯片算力是描述处理器进行运算，对数据进行操作的能力的指标。字面上理解，芯片算力越大，每秒能够进行的运算次数就越多，执行计算任务就越快。算力的基本单位有： TOPS：Tera Operations Per Second&#xf…

阅读更多...

十问华为鸿蒙操作系统：跟安卓有何差异，其他终端厂商怎么看

十问华为鸿蒙操作系统：跟安卓有何差异，其他终端厂商怎么看

点击上方“民工哥技术之路”选择“置顶或星标” 每天10点为你分享不一样的干货原文链接如下： https://www.toutiao.com/a6726653150180164107/ 鸿蒙”初开，万众瞩目。这款华为开发的操作系统，到底有何特别之处？ 8月9日&#xff0…

阅读更多...

RT-Thread团队回应社区关切：鸿蒙OS带来的影响-合作远远大于竞争

RT-Thread团队回应社区关切：鸿蒙OS带来的影响-合作远远大于竞争

关于HarmonyOS 2019年8月9日，华为正式向全球发布了全新的自有系统 HarmonyOS 1.0——基于微内核的面向全场景的分布式操作系统，并宣布开源；2020年9月10日，华为发布HarmonyOS 2.0，并正式开源代码。据当前开源的代码&am…

阅读更多...

100个让ChatGPT更听话的技巧之1：提出更具体的问题

100个让ChatGPT更听话的技巧之1：提出更具体的问题

你好，我是赤辰。 ChatGPT并没有万能公式，但有许多能让它回答得更高效的技巧，接下来我们每天会介绍1条让ChatGPT更听话的技巧； 下面介绍100个能让ChatGPT更听话的技巧的第1个：提供更具体的问题或指令，而非…

阅读更多...

100个让ChatGPT更听话的技巧之：提出更具体的问题

100个让ChatGPT更听话的技巧之：提出更具体的问题

你好，我是赤辰。ChatGPT并没有万能公式，但有许多能让它回答得更高效的技巧，接下来我们每天会介绍1条让ChatGPT更听话的技巧；下面介绍100个能让ChatGPT更听话的技巧的第1个：提供更具体的问题或指令，而非模糊…

阅读更多...

ChatGPT指令「万能公式」，学会这一个就是高手了

ChatGPT指令「万能公式」，学会这一个就是高手了

ChatGPT指令「万能公式」，学会这一个，你也可以是高手了这个【万能公式】ChatGPT自己总结出来的，ChatGPT提问万能公式，套用这个公式，ChatGPT给出的答案都不会差！ 直接入主题： 指令万能公式角…

阅读更多...

U盘复制文件到最后5秒会卡住怎么办解决

U盘复制文件到最后5秒会卡住怎么办解决

现在的U盘容量已经非常大了，一般都有16G以上，为了能放单文件大于4G的数据大多数时候我们都是把U盘格式化为ntfs格式的，所以会出现不管是大文件还是小文件，当你往U盘里复制文件或者使用发送到U盘功能的时候会出现一个怪现象&#x…

阅读更多...

恢复扩容U盘实际容量检查正版U盘 U盘量产工具 U盘修复工具使用方法

恢复扩容U盘实际容量检查正版U盘 U盘量产工具 U盘修复工具使用方法

来源：http://apps.hi.baidu.com/share/detail/52747794 我的U盘存东西莫名其妙的消失，检查没有坏片，最后原来是被扩容了。最后用此方法解决。4G的原来是2G，擦。现淘宝及电脑城常有奸商为求私利，不惜将U盘容量改大以…

阅读更多...

u盘拷文件提示文件过大怎么办

1. u盘常见的几种文件系统 U盘常见的文件系统及简介文件系统简要介绍传输文件大小FAT16U盘初始文件系统，现在基本不使用了 2GBFAT32相比FAT16空间利用率更高，更加稳定。但是FAT文件系统的通病是：当文件删除后写入新资料，FAT不会…

阅读更多...

u盘读写速度变慢了开始快后面特别慢卡顿解决方法

u盘读写速度变慢了开始快后面特别慢卡顿解决方法

我的是金士顿64G的U盘，刚开始买的时候读写都很快，后面有那个文件夹路径隐藏病毒（根目录显示一个“_”，需要双击这个，才能看到所有的文件），一直也没管，后面就越来越卡了好像。然后用了…

阅读更多...

记录linux使用QT检测U盘的方式

记录linux使用QT检测U盘的方式

首先认识一个linux的命令在终端输入lsblk时会得到如下结果其中sdc1是我插入的U盘，在有操作系统且正常运行的情况下，使用centos时U盘是会自动挂载到/media这个路径下的。注意：在使用ubuntu和centos时的路径有些不同，ubuntu好像…

阅读更多...

mac识别不了u盘怎么办 mac系统格式化u盘win不识别怎么回事

mac识别不了u盘怎么办 mac系统格式化u盘win不识别怎么回事

Mac系统与Windows操作系统相同，都可以连接外部硬盘或U盘并执行文件读取与写入操作，但有些Mac系统用户反馈自己的U盘插入后Mac无法识别，但是插入到Windows系统中又无问题。如果大家也有Mac识别不了U盘怎么办，mac系统格式化u盘win不…

阅读更多...

U盘容量变小了 -恢复U盘实际容量教程（亲试有效）

U盘容量变小了 -恢复U盘实际容量教程（亲试有效）

今天把U盘插电脑上，发现电脑识别出来的U盘容量变小了，原本8G左右的容量显示只有几十MB，/(ㄒoㄒ)/~~下面说一下恢复U盘容量的详细教程第一步：U盘插电脑上，做好资料备份备份好U盘里的资料接下来的操作会格式化U…

阅读更多...

u盘什么品牌质量好？这几款可以试试

u盘什么品牌质量好？这几款可以试试

u盘是很多朋友在工作和学习时都会用到的存储设备，因此质量问题是我们首先关注的问题，其实判断一款u盘的好坏，不应该只看它的价格和品牌，而是应该关注u盘的质量、传输速度、性能和数据安全程度等。结合这些因素，下面给…

阅读更多...

计算机向u盘拷贝速度慢,U盘复制速度慢的解决措施

计算机向u盘拷贝速度慢,U盘复制速度慢的解决措施

如今，U盘的使用已是时下最常用的储存工具，它的出现给我们带来了很大的方便。不过很多用户却发现，U盘使用的时间就了，U盘的传输速度就变慢了，这是怎么回事呢？U盘复制速度慢要怎么办？今天U大侠小编…

阅读更多...

最新文章

推荐文章