摄影师没了?!生成式人工智能即将降维打击摄影行业

本文是Mixlab无界社区成员的投稿:

90fce831638f5bbb7019fe0d3eebd3d1.png

滚石

deepfacelab和deepfacelive项目组成员

摄影师失业了??怎么说?

#

#

你还以为AI绘画影响的只是插画师行业吗?错了,摄影行业也即将面临技术洗牌。话不多说,先看一下这几张图

d95022ef383884209798dbeaccda678a.jpeg

25845364540ba50d07aa915db4920662.jpeg

你能一眼看出这是AI画的迪丽热巴吗?你是不是还以为AI绘画只能画点动漫艺术风格?那你就低估了AI的发展速度!

ffa796bb578577d3abe9969a75f53473.jpeg

随着stable diffusion开源社区的发展,生成真实性的画风已不是难事,随便挑选几张国外大神AI绘画作品,这真实程度和光影表现力,恐怕很多入门摄影师都自愧不如吧。

67214044071965bfa1b693340d62e4ab.jpeg

770f39a20c066a5bb14e52907149c70d.jpeg

更令人惊讶的是,生成这种高质量写实照片的成本非常低,用别人训练好的模型的话,自己加点描述词(prompt)几秒种就生成好了。如果想要自行训练一个指定人物的模型,也只需要采集几十张目标人物照片,用显卡训练1小时就完成了。

例如文章开头迪丽热巴的照骗,就是我采集了约100张迪丽热巴照片,仅训练1个小时后出来的结果。相比实地拍摄,用AI生成的方式“摄影”可以说是非常高效率的一件事。

教你怎么实现

如果你从来没在本地电脑玩过AI绘画,那总流程大约耗时3小时,需要花点时间先安装软件和熟悉软件。如果你已经在本地玩过AI绘画,那总流程大约耗时90分钟,其中半小时准备素材,1小时挂机训练模型。可以直接跳到第2步浏览。

1. 安装AI绘画软件

本地AI绘画软件用的最多的是基于stable diffusion这个开源项目做的webui可视化工具,已有B站大佬将其做成了中文页面启动器的一体包,无需自行安装环境,非常好用。下载地址(回复关键词:1111软件包)

2. 下载写实基础模型(base model)

有了软件后,还需要准备基础模型。一个好的基础模型在特定风格图像上生成更好的效果。模型可以到civitai.com 这个网站进行浏览与下载各式各样的模型。

对于生成写实性的图,推荐以下几个模型作为基础模型:

https://civitai.com/models/6424/chilloutmix

https://civitai.com/models/4201/realistic-vision-v13

3. 训练素材搜集与LORA模型训练

什么是lora模型?lora模型可以简单理解为在基础模型至上的一个补丁模型,用来训练特定风格、特定人物、特定动作等效果的模型。因为基础模型提供了强大的通用能力,但对于指定人物、或者特定的一种风格掌握的并不精,所以需要lora模型来针对性学习下特定领域的效果。

至于训练素材,大家就各显神通了,通过各种手段,准备几十张目标图片就行。训练对硬件配置稍微有点要求,英伟达显卡,显存8G以上。训练时间大约1小时

4. 使用Lora模型生成照片(照骗)

如果你用的是最新一体包,已经是内置了lora插件,只需要把训练好的lora模型,放到一体包安装目录下.models/Lora 里,即可在webui中刷新可见。

如果你用的是老版本lora插件,请按照老版本lora插件的用法,把模型放到指定位置

以下我以文生图为例,演示下lora模型使用方法

b8408085b9f0fede3fe4e4f6355c8120.jpeg

  1. 点击1处打开额外插件

  2. 切换到lora选项卡

  3. 点击训练好的lora模型(默认是无封面图的,可以在生成后拿结果图替换为封面图)

  4. 在tag词中自动加入了对应词条,修改其数值权重,推荐0.5-0.7

  5. 设置其他采样、数量、分辨率等参数,点生成

  6. 等待几秒后,就能在生成结果里看到效果

当然你也可以图生图中用lora模型,例如用一张证件照组参考生成迪丽热巴证件照。

1cb35768b9531721f4d831617aa5ee67.jpeg

如果觉得AI画的衣服细节(如扣子)形状不太真实,你也可以用局部重绘来保留原有图的其他部分,只换脸。

fe55b3617f88d51337d767eeaa1e148d.jpeg

我猜肯定也会人说,AI画的动作姿势不一定是摄影师想要的,能否让AI指定人物动作呢?当然也可以。

可以用张吕敏大佬最近发表的controlNet插件,做到通过骨骼pose图、线框图、深度图、法线图、涂鸦图来精准控制画面人物的姿势。

9478da5d38614e8c6e8b889e402ec64c.jpeg

AI 绘画引入 ControlNet

将会带来哪些影响?

对摄影的影响

lora模型与controlNet的出现,基本宣告摄影界将迎来一种全新的摄影流派——AI流。

我拿个亲身案例来说,我跟老婆去拍婚纱照:

传统流程:约摄影师->商量拍摄风格->找场地->准备服化道->准备相机灯光器材->现场实拍一天->第二天粗选图->再一周精修图

前后忙活好几天,外景婚纱照出来后,我流下了悔恨的泪水,这拍的什么90年代乡土风情?尴尬的动作、粗糙的服化道、流水线的美颜、预设的调色滤镜。就这么一套垃圾花了我6000,重拍得重新交钱。

如果采用AI流派,那流程将是:

AI流摄影:约摄影师->随便找个地方实拍->训练LORA模型->模特与摄影师一起调描述词调姿势调背景-> ps微修下bug

整个从下单到拿到成片,时长1天以内。并且不用麻烦模特,电脑上任意切换服化道、场景、动作、表情、光影、相机镜头焦距,直接效率起飞,超低修改成本,改到模特满意为止。

我甚至可以给自己加点吴彦祖风格、给老婆加点杨幂风格,这出来的效果岂不臭美一辈子?

其他领域的影响

当大家看着插画界的AI替代狂潮幸灾乐祸时,不妨目光放长远多思考下自己行业AI的危和机。

蒸汽纺织机出现了,工业革命还会远吗?

不要浪费精力找茬说AI画手指不好、画细节不符合物理等小细节上,我承认这些瑕疵确实还有,但你要看他的发展趋势,这是5年前AI绘画效果,再对比现在的AI绘画效果,你就知道5年前说AI绘画无用论的人是多么目光短浅了

3601247bb87dd8462a16fceaf5f96fb4.jpeg

搬出我5年前做的预测,如今也都一一成为了现实

滚石:人工智能辅助服装设计

滚石:人工智能对传统设计流程的影响

对各个设计子领域,AI绘画+lora模型可以帮你快速出各类效果图,什么产品外观、汽车外观、建筑设计、包装设计统统不在话下。

对于协作领域,chargpt的威力大家有目共睹,身边做跨境电商的朋友已经开始用它写地道英文文案,比兼职印度妹子写的还好。

对影视制作领域,AI生成视频也已经是学术界热门研究课题。流浪地球2 就用了我们deepfacelab开源项目实现年轻版吴京。

对游戏开发领域,网易逆水寒已经出现了chatgpt式互动NPC。

对于电商领域,特看科技也有短视频数字人、直播数字人等代替主播的产品。

对于福利姬领域,pateron上已经出现了AI赛博福利姬,订阅量还不少。

...

对于你的领域呢?

e2478caaa15d9ac1a31f5edff484695f.jpeg

fe1797aeddd6344b34a0db8e0b3638ff.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21592.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AIGC绘就无限可能的元宇宙

随着科技的飞速发展,我们正逐渐步入一个由虚拟和现实交织构成的全新时代。元宇宙(Metaverse)作为这个新时代的象征,正在成为一个重要的热点。而人工智能生成内容(AIGC)技术的结合,将无疑会推动元…

开发者出海合规手册;@levelsio独立开发月入20万解析;MJ+AR设计珠宝;SD算法原理-通俗版 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 独立开发者必看,出海应用开发者合规手册 这是 JourneymanChina 多年出海经验教训的总结,适用于Google Play 以…

ChatGPT唤醒AI游戏?

配图来自Canva可画 “七天制作新游戏”、“AI全自动完成所有游戏!”......继各种AI绘画、AI合成照片、视频之后,AI在游戏领域开启了新一场狂欢。 长久以来,游戏和AI一直有着“相互扶持”的亲密关系——一边是游戏充当AI科研基地&#xff0c…

网易的“草长莺飞二月天”:增长稳健,加码研发,逐浪AI

2月23日,网易发布了2022年第四季度财报。 这是网易与暴雪分道扬镳后的首份财报,加上近期AIGC热度扩散至游戏、教育等各个领域,网易第四季度业绩及其对于GPT等热门技术的探索受到市场关注。 根据财报,第四季度,网易营…

「经济理财」32堂你能听懂的理财课

之前学了一下基金投资课程,作为以后财富管理的积累,可以出门右转看「银行螺丝钉的基金投资课」。但还是觉得应该系统了解一下理财,从小白到理财达人,我需要半年来学习和实践,比较好的是接触到简七理财,结合…

[AI医学] 医学领域几个微调预训练大模型的项目

关键词:AI医学,医学大模型,指令微调,PubMed 文章目录 医学微调大模型1. MedicalGPT-zh2. DoctorGLM3. Huatuo-Llama-Med-Chinese & ChatGLM-Med 医学预训练语言模型1. BioMedLM (2.7B)2. PMC-LLaMA (7B)3. BioMedGPT (1.6B) 总…

程序员专属对联

请欣赏“程序猿春节对联集锦”: 对联一 上联:上拜图灵只佑服务可用 下联: 下跪关公但求永不宕机 横批:风调码顺 风调雨顺 上拜图灵只佑服务可用 下跪关公但求永不宕机 对联二 上联:屏中创造繁华世 下联:指尖…

Node接入ChatGPT 的最强对手Claude

由于个人的chatGPT免费版本即将到期, Claude 很火,在网上被说成是 ChatGPT 的最强对手,是 ChatGPT 的替代品。本文我将介绍下 Claude 是什么,以及如何免费使用 Claude. 什么是Claude 看一下它是如何自我介绍的 Slack Slack 是一款流行的团…

读《EMOQ-TTS: EMOTION INTENSITY QUANTIZATION FOR FINE-GRAINED CONTROLLABLE EMOTIONAL TEXT-TO-SPEECH》

0 Abstract 虽然近年来文本到语音(TTS)的研究取得了显著进展,但仍局限于情感语音合成。为了产生情感话语,大多数作品都利用了从情感标签或参考音频中提取的情感信息。然而,由于话语层面的情绪条件,它们导致了单调的情绪表达。在本…

专家担心 ChatGPT 很快会被用于毁灭性的网络攻击

听到这个新闻,我是挺震惊的,​ChatGPT 近几个月来风靡全球,但就在它以其技术能力让人们惊叹的同时,也有人对其潜在的滥用提出了担忧。 现在,似乎一些 IT 领导者担心它将很快被用于重大网络攻击,并有可能在未…

英文润色网站-英文质量改写改进软件

英文改写软件 英文改写软件是一种全新的工具,它可以方便快捷地对不同语种的图文内容进行批量改写和转换,包括但不限于英语、法语、德语、中文等。无论用户需要将哪种语言的文章进行改写和转换,都可以轻松实现。该软件支持任何文档格式和文本…

OpenAI Translator Bob Plugin Bob上一款翻译、润色、语法修改插件

OpenAI Translator Bob Plugin 一款可以在Bob进行即时翻译的插件。它基于 OpenAI 的 GPT 系列模型,能够提供高质量、准确的翻译服务。该插件支持多种语言的翻译,包括中文、英文、法语、德语、日语等。用户只需在页面中选中需要翻译的文本,然…

pg数据库数据导出

首先得在postgresql的安装包下找到bin目录,找到路径。其次在cmd下面,输入导出路径: 导出数据库的命令: > pg_dump -U postgres -h ip地址 数据库名> f:\data\数据库名.dump >口令:密码

如何进行数据的导出?

如何进行数据的导出? 以前有进行过填写资料并且把资料导出Excel表格,当时就觉得好神奇,又想知道这样的功能是怎么实现的,可是那时的头脑简单,没有知道答案,可是现在我终于知道为什么可以直接导出数据了&am…

图像搜索:以图搜图

以图搜图 随着数字时代的到来,单单的文字搜素已经无法满足人们的搜索了,图像搜索,甚至是视频搜索都已经比较成熟。本文大致讲解下图像搜索: 发展历程 原理 搜索项目:主要分为三个部分——图像特征抽取,构…

图片搜索引擎网站大全,以图搜图网站

当我们需要搜索一些图片的时候使用图片搜索引擎网站可以帮我们更快地找到自己需要的图片,那么有哪些图片搜索引擎网站可以搜索图片呢?下面小编就来和大家分享几个以图搜图的网站。 1.百度图片搜索引擎网站 百度是最大的中文搜索引擎,百度的图…

查找照片的来源

想要知道照片的来源,可以使用百度识图或其他识图工具,但得到的信息可能不多,不过还可以通过多种手段获取更多信息。 以以下照片为例,查找是哪家麦当劳。 (1).进入电脑pc端,右键单击照片&#xf…

如何使用谷歌“以图找图”图片搜索功能

谷歌不愧为搜索界的大佬,谷歌在前几个月开放了一个新功能,叫做“图像搜索”,也就是说,可以用图片搜索到图片,图片可以是网络链接的,也可以是上传的。有了这个功能后,人肉搜索 又上了一个新的层次…

BERT模型解析

1. 概述 Bidirectional Encoder Representation from Transformers(BERT)[1],即双向Transformer的Encoder表示,是2018年提出的一种基于上下文的预训练模型,通过大量语料学习到每个词的一般性embedding形式&#xff0c…

接入 GPT-4 的 AI 虚拟女友,一周狂挣 50 万!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 随着 ChatGPT 的爆火,互联网上也衍生出不少令人直呼脑洞大开的 AI 应用。 最近,国外一位名为 Caryn Marjorie 的小姐姐搞了个骚操作,基于 GPT-4 调教出来…