如何构造个人 AI 策略:从 AI 绘画的演进与 ChatGPT 现状出发?

持续关注 AI 相关探索:https://github.com/phodal/ai-research

PS:就本文的结论而言,我相信你已经或多或少的有所体会了。也因此,本文更多的是展现一个思考的过程,而不是一个纯粹的结论。

AIGC 是什么?它是指通过机器学习、自然语言处理等人工智能技术,让计算机自动生成文字、图像、音频、视频等各种类型的内容。它能够帮助企业和个人降低创作成本、提高生产效率、增强创意输出等。

开始之前,先说结论:哪怕仅就当前的 AIGC 成熟度,我们都明白:人类应该去做更高价值的事,也因此在当前的工作模式上呈现的是,三步区:

  • 蓝图设计(人类)。负责创意性的思考与设计工作,如场景、软件架构等。

  • 机械化生成(机器)。将创意借助工具或者人转换为 Prompt,然后交给 AIGC 生成。

  • 细节修复(人类)。对于 AIGC 生成不合理、不适宜法律法规等的地方,进行修改。

因此,对于诸多通用的大众领域,人类这样的碳基生物而言,如果不能从思维框架来驾驭 AIGC。而对于细分领域来说,只要在足够卷的情况下,AIGC 也会给予我们更多的惊喜。

与 ChatGPT 的黑盒相比,类似于 Stable Diffusion 白盒开源,可以让我们更了解 Prompt 应该如何编写?如何更好地利用 AIGC。所以,本文的第一部分就是从现有的 AI 绘画的变化来看,如何更好的利用 AIGC。而第二部分则是结合 ChatGPT 的现状来看,如何更好的利用 AIGC。

如何构建高质量的 AI 图形?

注意:请在取得授权的情况下,进行个人模型的练习,避免侵犯个人肖像权。

我们的例子,依旧是基于 Stable Diffusion,开源模型与开源软件才是人类的未来。太长不看图:

4348ab0df0129dafcd6545c14760516d.jpeg

Stable Diffusion 概览

对于一个绘画过程来说,我们可以通过如下的方式,逐步引导绘图应用:

  1. 编写详细的 Negative Prompt,以淘汰不合理的生成内容。

  2. ControlNet 作为基准骨架,引导最终效果,过滤不合理的图像。

  3. 训练与融合个人模型,以构建领域特定的用途。

总的来说:过滤不合理的图像,就能提升生成质量。我们就可以,设计出初步符合需求(在不看 AI 画出来的手情况下)的框架性方案。

严格化验收条件:Negative Prompt

Negative Prompt 会将模型的目标从一般的高概率生成样本转换为生成与负向提示不匹配的低概率样本,从而迫使模型更加关注图像的细节和特征,提高其生成的图像的质量和逼真度。

我们的故事依旧可以从: 微笑的女孩探出火车窗外 故事开开始,简单地翻译成英语,来作为我们的 prompt: smiling girl leaning out the train window。在只有 Prompt 的情况下,会生成各种奇怪的图形,所以我们需要添加 Negative Prompt。

所以在 Stable Diffusion 里,我们就可以通过它来提升质量:

016a26ae16902f7f3b1817ea99336a00.jpeg

Negative

而从结果来看,模型与我们想要的图,还存在一定的距离。对于 ChatGPT 也是类似的,所以我们需要相似的模式:诸如于 写一个不超过 800 字的作文,又或者是 写一个作文,要求如下:1. 不超过 800 字

构架蓝图:ControlNet 精准控线

ControlNet 是一种神经网络结构,旨在通过添加额外条件来控制扩散模型。在特定场景下,ControlNet被用于生成类似建模效果(法线贴图)的中间图和相关的图像。这种技术可以被应用于多个领域,如骨骼绑定、精准控线、线稿上色、深度图结构透视精准重绘等。

简单来说,在人像领域,通过手绘特定的姿势、从照片中解析等方式,创建一个人物姿势,绘制出来的图便采用类似的格式。如下图所示:

74a6e9c9dc9a87bd1de01b6076e1953b.jpeg

ControlNet

从形状和生成的效果来说,除了脸部等细节不是特定令人满意之外,基本能满足使用的需求。而在更好地机器加持下,我们能得到更高分辨率,就可以靠人工修复脸部的问题。

而在写作场景之下,只要我们给了 ChatGPT 大纲,那么他就能帮助我们生成文章。唯一的问题是,我们不能添加上自己的写作风格、历史作品,否则我们可以更加容易使用这个作品。而在那之前,我们需要思考什么是我们的作品?什么是我们的风格?

轻量小模型:DreamBooth 个人模型与风格化

注意:请在取得授权的情况下,进行模型的练习与作品创作。除了 DreamBootb 还有其他工具可使用,但由于时间限制,我就没有展开进一步研究。

融合个人模型是指将训练后的个人风格和特点融入到 AI 绘画模型中,使其生成的画作更贴近个人风格和需求,提高生成画作的个性化和定制化。

诸如在 Stable Diffusion 中,我们可以用自己的头像结合 DreamBooth 等工具训练,以得到一个融合自己风格的模型。在二次元世界里,最常被使用的是 "个人头像",以用于生成动漫或者 idol。效果如下:

32a3bf0f0e94fe03ede1f2833a8d14b3.jpeg

DreamBooth

PS:在取得某人同意的情况下,放一张动画化的结果(当然了,取的是不像本人的照片):

5174d0f4b2567c5024ff071bae801a8b.jpeg
Final

在 Stable Diffusion 的模型尝试之后,我们可以发现:云 GPU + 模型可插件化 + 算力要求逐步下降之后,会使得个人的小模型会变成越来越普及,所以我训练的模型也只在云上跑了几分钟。

完善与细化:局部绘制 —— InPaint 的手部修复

众所周知,当前的 AI 绘图还存在诸多细节问题,比如手、脚等,因此需要一定的人类修复画师。又有一部分人自此成为了服务于 AI 的打工人。如下是使用 InPaint 修复手部时生产出来的,人类画师就需要从中挑选出合适的照片:

0e9159ff135871d81811258d7185148a.jpeg

最后,总算,先找到一张可以凑合着交差的:

fcf9e97f1746fa12cf87e83f8934d856.jpeg

除此,还可以选择对图形进行裁剪,或者使用 Photoshop 等工具进行重绘等。

小小的总结:严格化验收条件 + 构架蓝图 + 轻量小模型 + 完善与细化

要想清晰的表达自己的需求,我们需要:

  • 严格化的验收条件,即通过 Prompt 描写需求,通过 Negative Prompt 排除异常

  • 表达构架蓝图,即通过 ControlNet 创建所需要的内容骨架,控制

  • 轻量的领域小模型,即通过 DreamBooth,结合灵活的架构模型,来丰富 AI 模型。

  • 完善与细化,即通过 InPaint 对有缺陷的部分进行修复,如局部绘制。

当然了,在 Stable Diffusion 里,还可以通过 Inpaint 等方式进行修复。

个人 AI 策略:构架 + 磨炼 + 小模型

在先前的两篇文章里,我们已经不断地在探索适合于个人的 AI 策略:

  • 《基于编程、绘画、写作的 AI 探索与总结》

  • 《Prompt 编写模式:如何将思维框架赋予机器》。

对于我来说,我的 AI 策略大致是:

  • 强化构架能力。强化架构设计、软件设计、抽象设计等。

  • 构建小模型。在未来合适的时候,诸如于合适的开源 GPT 等。

  • 探索与磨炼技巧。探索更多的 AI 解决方案,如 Notion AI 等;持续探索 Prompt 模式等。

对于修复与完善来说,由于 AI 本身是无法达到这么精细的,所以我的想法是持续构建小工具

策略 0:拥抱变化

首先,我们要理解 AIGC 真的带来变化,尽管现今的 AI 并不能完整的代替我们,但是已经能大大提升效率。

作为一个知名的 “开源挖抗” 作者,在我使用 GitHub Copilot 的初期,觉得这 TM(Trademark) 就是一个智障。而我适应了:如何与智障沟通之后,我悟了,我才是 ”智障“ —— 只有理解机器的 API 与工作方式,才能利用好机器。

策略 1:强化构架能力

AI 工具无法替代个人的感性思考和直觉,所以个人在设计过程是非常重要性的。

强化设计是指通过 AI 技术释放个人的创造力,帮助个人在设计中实现更高效、更优质的创造成果。这个策略的核心在于使用 AIGC 工具来自动生成大量的创意元素,例如图像、文字、音频等,从而将创造的效率提高到一个新的水平。

在实践中,个人可以通过以下方式强化自己的构架能力:

  • 持续学习新的设计理念和创意方法,不断拓展自己的知识面和视野。例如,了解一些新兴的设计趋势,学习如何将传统的设计元素与现代的技术手段相结合,从而创造出更有创意和张力的作品。

  • 坚持思考和探索,不断挑战自己的思维方式和想象力。通过不断思考和实践,将自己的思维方式和想象力逐渐转化为可操作的设计构架,从而在 AIGC 工具的帮助下实现更高效的创造。

除此,我们还应该熟练掌握使用 AIGC 工具的方法,尤其是一些高级的特性。例如,对于文本生成任务,可以使用 Negative Prompt 等技巧提高生成的质量;对于图像生成任务,则可以使用 ControlNet 等技术实现更精准的控制。

策略 2:构建领域小模型

PS:此处需要持续寻找合适的工具,就当前而言,只有 AI 绘图领域是相对比较成熟(可用)的。

每个人的知识面是不同的,知识体系也是不同的。因此,我们不能期望一个通用的大模型能够满足所有人的需求。相反,我们应该尝试构建适合自己领域的小模型。通过选择合适的数据集、算法和网络结构,我们可以快速训练出一个专门用于解决自己问题的小型模型。这个模型不需要太复杂,只需要满足自己的需求即可。这样可以提高模型的效率和准确度,并且减少训练时间和计算资源的消耗。

例如,对于一个博客作者来说,可以使用 GPT-3 来帮助自己快速生成博客文章的开头或结尾段落,也可以通过训练自己的小模型,生成符合自己风格的文章内容。对于一名摄影师来说,可以通过构建小模型来辅助自己完成相册的排版、图像剪辑等工作。

所以,对于而言,我有 900+ 的博客,从中训练出来的写作风格,大概是能像我的 —— 也存在不同时机的风格不一样的问题。

策略 3:探索与磨炼技巧

对于探索而言,也是最近才有时间和精力去探索,加入了公司的相关讨论群后,也获得了更多的输入。只是对于我来说,更多的是想把 AI 融入到日常事务中,以提升工作效率,所以也不想去创建微信群。

对于技巧来说,其实更多的是要去理解 AI 是如何 work 的,并将这种模式整合到自己的思维方式里。

除此,我们还可以思考如何将思维框架赋予 AI,以完成更闭环的工作。诸如于 GitHub Copilot 可以帮我们写代码,但是无法从宏观上理解业务问题、整体性的架构问题,生成的代码只是从局部考虑的。因此,我们需要通过不断地磨炼自己的技能和能力,来提高自己的综合素质和创造力。如我正在持续丰富的 phodal/prompt-patterns 也算是我的磨炼技巧。

小结

最后,再让 AI 总结一下四个策略:

  1. 拥抱变化,尽管人工智能并不能完全代替人类,但它已经能够大大提高效率。

  2. 强化构架能力,因为人工智能工具无法代替个人的感性思考和直觉。

  3. 构建领域小模型,可以快速训练出一个专门用于解决自己问题的小型模型。

  4. 探索与磨炼技巧,探索 AI 能力并持续构建小工具,来修复和完善自己的 AI 增强系统。

结论,AI 在短期内还是智障,但是已经可以大大提升效率了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/26282.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何利用CPU Cache写出高性能代码,看这些图就够了!

世界就像个巨大的马戏团,它让你兴奋,却让我惶恐,因为我知道散场永远是——有限温存,无限辛酸。——卓别林 我们平时编写的代码最后都会交给CPU来执行,如何能巧妙利用CPU写出性能比较高的代码呢?看完这篇文章…

对视频剪辑应用灰度图像变换+Moviepy生成灰度视频处理遇到几个有意思的问题

一、引言 最近在学习图像处理的《直方图处理》,对直方图均衡处理效果感觉非常有用。 以前学习Moviepy音视频剪辑时,用的卓别林的一个黑白视频片段,感觉视频的噪点比较多,画面也整体偏暗,不禁想看看如果对其进行直方图…

大厂正在「去大厂化」

大厂逐渐不再是「大厂」。 撰文 | 佘宗明 大厂还值得去吗? 这成了摆在很多年轻人面前的问题。 搁几年前,这都不能称之为问题。 扁平化管理、快速上升空间、弹性工作制……比JK制服还诱惑。「财务自由」的召唤,更是胜却人间无数情怀。 那现在呢…

无心剑中译伊玛·拉扎罗斯《新巨人·自由女神》

文章目录 无心剑中译伊玛拉扎罗斯《新巨人自由女神》译友们中译伊玛拉扎罗斯《新巨人自由女神》1. 岩子版2. MNES版3. 天河版4. 铁冰版5. 好好做虾版6. 愚冠版卓别林十大经典语录卓别林最伟大的演讲《为自由而战斗》无心剑中译迈克尔杰克逊《自由无拘束》《被讨厌的勇气》- 什么…

当我真正开始爱自己——查理·卓别林

As I began to love myself I found that anguish and emotional sufferingare only warning signs that I was living against my own truth.Today, I know, this is “AUTHENTICITY”. As I began to love myself I understood how much it can offend somebodyAs I try to f…

快速做出原型

给定五六个维度约束下对比两个软件的表现,要用数据说话。这五六个维度,不限于丢包率,固有延时,抖动等。 若两个维度,一张表格即可展现,若四个维度,一个四维立方体可以展示,二维单元…

moviepy第一天|模糊视频中卓别林的头,并添加一个文本生成的结尾clip,同时保留音频

MoviePy(完整文档)是一个用于视频编辑的Python库:剪切,串联,标题插入,视频合成(又名非线性编辑),视频处理和创建自定义效果。有关一些使用示例,请参阅库。 MoviePy可以读取和写入所有最常见的音频和视频格式,包括GIF,并在Windows / Mac / Linux上运行,使用Python …

《新摩登时代》:卓别林演绎共识与同步流程优化

FISCO BCOS是完全开源的联盟区块链底层技术平台,由金融区块链合作联盟(深圳)(简称金链盟)成立开源工作组通力打造。开源工作组成员包括博彦科技、华为、深证通、神州数码、四方精创、腾讯、微众银行、亦笔科技和越秀金科等金链盟成员机构。 代码仓库:htt…

卓别林论Scrum价值观:当我真正开始爱自己

As I began to love myself 当我真正开始爱自己, I found that anguish and emotional suffering are only warning signs that I was living againstmy own truth. 我才认识到,所有的痛苦和情感的折磨,都只是提醒我:我的生活违背…

当我开始爱自己——卓别林

当我真正开始爱自己, 我才认识到,所有的痛苦和情感的折磨, 都只是提醒我:活着,不要违背自己的本心。 今天我明白了,这叫做 『真实』。 当我真正开始爱自己, 我才懂得,把自己的…

前端每日挑战の纯CSS画卓别林

前端每日挑战の纯CSS画卓别林 内容摘要内容学习代码 内容摘要 伤心啊,写了好几天博客没人看~不过没关系,写博客的主要目的还是为了技术积累。在segmentFault上看到有前端每日专栏,觉得不错,正好css基础还不够巩固决定跟着该专栏每…

程序员与卓别林

时代变迁,许多电影已经过时了,被人们遗忘了,然而,总有几部电影,还留着人们的记忆中。因为人们认为,它们具有不可磨灭的精神价值。这些电影,就是我们常说的经典电影。《摩登时代》,就…

FISCO BCOS 《新摩登时代》:卓别林演绎共识与同步流程优化

作者:石翔|FISCO BCOS 核心开发者 共识与同步的流程优化,是FISCO BCOS性能优化迈开的第一步。仅依靠这一流程优化,就给系统TPS带来可观的1.75倍提升。但这不是目的,其目的在于确定了共识的主导地位,排除了…

脏话越多,代码越好!

👇👇关注后回复 “进群” ,拉你进程序员交流群👇👇 作者丨程序员月亮 来源丨了不起的程序员(ID:great_developer) 你好呀,我是月亮,一个90后的老程序员啦~ 平…

基于langchain 的文档问答 最佳实践(附源码)

文档问答的原理 文档读取并切割,用句向量 向量化,存入向量数据库问题向量化,在向量数据库中进行相似性检索,并存出top K把问题和top K 答案组成 prompt 并发给大模型,等大模型答案 这里面涉及到的技术点有&#xff1a…

chatgpt赋能python:Python为什么闪退?

Python为什么闪退? Python作为一种高级编程语言,已经赢得了世界各地许多开发者的青睐。但是,有时候Python会因为各种原因而突然闪退,给开发者带来极大的困扰。那么,Python为什么会闪退呢? 1. 内存泄漏 内…

Trexquant | 量化多岗位招聘(全职+实习)

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W关注者。 具体投递方式 投递邮箱 tqchina_resumetrexquant.com 简历命名 岗位-姓名…

京东各大城市内推岗位(2021.2.7更)

北京: 上海: 广东: 四川: 重庆: 暂无 杭州: 暂无 陕西: 湖北: 湖南: 暂无 岗位每周更新一次 因为内推系统只能以省份维度查看,想了解具体城市和岗…

北京内推 | 京东营销与商业化中心招聘NLP算法工程师/实习生

合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 京东 京东营销与商业化中心(原商提广告部)成立于2014年初&#xff0…

【CSDN雇主招聘】深信服科技带着高薪岗位JD和公司周边来啦

为了帮助企业更好的应对用人难的挑战,CSDN面向所有企业全新升级了CSDN2022雇主品牌计划,在企业发展、吸引人才、连接人才、宣传公司多个维度提供专属的支持。 ————本次为深信服科技专场———— 直播主题:《CSDN雇主品牌-深信服招聘专场…