AI时代-普通人的AI绘画工具对比(Midjouney与Stable Diffusion)

AI时代-普通人的AI绘画工具对比(Midjouney与Stable Diffusion)

  • 前言
  • 1、基础对比
    • Stable Diffusion(SD)
      • SD界面
      • 安装与使用SD
    • Midjouney(MJ)
  • 2、硬件与运行要求对比
    • Stable Diffusion硬件要求
      • 内存
      • 硬盘
      • 显卡
    • Midjouney硬件要求
      • 要求1
      • 要求2
      • 要求3
  • 3、操作(使用)难度对比
    • Stable Diffusion
    • Midjourney
  • 4、出图效果对比
    • Stable Diffusion
    • Midjouney
  • 总结

前言

在当前技术环境下,AI大模型学习不仅要求研究者具备深厚的数学基础和编程能力,还需要对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法,AI大模型学习能够不断提升模型的准确性和效率,为人类生活和工作带来更多便利。

2023年被视作人工智能领域的爆发之年,以ChatGPT为代表的AI模型如同雨后春笋般迅猛增长。基于AIGC(人工智能内容生成)技术的各类产品纷纷涌现,尤其是众多的AI绘图模型,例如Midjourney、Dreambooth、Novel AI和Stable Diffusion等,它们在社会上得到了广泛的应用。
虽然AI绘图领域,看似进入了百花齐放的时代,但目前业内的顶流,仍然是Stable Diffusion和Midjourney为代表的两大龙头。
希望大家看完这篇博客之后能够选择更为适合自己的AI绘画工具!

博主 DTcode7 带您 溺亖在知识的海洋里,嘿嘿嘿.~
🐒 个人主页—— DTcode7 的博客 🐒
《微信小程序相关博客》
《Vue相关博客》
《前端开发习惯与小技巧相关博客》
《AIGC相关博客》
《photoshop相关博客》
😚 吾辈才疏学浅,摹写之作,恐有瑕疵。望诸君海涵赐教。望轻喷,嘤嘤嘤 🙈
🕍 愿斯文对汝有所裨益,纵其简陋未及渊博,亦足以略尽绵薄之力。倘若尚存阙漏,敬请不吝斧正,俾便精进!

1、基础对比

Stable Diffusion(SD)

它由创业公司Stability AI与多个学术研究者和非营利组织合作开发。目前的SD的源代码和模型都已经开源,在Github上由AUTOMATIC1111维护了一个完整的项目,正在由全世界的开发者共同维护。
SD最大的特征,就是由于其开源的特性,可以在电脑本地上离线运行。

敏锐的捕捉关键词:
【开源】—>【免费】
【本地离线】—>【可以嘿嘿嘿不用担心社死】

SD界面

在这里插入图片描述
对于我这种白嫖党还是很友好的,基本有台电脑就能玩(你要想炼丹,那还是搞张40系吧)
简单提一嘴如何去安装:

安装与使用SD

很多大佬都弄了sd的启动器,比如:
在这里插入图片描述

详细可以参考这篇博客: stable diffusion webUI之赛博菩萨【秋葉】——工具包新手安裝与使用教程

Midjouney(MJ)

Midjourney是一款由总部位于旧金山的独立研究实验室Midjourney, Inc.创建和托管的人工智能程序和服务。Midjourney基于【Discord平台】提供服务,可以根据语言描述prompt(被称为“提示词/关键词”)生成图像,也支持图生图,AI扩图,图生文等功能。

使用MJ需要登陆Discord账号,在聊天界面发送指令后就可以直接在线得到AI图像。

Discord账号需要科学上网,而且MJ是需要马内才能使用的,30$起步,找人拼车会便宜一些。
在这里插入图片描述
在这里插入图片描述

敏锐的捕捉关键词:
【基于Discord平台】—>【有一定注册门槛】
【科学上网】—>【魔法无处不在,麻瓜速速退散】
【马内】—>【需要钞能力才能使用】

先不说MJ的注册翻墙就拦住了一大批人,每月的刀乐就是一笔不小的开支,对于新手很不友好(主要是俺穷啊~阿米诺兹!)

2、硬件与运行要求对比

Stable Diffusion硬件要求

【硬件要求较高】:这项技术或软件需要本地独立显卡,对硬件配置有较高的要求。尽管仅使用CPU也可以运行,但速度会相对较慢。

【部署相对麻烦x】:环境设置较为繁琐,需要从GitHub上下载许多文件,并且需要一定的Python知识。然而,国内的技术专家已经制作了整合包,可以简化部署过程。用户只需从网盘下载并一键安装即可。例如上面说的秋叶菩萨。

【可完全本地运行】:该技术或软件可以在没有网络连接的情况下完全在本地运行,数据仅存储在本地计算机上,只要拥有相应的硬件,就可以无限期地使用。

建议使用windows10、windows11。

内存

8GB以上,建议使用16GB或以上的内存。在内存比较小的情况下,可能需要调高虚拟内存,以容纳模型文件。

硬盘

40 GB 以上的可用硬盘空间,建议准备60GB以上空间,最好是固态硬盘。

显卡

最低最低需要显存2GB,建议显存不少于4GB,推荐8GB以上。

至于显卡型号方面,很不幸地,因为需要用到 CUDA 加速,所以只有英伟达显卡支持良好。AMD可以用,但速度明显慢于英伟达显卡,当然,如果你的电脑没有显卡也可以用 CPU 花几百倍时间生成。(无脑N卡好吧~)

Midjouney硬件要求

要求1

魔法

要求2

魔法

要求3

还是tm的魔法

MJ其实就是个网页,服务都在人家手里,你就是访问网站直接使用罢了,能有啥配置要求,哈哈。

【无硬件要求】:该技术或软件对本地硬件性能没有特定要求,只要能够使用Discord,就能在其几乎所有设备上运行。

【部署极为简单】:使用这项技术或软件非常简单,只需打开Discord即可立即开始使用,几乎没有任何技术门槛。

【必须联网运行】:该技术或软件需要全程联网才能运行,数据存储在服务器上,而不是本地保存,因此无法在离线状态下使用。

3、操作(使用)难度对比

Stable Diffusion

使用难度较高。Stable Diffusion的界面有很多内容。由于是开源软件,SD一直在更新,并且会有源源不断地便捷插件导入。如果想要熟练操作,需要花费一定时间进行深入学习。

由于俺是白嫖怪,所以我当然是用过SD啦,已经有一些浅显的见解和心得,可以参考这几篇博客:

stable diffusion 提示词进阶语法-学习小结

stable diffusion 提示词进阶语法-年龄&身材&肤色-学习小结

基础使用可以看看秋叶大佬的说明图:
在这里插入图片描述

Midjourney

使用难度较低。基本只要了解几个快捷命令,然后输入提示词就可以进行出图操作。相对SD上手速度快了很多。说的难听一点,只要你会打字,那就能使用,因为只需要往输入框输入描述,回车,就能得到多张效果还不错的图片了。
在这里插入图片描述
在这里插入图片描述

4、出图效果对比

Stable Diffusion

都说是炼丹、抽卡了,你觉得SD的出图能有多稳定,哈哈,基本就是走量,然后拼运气,抽到你满意的图。
不过,现在已经有很很多大佬在做优化,比如controlNet等,学习这些插件之后,就能很好的保证多张图能有较高的一致性(就是有些学习成本)

而且,绝大多数人的SD都是用来跑妹子的,嘿嘿嘿,SD+Controlnet无疑是上限和自由度更高的,提示词百无禁忌,可以跑绅士图,海量主模型和LoRa可以满足各路LSP的XP,如果找不到还可以自己训练。缺点也很突出,提示词门槛高,手部问题,Lora的兼容性等等。

Midjouney

Midjouney的效果是真的好,提示词门槛低,不需要特别精细的描述也可以出不错的图。 缺点是画面不太受控,而且被BAN的敏感词非常多,像bare,nude这类词就用不了。
但是,MJ的出图速度、效率都是很高的,只要你脑洞够大,用MJ绝对很划得来。
比如你想画一幅川普的AI图像,就能通过MJ很快得到一个非常非常真实的图像:
在这里插入图片描述

总结

MJ:
使用群体:更偏向大众化,适合那些出于兴趣、好玩、需要简单AI辅助寻找灵感、开课收割或者客户需求不特别细化的情况。
优点:能快速解决用户的需求,帮助缓解相关从业人士的焦虑。
缺点:需要付费,且可能存在一定的随机性或概率试错,导致结果上下波动。

SD:
使用群体:更偏向精准化,适合各类人群,因为可以产出不同内容,满足多样化需求。
优点:从商业化角度看,更适合作为商业服务,因为它可以根据具体需求定制化,这是客户愿意为之付费的重要原因。
特性:是在本地运行的服务,开源但门槛较高,可实现的效果上限极高。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/292275.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL开窗函数

测试环境:mysql8.0.18 官方文档:https://dev.mysql.com/doc/refman/8.0/en/window-functions.html 一、窗口函数介绍二、语法结构三、自定义窗口1.rows(重点)2.range3.默认窗口 四、常用窗口函数示例1.row_number & rank &…

开源推荐榜【Taichi 专为高性能计算机图形学设计的编程语言】

Taichi是一个高性能的并行编程语言,它被嵌入在Python中,使得开发者能够轻松编写可移植的、高性能的并行程序。这个库的核心优势在于它能够将计算密集型的Python代码在运行时通过即时编译器(Just-In-Time, JIT)转换成快速的机器代码,从而加速P…

吴恩达2022机器学习专项课程(一) 4.1 梯度下降

问题预览 梯度下降算法的作用是?梯度下降的过程?梯度下降和最小化成本函数的联系?所有的成本函数都是一个形状吗?在非凸形状中,梯度下降的更新过程是?在非凸形状中,不同的初值对最小化成本函数…

使用itext-core生成PDF

1、添加引用依赖包 <dependency><groupId>com.itextpdf</groupId><artifactId>itext-core</artifactId><version>8.0.3</version><type>pom</type></dependency> 2、上代码 package com.student.demo.pdf;impor…

011_string_and_cell_in_Matlab中的字符串与元胞数组

Matlab中的字符串与元胞数组 1. 字符串 1.1 为什么 这两个东西拉在一起讲&#xff0c;是因为在2016a之前的Matlab中&#xff0c;要表示一个字符串的数组&#xff0c;只能用元胞数组。 最初的字符串在Matlab中的类型是字符&#xff0c;在Matlab中&#xff0c;一个字符就是一…

Sentinel原理及实践

Sentinel 是什么 Sentinel 是面向分布式、多语言异构化服务架构的流量治理组件&#xff0c;主要以流量为切入点&#xff0c;从流量路由、流量控制、流量整形、熔断降级、系统自适应过载保护、热点流量防护等多个维度来帮助开发者保障微服务的稳定性。 为什么使用sentinel&…

解决前后端通信跨域问题

因为浏览器具有同源策略的效应。 同源策略是一个重要的网络安全机制&#xff0c;用于Web浏览器中&#xff0c;以防止一个网页文档或脚本来自一个源&#xff08;域、协议和端口&#xff09;&#xff0c;获取另一个源的数据。同源策略的目的是保护用户的隐私和安全&#xff0c;防…

基于Spring Boot的在线学习系统的设计与实现

基于Spring Boot的在线学习系统的设计与实现 摘 要 在线学习系统是以大学传统线下教学方式不适应信息技术的迅速发展为背景&#xff0c;提高学习效率&#xff0c;解决传统教学问题&#xff0c;并且高效的实现教学信息化的一款软件系统。为了更好的实现对于教学和学生的管理&a…

FL Studio21.2.3中文版软件新功能介绍及下载安装步骤教程

FL Studio21.2中文版的适用人群非常广泛&#xff0c;主要包括以下几类&#xff1a; FL Studio 21 Win-安装包下载如下: https://wm.makeding.com/iclk/?zoneid55981 FL Studio 21 Mac-安装包下载如下: https://wm.makeding.com/iclk/?zoneid55982 音乐制作人&#xff1a…

记录关于智能家居的路程的一个bug___Segmentation fault(段错误)

前言 其实发生段错误的情况有很多&#xff1a; 其实在项目的开发中最有可能的错误就是①和②&#xff0c;考虑到本项目数组用的比较少&#xff0c;所以主要是考虑错误①指针的误用。 有时候错误就是那么离谱&#xff0c;声音也算是一种设备&#xff1f;&#xff1f;&#xff…

【安全用电管理系统的应用如何保证用电安全】Acrel-6000安科瑞智慧安全用电解决方案

政策背景 国家部委 ※2017年5月3日国务院安委会召开电气火灾综合治理工作视频会议&#xff0c;决定在全国范围内组织开展为期3年的电气火灾综合治理工作。 公安部领导 ※公安部副部长李伟强调&#xff1a;向科技要战斗力&#xff0c;加快推进“智慧消防”建设不断提升火灾防控…

大创项目推荐 深度学习 opencv python 实现中国交通标志识别_1

文章目录 0 前言1 yolov5实现中国交通标志检测2.算法原理2.1 算法简介2.2网络架构2.3 关键代码 3 数据集处理3.1 VOC格式介绍3.2 将中国交通标志检测数据集CCTSDB数据转换成VOC数据格式3.3 手动标注数据集 4 模型训练5 实现效果5.1 视频效果 6 最后 0 前言 &#x1f525; 优质…

【LeetCode热题100】739. 每日温度(栈)

一.题目要求 给定一个整数数组 temperatures &#xff0c;表示每天的温度&#xff0c;返回一个数组 answer &#xff0c;其中 answer[i] 是指对于第 i 天&#xff0c;下一个更高温度出现在几天后。如果气温在这之后都不会升高&#xff0c;请在该位置用 0 来代替。 二.题目难度…

pytest--python的一种测试框架--request请求加入headers

一、request headers中的cookie和session机制的作用与区别 Cookie 和 Session 是两种在客户端和服务器之间保持状态的技术。HTTP 协议本身是无状态的&#xff0c;这意味着服务器无法从上一次的请求中保留任何信息到下一次请求。Cookie 和 Session 机制就是为了解决这个问题。 …

【CASS精品教程】CASS11.0基于离散点创建三维地形(Tin、Grid、等高线)

文章目录 一、打开数据二、创建不规则三角网TIN三、创建等高线CONTOUR四、规则格网GRID五、专栏配套实验数据包下载一、打开数据 打开CASS11软件,点击【绘图处理】→【展野外测点点号】,选择实验数据(实验数据在文末有下载地址),如下图所示: 展点如下图所示(此数据为美国…

搜索与图论——Dijkstra算法求最短路

最短路算法 稠密图与稀疏图 n为点数&#xff0c;m为边数。m远小于n的平方为稀疏图&#xff0c;m接近n的平方为稠密图。 稀疏图用邻接表存&#xff0c;稠密图用邻接矩阵存 朴素版dijkstra时间复杂度为O(n^2),对于稠密图可以ac&#xff0c;但遇到稀疏图时会TLE。 dijkstra函数实…

蓝桥杯算法题-图形排版

题目描述 小明需要在一篇文档中加入 N 张图片&#xff0c;其中第 i 张图片的宽度是 Wi&#xff0c;高度是 Hi。   假设纸张的宽度是 M&#xff0c;小明使用的文档编辑工具会用以下方式对图片进行自动排版&#xff1a; 1. 该工具会按照图片顺序&#xff0c;在宽度 M 以内&…

「Android高级工程师」BAT大厂面试基础题集合-下-Github标星6-5K

C、 com.android.provider.contact D、 com.android.provider.contacts 11.下面关于ContentProvider描述错误的是&#xff08;&#xff09;。 A、 ContentProvider可以暴露数据 B、 ContentProvider用于实现跨程序共享数据 C、 ContentProvider不是四大组件 D、 ContentP…

与webpack类似的工具还有哪些?区别?

文章目录 一、模块化工具二、详细对比RollupParcelSnowpackVitewebpack 参考文献 一、模块化工具 模块化是一种处理复杂系统分解为更好的可管理模块的方式 可以用来分割&#xff0c;组织和打包应用。每个模块完成一个特定的子功能&#xff0c;所有的模块按某种方法组装起来&a…

stitcher类实现多图自动拼接

效果展示 第一组&#xff1a; 第二组&#xff1a; 第三组&#xff1a; 第四组&#xff1a; 运行代码 import os import sys import cv2 import numpy as npdef Stitch(imgs,savePath): stitcher cv2.Stitcher.create(cv2.Stitcher_PANORAMA)(result, pano) stitcher.st…