Midjourney角色一致功能解读

Midjourney角色一致功能解读

news/2024/12/29 18:13:44/文章来源:https://blog.csdn.net/2401_82571103/article/details/136850766

在无数AI绘画创作者的胡呼声中，Midjourney终于推出了“角色一致性”功能，该功能可在新图像中一致地重新创建角色。AI绘画中的主要障碍终被打破。

这是因为大多数AI图像生成器都依赖于“扩散模型”，这些工具类似于或基于Stability AI的Stable Diffusion开源图像生成算法，该算法的工作原理大致是获取用户输入的文本并尝试逐像素拼凑图像。-与该描述相匹配的像素，是从数百万张人类创建的图像的大量（且有争议的）训练数据集中的类似图像和文本标签中学习到的。

添加图片注释，不超过 140 字（可选）

角色一致性对于AI绘画的意义

与基于文本的大型语言模型(LLM)（例如OpenAI的ChatGPT或Cohere的新Command-R）的情况一样，所有生成式AI应用程序的问题在于其响应不一致：AI会为每个提示生成新的内容即使提示重复或使用一些相同的关键字，也应输入该内容。

在Midjourney 的例子中，就是图像。但是，如果你想为电影、小说或漫画制作故事时，你希望相同的一个或多个角色在其中移动并出现在不同的场景中，并具有不同的面部表情和表情，这在Midjourney 以往的版本中是无法实现的。

这种确切的场景对于叙事的连续性通常是必要的，但到目前为止，使用生成式人工智能很难实现。但Midjourney现在正在尝试解决这个问题，引入了一个新标签“-cref”（“角色参考”的缩写），用户可以将其添加到Midjourney Discord中文本提示的末尾，并尝试匹配角色的面部表情用户粘贴到所述标签后的URL中的特征、体型，甚至服装。

随着功能的进步和完善，Midjourney可能会进一步从一个很酷的玩具或创意来源变成一个更专业的生产力工具！

Midjourney角色一致性功能使用攻略

该标签最适合与之前生成的Midjourney 图像配合使用。例如，用户的工作流程将首先生成或检索先前生成的角色的URL。

让我们从头开始，假设我们正在生成一个带有以下提示的新角色：“一个肌肉发达的秃头男人，留着胡子，戴着眼罩。”

添加图片注释，不超过 140 字（可选）

我们先将最骂你的那张图像放大，然后在Midjourney Discord服务器中按住Control键单击它以找到“复制链接”选项。

添加图片注释，不超过 140 字（可选）

然后，我们可以在“穿着白色燕尾服站在别墅中–cref[URL]”中输入新的提示，并粘贴我们刚刚生成的图像的URL，Midjourney将尝试在我们的新内容中生成与之前相同的角色。键入的设置。

添加图片注释，不超过 140 字（可选）

此外，用户可以通过将标签“-cw”后跟数字1到100应用到新提示的末尾（在“–cref[URL]”字符串，就像这样：“–cref[URL]–cw 100。”“cw”数字越低，结果图像的方差就越大。“cw”数字越高，方差越大。生成的新图像将严格遵循原始参考图像。

当输入非常低的“cw 8”实际上返回我们想要的：白色燕尾服。尽管现在它已经去掉了我们角色独特的眼罩。

添加图片注释，不超过 140 字（可选）

继续“不同区域”

添加图片注释，不超过 140 字（可选）

虽然眼罩戴错了眼睛........但与期望已经非常接近了

你还可以使用两个并排的“--cref”标签及其各自的URL将多个字符合并为一个字符。

该功能刚刚于近期已在Midjourney国内版同步上线，喜欢AI绘画的朋友们快去试试吧！

Midjourney国内版http://xhs.midjourney9.com//?channel=101545

移动端可以复制链接在浏览器中打开

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/280635.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

IDEA中快速配置Git

IDEA中快速配置Git

Git介绍： Git下载 idea中配置Git

阅读更多...

如何使用人工智能打造超用户预期的个性化购物体验

如何使用人工智能打造超用户预期的个性化购物体验

回看我的营销职业生涯，我见证了数字时代如何重塑客户期望。从一刀切的方法过渡到创造高度个性化的购物体验已成为企业的关键。在这个客户期望不断变化的新时代，创造个性化的购物体验不再是奢侈品，而是企业的必需品。人工智能 （AI&…

阅读更多...

面试题之 react

面试题之 react

1.说说对react的理解 1️⃣是什么 React是用于构建用户界面的 JavaScript 库,遵循组件设计模式、声明式编程范式和函数式编程概念，更高效使用虚拟 DOM 来有效地操作 DOM ，遵循从高阶组件到低阶组件的单向数据流。 react 类组件使用一个名为 render() 的方…

阅读更多...

【linux】环境基础|开发工具|gcc|yum|vim|gdb|make|git

【linux】环境基础|开发工具|gcc|yum|vim|gdb|make|git

目录编辑 Linux 软件包管理器 yum 软件包: 操作： 拓展：lrzsz简介 Linux开发工具 Linux编辑器-vim使用 vim 的基本概念命令模式插入模式底行模式 vim 命令模式的操作指令 vim 底行模式的操作命令 Linux编译器-gcc/g使用功能格…

阅读更多...

SQLiteC/C++接口详细介绍sqlite3_stmt类（二）

SQLiteC/C++接口详细介绍sqlite3_stmt类（二）

返回目录：SQLite—免费开源数据库系列文章目录上一篇：SQLiteC/C接口详细介绍sqlite3_stmt类简介下一篇：SQLiteC/C接口详细介绍sqlite3_stmt类（三） sqlite3_reset() 功能：重置一个准备好执行的SQL语…

阅读更多...

Mysql——基础命令集合

Mysql——基础命令集合

目录前期准备先登录数据库一、管理数据库 1.数据表结构解析 2.常用数据类型 3.适用所有类型的修饰符 4.使用数值型的修饰符二、SQL语句 1.SQL语言分类三、Mysql——Create,Show,Describe,Drop 1.创建数据库 2.查看数据库 3.切换数据库 4.创建数据表 5.查看…

阅读更多...

Flink RocksDB状态后端优化总结

Flink RocksDB状态后端优化总结

截至当前，Flink 作业的状态后端仍然只有 Memory、FileSystem 和 RocksDB 三种可选，且 RocksDB 是状态数据量较大（GB 到 TB 级别）时的唯一选择。RocksDB 的性能发挥非常仰赖调优，如果全部采用默认配置，读写性…

阅读更多...

风速预测（八）VMD-CNN-Transformer预测模型

风速预测（八）VMD-CNN-Transformer预测模型

往期精彩内容： 时序预测：LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较-CSDN博客风速预测（一）数据集介绍和预处理-CSDN博客风速预测（二）基于Pytorch的EMD-LSTM模型-CSDN博客风速预测&#xff…

阅读更多...

Sora后时代文生视频的探索

Sora后时代文生视频的探索

一、写在前面按常理，这里应该长篇大论地介绍一下Sora发布对各行业各方面产生的影响。不过，这类文章已经很多了，我们今天主要聊聊那些已经成熟的解决方案、那些已经可以“信手拈来”的成果，并以此为基础，看看Sora发布…

阅读更多...

GB28181 —— 5、C++编写GB28181设备端，完成将USB摄像头视频实时转发至GB28181服务并可播放（附源码）

GB28181 —— 5、C++编写GB28181设备端，完成将USB摄像头视频实时转发至GB28181服务并可播放（附源码）

被测试的USB摄像头效果源码说明主要功能模拟设备端，完成注册、注销、心跳等，同时当服务端下发指令播放视频时设备端实时读取USB摄像头视频并通过OpenCV处理后实时转ps格式后封包rtp进行推送给服务端播放。源码 /****@remark: pes头的封装,里面的具体数据的填写已经占…

阅读更多...

远程传输大文件的软件远程文件传输

远程传输大文件的软件远程文件传输

在数字化时代，随着数据量的急剧增长，远程传输大文件变得越来越重要。无论是企业间的合作，还是个人的日常需求，高效、稳定、安全的远程文件传输都是关键。本文将介绍远程传输大文件的相关软件及其特点，帮助读者选择最适…

阅读更多...

应急响应-Web2

应急响应-Web2

应急响应-Web2 1.攻击者的IP地址（两个）？ 192.168.126.135 192.168.126.129 通过phpstudy查看日志，发现192.168.126.135这个IP一直在404访问 ， 并且在日志的最后几条一直在访问system.php ，从这可以推断 …

阅读更多...

Simulink|局部遮荫下光伏组件多峰值PSO-MPPT控制

Simulink|局部遮荫下光伏组件多峰值PSO-MPPT控制

目录主要内容 1.光伏电池工程数学模型的输出特性程序 2.普通扰动观察法进行MPPT 3.基于粒子群寻优的多峰输出特性 4.PSO_MPPT仿真模型下载链接主要内容在实际的光伏发电系统中，由于环境多变等因素的影响，当局部出现被遮挡情况时光伏阵列…

阅读更多...

Beamer模板——基于LaTeX制作学术PPT

Beamer模板——基于LaTeX制作学术PPT

Beamer模板——基于LaTeX制作学术PPT 介绍Beamer的基本使用安装和编译用于学术汇报的模板项目代码模板效果图 Beamer的高级特性动态效果分栏布局定理环境介绍在学术领域，演示文稿是展示和讨论研究成果的重要方式。传统的PowerPoint虽然方便，但在处理复…

阅读更多...

音频和视频标签

音频和视频标签

音频用audio标签 controls表示控制栏 loop循环播放音频 autoplay自动播放（浏览器基于隐私一般不支持） <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Com…

阅读更多...

k8s为什么删除了pod但是还是没删除掉的问题，deployment在影响

k8s为什么删除了pod但是还是没删除掉的问题，deployment在影响

deployment 影响pod删除一、问题所在二、解决问题一、问题所在执行：kubectl get pods --all-namespaces，获取dashboard相关的pod kubectl get pods --all-namespaces | grep dashboardkubectl delete pod dashboard-metrics-scraper-546d6779cb-4x6…

阅读更多...

Python 深度学习第二版（GPT 重译）（二）

Python 深度学习第二版（GPT 重译）（二）

四、入门神经网络：分类和回归本章涵盖您的第一个真实世界机器学习工作流示例处理矢量数据上的分类问题处理矢量数据上的连续回归问题本章旨在帮助您开始使用神经网络解决实际问题。您将巩固从第二章和第三章中获得的知识，并将所学应用于三个新…

阅读更多...

回归预测 | Matlab基于SAO-LSTM雪消融算法优化长短期记忆神经网络的数据多输入单输出回归预测

回归预测 | Matlab基于SAO-LSTM雪消融算法优化长短期记忆神经网络的数据多输入单输出回归预测

回归预测 | Matlab基于SAO-LSTM雪消融算法优化长短期记忆神经网络的数据多输入单输出回归预测目录回归预测 | Matlab基于SAO-LSTM雪消融算法优化长短期记忆神经网络的数据多输入单输出回归预测效果一览基本介绍程序设计参考资料效果一览基本介绍 1.Matlab基于SAO-LSTM雪消融…

阅读更多...

51单片机学习笔记8 中断系统及定时器

51单片机学习笔记8 中断系统及定时器

51单片机学习笔记8 中断系统及定时器一、中断的概念二、51单片机的中断1. 51单片机的中断源2. 中断的优先级3. 中断结构4. 外部中断解读5. 定时器中断6. 串口中断三、中断相关寄存器1. IE 中断允许寄存器2. TCON 中断请求标志3. IP 中断优先级四、中断号五、代码实现按键 &a…

阅读更多...

html5cssjs代码 029 CSS计数器

html5cssjs代码 029 CSS计数器

html5&css&js代码 029 CSS计数器一、代码二、解释该HTML代码定义了一个网页的结构和样式。在头部，通过CSS样式定义了body和h1-h2元素的样式。body元素的样式包括文本居中、计数器重置、字体颜色和背景颜色。h2元素的样式使用了CSS计数器来自动在标题前添加…

阅读更多...

最新文章

推荐文章