文字生成图片

文章目录

  • 摘要
  • PaddleHub能力简介
  • 文心ERNIE-ViLG介绍
  • 配置环境
  • 模型加载推理
  • Prompt 设计原则

摘要

根据文字生成图像,是近几年大模型领域比较热门的研究。我这篇文章主要记录如何使用百度的文心大模型实现文字生成图像。

PaddleHub能力简介

PaddleHub旨在为开发者提供丰富的、高质量的、直接可用的预训练模型

  • 【模型种类丰富】: 涵盖大模型、CV、NLP、Audio、Video、工业应用主流六大品类的 360+ 预训练模型,全部开源下载,离线可运行
  • 【超低使用门槛】:无需深度学习背景、无需数据与训练过程,可快速使用AI模型
  • 【一键模型快速预测】:通过一行命令行或者极简的Python API实现模型调用,可快速体验模型效果
  • 【一键模型转服务化】:一行命令,搭建深度学习模型API服务化部署能力
  • 【十行代码迁移学习】:十行代码完成图片分类、文本分类的迁移学习任务
  • 【跨平台兼容性】:可运行于Linux、Windows、MacOS等多种操作系统

文心ERNIE-ViLG介绍

文心ERNIE-ViLG参数规模达到100亿,是目前为止全球最大规模中文跨模态生成模型,在文本生成图像、图像描述等跨模态生成任务上效果全球领先,在图文生成领域MS-COCO、COCO-CN、AIC-ICC等数据集上取得最好效果。你可以输入一段文本描述以及生成风格,模型就会根据输入的内容自动创作出符合要求的图像。

目前ERNIE-ViLG的文心大模型API已经登入PaddleHub,只需通过4行代码就能实现强大的图文生成能力! 你可以输入一段文本描述以及生成风格,模型就会根据输入的内容自动创作出符合要求的图像。
例如:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

配置环境

1、安装PaddlePaddle
链接:https://www.paddlepaddle.org.cn/
在这里插入图片描述
如果只是为了体验图文生成的功能,可以安装CPU版本。

conda install paddlepaddle==2.3.2 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/

更详细的安装步骤:https://www.paddlepaddle.org.cn/documentation/docs/zh/install/conda/windows-conda.html#anchor-0
2、安装PaddleHub

pip install --upgrade paddlehub
pip install docarray

模型加载推理

新建个python脚本,插入下面的代码即可生成图像。

import paddlehub as hub
from docarray import DocumentArray,Documenterniv_vilg_module=hub.Module(name='ernie_vilg')result=erniv_vilg_module.generate_image(text_prompts='香山,天鹅,亭子,古风,枫叶,概念艺术',style='水彩',output_dir='./output')DocumentArray([Document().load_pil_image_to_datauri(image) for image in result[:6]]).plot_image_sprites()

参数:

  • text_prompts(str): 输入的语句,描述想要生成的图像的内容。
  • style(Optional[str]): 生成图像的风格,当前支持’油画’,‘水彩’,‘粉笔画’,‘卡通’,‘儿童画’,‘蜡笔画’。
    还有一些其他风格也是支持的,比如:
    二次元、浮世绘、蒸汽波艺术、low poly、像素风格、概念艺术、未来主义、赛博朋克、写实风格、洛丽塔风格、巴洛克风格、超现实主义等。
  • topk(Optional[int]): 保存前多少张图,最多保存10张。
  • output_dir(Optional[str]): 保存输出图像的目录,默认为"ernievilg_output"。

返回

  • images(List(PIL.Image)): 返回生成的所有图像列表,PIL的Image格式。

Prompt 设计原则

Prompt:简单原则:清楚地陈述 除了公式之外,也有一些简单的prompt设计原则分享给大家

这里的第一条原则是 要清楚的陈述

例如我们如果是简单的输入 风景的话,往往模型不知道我们想要的风景是什么样子的

我们要去尽量的幻想我们风景的样子,然后变成语言描述

例如我想想的是日落时,海边的风景

那我就构造了prompt

进一步的,我想风格化我的图像,所以我在结尾的部分,增加了 胶片感来让图片的色彩更加好看一些

但是云彩的细节丢失了一些

进一步的我再增加天边巨大云朵这一个细节,让我的图片朝着我想要的样子靠的更进一步
详见:https://wenxin.baidu.com/wenxin/docs#Ol7ece95m
下面举几个例子:

1、火焰,凤凰,少女,未来感,高清,3d, 精致面容,cg感,古风,唯美,毛发细致,全身立绘

result=erniv_vilg_module.generate_image(text_prompts='火焰,凤凰,少女,未来感,高清,3d, 精致面容,cg感,古风,唯美,毛发细致,全身立绘',style='古风',output_dir='./output')

输出结果:
在这里插入图片描述
2、巨狼,飘雪,蓝色大片烟雾,毛发细致,烟雾缭绕,高清,3d,cg感,侧面照

result=erniv_vilg_module.generate_image(text_prompts='巨狼,飘雪,蓝色大片烟雾,毛发细致,烟雾缭绕,高清,3d,cg感,侧面照',style='写实风格',output_dir='./output')

在这里插入图片描述
如果不想安装环境也可以在百度的网站上体验,链接:
https://wenxin.baidu.com/moduleApi/ernieVilg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/50315.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在Android市场基于初级开发饱和的情况下,有两年经验的Android开发,还能活下去吗?

前言 前段时间,一位才参加工作两年的Android开发,问了我一系列的问题,表达出他对未来的迷茫: 我是二本科班毕业,想知道需要掌握什么样的安卓技能才能稳住工作? 我在b站上看了很多安卓的教学视频&#xff0…

linux 添加快捷命令,linux 添加快捷指令

vim ~/.bashrc 文件 alias sitcd /usr/local/ 是我加的,在执行 source ~/.bashrc ,使变动的文件生效, 下一次我直接输入 sit 系统自动执行cd /usr/local/命令 2.第二种方法 在sbin 目录下vim tt 创建tt文件 编写自己的shell脚本 例如&#x…

快速开发申请加班工资审批流程系统(1)

二次开发:快速开发申请加班工资审批流程系统(1) 很多时候在公司内部,都要手动填写一些表格,久了之后,也没能去数字化流程化,将一些流程简化和自动化。网上有很多自动化OA的开源流程快速搭建和实…

查询各部门总工资最高的部门中工资最高的员工姓名,工资,所在区域,部门

sql 表 1. staff表(.sql文件) SET FOREIGN_KEY_CHECKS0; – Table structure for staff DROP TABLE IF EXISTS staff; CREATE TABLE staff ( staffId int(11) NOT NULL, deptId int(11) DEFAULT NULL, staffName varchar(255) COLLATE utf8mb4_unicode…

Problem Q: 计算公司员工的工资

Problem Description 某公司有老板Boss、雇员Employee、小时工HourlyWorker和营销人员CommWorker,他们的薪金计算方法如下: 老板实行年薪制,如一年15万;雇员按月计酬,方法是基本工资奖金;小时工按工作时间计…

OpenAi最简洁的Java流式返回接入方式,没有第三方依赖,只需要使用Spring Boot即可!轻松构建你的带有聊天记忆、画图功能的chatgpt!

OpenAi最简洁的Java流式返回接入方式,没有第三方依赖,只需要使用Spring Boot即可!轻松构建你的带有聊天记忆、画图功能的chatgpt! GitHub - NiuXiangQian/chatgpt-stream: OpenAi最简洁的Java流式返回接入方式,没有第…

ChatGPT使用的SSE技术是什么?

在现代web应用程序中,实时通信变得越来越重要。HTTP协议的传统请求/响应模式总是需要定期进行轮询以获得最新的数据,这种方式效率低下并且浪费资源。因此,出现了一些新的通信技术,如WebSocket和SSE。但是,GPT为什么选择…

用Python对自己的文章做文本分析

新型冠状病毒疫情加剧,让人闲的不行。重新打开我的简书之后,发现我在简书上也写了72篇文章了…… 想“温故而知新”一下,但是在家总是慵懒,就算是自己写的文章也不想看。但是又十分好奇自己在过去的一年多的时间里到底写了啥&…

考研复试高频问题集锦!

今天给大家带来的是考研复试中的高频问题,感兴趣的同学可以想想如果是自己被问到这些问题会怎么回答,以及可以思考老师问这些问题的原因。基本回答公式: 公式:感谢提问我认为以上是我对此问题的回答 技巧:扬长避短 另外…

计算机考研初试/复试——软件工程

一、软件 软件定义 计算机程序、文档、运行程序所必须的方法、数据、规则。方法和规则在文档中说明,在程序中实现。(文档程序数据) 软件分类 基于软件功能的划分 系统软件:与计算机硬件紧密配合使计算机各个部件与相关软件和…

电子信息工程保研复试|考研复试——通信原理复试问题集锦

电子信息工程保研/考研复试——通信原理问题集锦 保研/考研复试——通信原理问题集锦(复习重点以及面试真题!!良心整理) 面向考研/保研同学,时间紧任务重,归纳了去年保研面试中复习以及被问到的通信原理相关…

北邮考研复试机试准备过程(已上岸)

纯自用请勿转载,用来给自己最后复习和捋思路用的,主要参考牛客网王道机试指南,C、C混用。考研人太久不写代码了…什么都不记得了,从头开始过一遍吧。 黑色代码段是要记住的重点函数/方法。每天下午做几个小时,一共不到…

【计算机考研】复试常见问题

操作系统 操作系统的特点? – 共享:资源可被多个并发执行的进程使用 – 并发:可以在同一时间间隔处理多个进程,需要硬件支持 – 虚拟:将物理实体映射成为多个虚拟设备 – 异步:进程执行走走停停&#xff0c…

会话存档-如何高性能存储海量聊天记录

场景 每天大约500w条数据,存档消息,并对消息进行统计分析。 大概计算一下: 每天的工作时间是8小时,大约是8小时处理400w条数据就足够了,为避免某时刻的峰值超负荷,还按照8小时处理500w条数据的标准来搭建…

开通会话存档查看聊天记录需要准备什么?

会话存档是腾讯企业微信推出的一项付费增值功能,开通会话存档之后企业可以通过会话存档API接口获取员工的聊天记录,可以获取到员工与员工之间的聊天记录、员工与客户的聊天记录,员工所在群的聊天记录,企业可以通过企小码会话存档存…

一个网站查遍所有英文文章 “会议地点及出版商”(亲测搜了80篇全部有效)

说明:本人用下面方法进行会议文章——会议地点及出版商 ——的搜索,连搜80篇文章没有任何问题! 前提使用学校网络,可能有的学校没有买会议的权限 第一步:点击所有版本 打开谷歌学术镜像网站,不用翻墙的那…

全国跨境电商联合运营服务平台,定义跨境新力量!

近年来,我国跨境电商行业不断发展,预计2021年跨境电商进出口交易规模有望达到14.3万亿元,疫情催化的市场需求、不断扩大的市场规模、频繁释放利好的政府政策,让跨境的风愈吹愈旺,面对波谲云诡的市场环境,如…

跨境电商卖家,如何运营Facebook?

随着跨境电商的兴起,越来越多的卖家开始运营Facebook,以吸引更多的潜在客户和提高品牌知名度。那么,作为跨境电商卖家,我们可以在Facebook上做些什么呢? 首先,我们可以通过Facebook建立一个专业的品牌页面&…

新手运营适合哪个跨境电商平台

很多企业的网站被收录却没有排名,关键词优化不上去,网站也没有什么流量,不断更新文章,即使是原创,也排不上去,这究竟是由于哪些原因造成的呢?米贸搜作为专业的SEO平台,整理了以下几种…

跨境电商运营做什么的?跨境电商运营怎么样?

图片来源:123rf.com.cn 随着国内电商的逐渐饱和,越来越多的人涌入了跨境电商领域,那么作为一个跨境电商运营工作,每天是做什么工作呢?今天就主要为大家分析跨境电商运营做什么的?跨境电商运营怎么样&#x…