地址
Text-to-Image Synthesishttps://project-iprj64b657264549ab788a4e41d1-8000.preview.node01.inscode.run/声明
正在尝试更换其他模型,基于达摩院通义文生图大模型ai_artist目前在效果上有待优化,先下线,后面升级再上。
前言
"文生图"是指使用计算机程序将文字转换成图片的过程。这种技术通常使用神经网络来完成,叫做Neural Text-to-Image Synthesis (NTIS)。NTIS算法可以根据给定的文本描述生成相应的图片。这类模型可以用来做很多有趣的事情,例如生成表情包,电影海报等。
目前最先进的文字生成图片模型是基于生成对抗网络 (GAN) 的模型,它们能够生成高质量的图片。GAN 由两部分组成:生成器 (Generator) 和判别器 (Discriminator)。生成器的作用是根据文字描述生成图片,而判别器的作用是区分真实图片和生成图片。通过训练这两部分网络,可以使生成器生成的图片越来越像真实图片。
在 ChatGPT 火起来之前,AI 领域最出圈的话题就是 AI 画图。扩散模型把生成式 AI 向前带进了一大步,一时间业内出现大量输入文字、生成各种风格图像的 AI 模型。之后又出现了图像生成图像、图像指定风格转换的更多玩法,让人们眼花缭乱的同时感叹于生成式 AI 的神奇。
工具的使用
本程序采用了达摩院通义文生图大模型ai_artist,阿里出品的AI项目,输入中文关键词即可生成对应图案,当前可完全免费使用。 描述词至多可添加至 500 字。模型基于多阶段文本到图像生成扩散模型,支持输入中文或英文描述,可根据用户自定义描述文本,生成对应风格图片。
现在我们来介绍一下这个工具的使用方法。
功能1:文生图
如图所示,该页面具备文本到图像生成的功能,用户可以在该页面上输入文本,然后生成相应的图像。更重要的是,该页面还支持将生成的图片保存到服务器本地的功能(默认存储在./upload/),这样用户可以随时随地访问和使用生成的图像。
除此之外,该页面还提供了图片点击放大的功能。当用户在页面上点击一张图片时,该图片会自动放大显示,以便用户更清楚地查看细节。这样的功能设计使得用户能够更方便地浏览和观赏图片,提升了用户体验和交互性。无论是在学术研究、设计创作还是娱乐媒体等领域,这样的功能都能帮助用户更好地使用和欣赏生成的图片。
功能2:自建API
API - 描述:Boyhttps://project-iprj64b657264549ab788a4e41d1-8000.preview.node01.inscode.run/generate_image_json.php?description=boy
您可以使用该API的"description"参数来指定图片的描述。在上述链接中,我们使用了"boy"作为描述的示例。您可以根据需要修改描述内容。调用API后,它将生成一个图片链接,并以JSON格式返回。
这个功能可以用于自动化生成具有描述的图片,为各种应用和场景提供支持。您可以根据具体需求进行调整和集成,以实现更多自定义的应用功能。
ISSUS
希望大家多多提bug。
已知bug1:
默认1024x1024的预设值,aspectRatio应该为1。写错了 写成0.5了。
修改前:
修改后:
已知bug2:
模型不支持自定义尺寸但是还是写了自定义的逻辑...需要重新二开,所以在下一个版本中会加入根据输入 第三方重新画图的逻辑。