AIGC大模型之——以文生图介绍

一、什么是以文生图?

       以文生图是AIGC ( AI Generated Content )框架中的一个关键技术,通过文字描述,将文字转化为图像并展示出来。以文生图具有白动化程度高、精度高、可扩展性强、可定制化等优势,具有广泛的应用前景,可以为人们提供更便捷高效的绘图解决方案。

文生图的功能:
(1)文字转图像:将输入的文字转化为图像效果 ,使文本更加生动。
(2)图像定制:用户可以选择不用的颜色,字体,背景,作画风格等,定制自己喜欢的图像。

二、文生圈大模型的原理是什么?

       目前,最火热的文 本转图像横型主要是Compvis、Stability和LAION等公司研发的Stable
diffusion模型
,一个完全开源的模型( 代码,数据,模型全部开源)。
       Stable diffusion模型是基于Latent Diffusion Models( 潜在扩散模型,LDMs)的文生图模型,在UNet中引入了text condition来实现基于文本生成图像的功能。Stable diffusion模型的主体结构如图1所示,主要包括三个模块:

(1)autoencoder :encoder将图像压缩到 latent空间,而 decoder将 latent解码为图像;

(2)CLP text encoder:该 CLIP的text encoder是一个 transformer模型,提取输入的 text的text embeddings, 通过 cross attention方式送入扩散模型 UNet中作为 condition;

(3)UNet:扩散横型的主体,用来实现文 本引导下的latent生成。

图1:Stable diffusion模型主体结构

       如图2所示为对应的Stable diffusion模型网络结构图。

 

图2:Stable diffusion模型网络结构图

       根据上述模型结构图可以看出,Stable diffusion模型在生 成图片的过程中,主要包括两个输入一是提示词(prompt),二是种子(作用是生成噪声图),固定的种子和固定的分辦率生成的噪声图是固定的,模型以这个为基础进行图片生成。菲中噪声图并不是一张图片,而是在潜在空间中的一种表示。为了便于理解,绘制为如图3所示的示意图。

                           预处理                                                 潜空间

图3:图像生成过程

三、应用场景

        文生圈(AI作图)技术的发展对各个行业都产生了深远的影响,具有众多的应用场景。

(1)艺术生成:快速高效地生成绘画作品、服装纹理、艺术素材等,为各行业提供灵感和创意。
(2)广告创意:快速生成各种类型的广告和宜传素材,也可以根据用户的需求生成个性化的广告,缩短制作成本和时间。
(3)游戏和影视:快速制作出各种类型的场景 特效、和角色模型。
(4)专业设计:将AI作画与专业领域的知识相结合,如3D建模、医疗、工业设计、建筑设计、教育等,先由Al根据提示制作粗略的草图,再由专业人员完成后续工作。

 四、已落地

       发挥以文生图优势进行海报设计,用于营销海报、宣传推广,提升了一线运营人员的工作效率,有助于深化数字化转型,加速剋赋能经营。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/50672.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

图扑 3D 可视化国风设计 | 科技与文化碰撞炫酷”火花“

当今时代,各领域互融互通,各种表现形式交叉融合,要主动适应新的发展趋势,推动中华优秀传统文化与新媒体、新技术的融合传播,让新时代的文艺与科技创新呈现更具深度、更有潜力的新境界。 “凡益之道,与时偕…

用于app的支付成功与失败页面

博主在开发一款app时制作了几个支付页面,在这里分享给大家。

本人成功续费了。你的支付授权失败。请核对你的信息并重试,或尝试其他支付方式。请联系你的银行了。

今天两个苹果账号都是这样弄的,都成功了。大家可以试试。 正常登录登录开发这账号,到要登录苹果账号的时候,我用注册地香港的账号(这是重点,原先用大陆的苹果账号试都不行),卡用的试招行VISA卡…

微信支付 {“errMsg“:“requestPayment:fail errors“}

使用的是uniapp uni.requestPayment 微信支付 错误解决 需要开通微信开放平台 1.登记的包名或签名有没有错误 不知道应用签名的可以先打个包安装到手机之后;使用签名工具下载地址https://open.weixin.qq.com/zh_CN/htmledition/res/dev/download/sdk/Gen_Signature_Andr…

UniAPP 进行微信支付时报错: {“errMsg“:“requestPayment:fail:[payment微信:-1]General errors“}

☞ 问题描述 Uniapp 开发过程中,参考文档进行微信支付的配置操作后 感觉前期的应用申请,商户号绑定,代码云打包都成功了 但是,通过 HBuilderX 连接安卓真机(魅族手机)进行测试,神奇的情况出现了…

【FAQ】应用内支付服务无法拉起支付页面常见原因分析和解决方法

华为应用内支付服务(In-App Purchases)通过简便的接入流程为用户提供良好的应用内支付体验,然而在实际接入过程中,有一些开发者反馈测试时会无法正常拉起支付页面,下文将详细分析问题出现的5种情形,并给出解…

关于微信支付退款接口问题 PHP版

微信支付申请退款接口,直接上代码 $orderinfopdo_fetch("select * from hx_order where orderid$orderid"); $transaction_id$orderinfo[transno]; //退款 //$total_fee$orderinfo[paymoney]; //$refund_fee$orderinfo[paymoney]; $total_fee1; $refund_f…

微信支付-“申请退款”接口遇到curl出错,错误码:58解决方案

微信支付后 退款,接口遇到curl出错,错误码:58 这个问题基本上是证书没对应上(微信支付不需要申请证书,退款要用到证书),证书要去微信商户号后台(账户中心-API安全-申请证书)下载&am…

支付业务-信用卡拒付

业务术语 持卡人:持有信用卡的买家 卡组织:银行卡转接清算机构(又称信用卡组织/银行卡组织),由成员组成的国际性或区域性支付卡组织,授权成员发卡,受理商户的卡交易,拥有并经营自己…

【ChatGPT】GPT 原理解析:Transformer 模型的核心思想:注意力机制(Attention Mechanism)的核心原理是什么?并给出数学公式代码实例。

文章目录 注意力机制是什么?多头注意力机制(Multi-Head Attention)Multi-Head Attention 算法原理、代码实例算法原理代码实例应用场景注意力机制的计算步骤Python 代码实例Softmax 函数参考资料注意力机制是什么? 注意力机制(Attention Mechanism)的核心原理是根据输入…

chatgpt赋能python:Python图中打字的SEO文章:让你的图片说出更多的话

Python图中打字的SEO文章:让你的图片说出更多的话 图片是传达信息的有力工具。不过,当你在网站上发布图片的时候,这张图片就很可能会被浏览器、机器学习算法、甚至是一些视觉障碍用户忽略。为了弥补这个缺陷,我们可以使用Python来…

React流式打字效果实现(不需要CSS) - Typing Effect with out use Css

前言 最近有个云栖大会的demo展示需求,要实现个类似的打字效果,所以我找了找相关的库。找到一个还不错的~叫iTyped.js。但是最终的效果和我想要的不太一样,会有回删效果,看了下源码,所以就自己写了一个~ 再夸奖下 iT…

模仿Chart GPT输出的打字效果

demo代码&#xff1a; <!DOCTYPE html> <html><head><meta charset"utf-8"><title>打字机</title><style>.text {font-size: 40px;}.content {text-align: center;font-size: 0;}.blink {font-size: 40px;animation: tia…

chatgpt赋能python:Python怎么入侵手机

Python怎么入侵手机 现在移动设备已经成为人们生活中必不可少的一部分&#xff0c;因此&#xff0c;攻击者越来越多地将目光转向移动设备。 进入移动设备的主要方式之一是通过应用程序漏洞进行攻击。而Python编程语言的出现可以让攻击者更容易地发掘和利用这些漏洞&#xff0c…

中国外汇交易中心员工英语培训四次合作TutorABC

成人在线英语教育品牌TutorABC的企业英语培训方案已经受到各大企业及协会的认可&#xff0c;这是众所周知的事情。就在双十一前夕&#xff0c;TutorABC与中国外汇交易中心达成年度语言培训合作&#xff0c;这已经是双方连续第四年在企业英语培训领域展开合作&#xff0c;TutorA…

报Python培训班多少钱?报个班值得吗?

报Python培训班多少钱&#xff1f;报个班值得吗&#xff1f;报培训机构学习Python学费一般是要1~2万元之间&#xff0c;每个培训机构收费标准都是不一样&#xff0c;要根据不同的班型、学习时长等因素来收费&#xff0c;而且Python的学费也会受到所在城市的消费水平影响。学习时…

Language Model Reasoning

来自&#xff1a;天宏NLP 作者&#xff1a;tianhongzxy 自从那篇著名的《Chain of Thought Prompting Elicits Reasoning in Large Language Models》发布以来&#xff0c;一下子引爆了使用 Large Language Models (LLMs) 做推理任务的热潮。同时&#xff0c;越来越多的研究者开…

Science前沿:大语言模型涌现演化信息,加速蛋白质结构预测

导语 从蛋白质序列直接预测三维结构&#xff0c;AlphaFold 此前取得了突破性进展。而蛋白质与人类的语言有天然的相似性&#xff0c;蛋白质的氨基酸序列就像是语言的字母&#xff0c;语言模型有可能在整个演化过程中学习蛋白质序列的模式&#xff0c;是否可以用大语言模型预测蛋…

中国数字经济产业发展大会在苏州相城成功举办

中国数字经济产业发展大会&#xff08;CCDE2023&#xff09;于3月25日在苏州成功举办。本次大会分论坛涵盖了“大数据产业、算力发展、数字金融产业、智能网联汽车产业、数字孪生技术、数字化转型、青年创新创业”等多个方向。CCDE2023汇聚数字经济产业的专业力量&#xff0c;为…

清华叉院杨植麟新公司曝光:专搞大模型,组明星团队,拿了红杉真格天使投资...

衡宇 发自 凹非寺量子位 | 公众号 QbitAI 又一家AI初创大模型公司&#xff0c;刚刚浮出水面。 名为月之暗面&#xff0c;主要业务剑指AGI。 成立后已迅速完成首轮市场融资&#xff0c;获红杉、真格等一线VC的押注&#xff0c;市场估值被曝约在3亿美元。 公司拥有明星团队&#…