几个字就能生成画作,AIGC的时代即将到来

一、前言

最近AI绘画、聊天、代码生成可以说是刮起了一阵风,席卷了互联网。各大网站都在疯狂刷屏相关的内容,也收到了各界的热烈的关注。无论是AI绘画还是聊天这类的技术都属于同一个领域:人工智能生成内容(AIGC)

小伙伴可能会疑惑,什么是AIGC?

AIGC 即 AI Generated Content,是一种通过人工智能技术来自动或辅助生成内容的内容生成方式,是继专业生产内容(PGC, Professional-generated Content)、用户生产内容(UGC, User-generated Content)之后的新型内容创作方式,具有高效性和自动化的特点。随着深度学习模型不断完善、开源模式的推动,加快了 AIGC 走向落地应用的速度。正如我们所看到的,今年是AIGC爆火的一年,其实在年初并没有多少AIGC相关的内容出现在互联网,但就在这几个月间,迭代和传播速度呈指数级爆发。而且通过其创作的作品有的还能达到专业的级别,甚至“以假乱真”,这给我们带来了惊喜但也带来了忧虑。害怕被AI取代。

人类是否被AI取代的话题也是老生常谈的了,不可否认随着AI的出现和更新一定会带走一些传统的东西,这是无可争议的事实。但我们在面对新的技术变革时,与其担心哪天会被机器替代,不如而思考如何让机器为我们做事,让其成为我们的助手从而更高效,更有价值的完成工作或创造“世界”。所以抱有与技术共生的理念才能拥抱未来的变化。

参与AIGC领域研发的公司有很多,谷歌、Meta、英伟达等巨头都陆续加入了该赛道。但在国内没有几家公司参与其中,主要是因为接口开放的限制,AI生成相关应用难以使用。另一方面模型训练成本是巨大的,这也让不少企业望而却步。

但在我探索的过程中发现一款由昆仑万维集团与合作伙伴奇点智源推出的全系列AIGC模型与算法—“昆仑天工”,可以说是国内独树一帜存在,也在业界处于领先的地位。它们在AI生成能力覆盖图像、音乐、编程、文本等全模态领域都有着杰出的表现。这里将通过该公司的模型和产品深入介绍AIGC在几大方面的应用。

二、生成图像模型

2018年,一幅由 AI 生成的艺术品《埃德蒙·贝拉米肖像》以大约300万人民币的高价成功拍卖,从那时起,AI 艺术生成已经逐步走进大众的视野:

  今年出现了大量的文本生成图像模型,尤其是随着Stable Diffusion 的出现,让AI生成图像技术层面带来了质的突破,甚至已经可以生成能够媲美专业画师的作品,生成图片的效率也大大缩短,由原来的数小时到几分钟,甚至一秒就能出图。AI作画能在近期爆火,取得如此巨大进展的原因有很大一部分功劳要归属于它。

Stable diffusion是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的文图生成(text-to-image)模型

Latent Diffusion Models通过在一个潜在表示空间中迭代“去噪”数据来生成图像,然后将表示结果解码为完整的图像,让文图生成能够在消费级GPU上,在10秒级别时间生成图片,大大降低了落地门槛。

Latent Diffusion Models整体框架如下图,首先需要训练好一个自编码模型(AutoEncoder,包括一个编码器 E 和一个解码器 D )。这样一来,我们就可以利用编码器对图片进行压缩,然后在潜在表示空间上做diffusion操作,最后我们再用解码器恢复到原始像素空间即可:

但是Stable Diffusion 模型并不能通过中文提示词输入来生成相应的图像。值得庆幸的是昆仑天工有一款名为天工巧绘 SkyPaint的AI绘画模型在 Stable Diffusion的基础上做了中文的支持,它也是第一款多语言Stable Diffusion分支模型。

除此之外 SkyPaint 使用 1.5 亿级的平行语料优化提示词模型实现中英文对照,不仅涉及翻译任务语料,还包括了 用户使用频率高的提示词中英语料,古诗词中英语料,字幕语料,百科语料,图片文字描述语料等多场景 多任务的海量语料集合,对模型进行了深度优化,得以让中文文本能够有更好的图像生成效果。 昆仑天工的天工巧绘 SkyPaint 模型均与 当前AI 作画领域最为领先的模型相当,下表对比了不同模型在 Flickr30K-CN 数据集上的性能表现:

在未来,它们还会支持更多语言的提示词输入,更强大的语言生成模型指导图像生成, 风格更加多样,增加更多艺术风格的支持 以及支持用户对生成的图像进行二次提示词编辑图像功能 。

SkyPaint已经发布了微信小程序的体验版本,我也体验了一些,效果确实不错:

输入文本:

生成效果:

、文本生成模型

自从人工智能研究公司OpenAI发布其语言模型GPT-3以来,越来越多的学生开始利用AI进行写作。甚至将作业要求输入OpenAI以及类似的程序,这些程序使用深度学习来生成文本能够达到“以假乱真”的效果。比如,一位在Reddit上名叫innovate_rye的生物化学学科的一年级学生,教授会安排一些包括扩展回答的简单家庭作业,当他把“写出生物技术的五件好事和坏事”提交给AI后,系统能给出一个最后评分为A的答案:

上面提到的GPT-3模式是有史以来最大的神经网络,由OpenAI在2020年5月发表的论文“Language Models Are Three Shot Leaners”中首次公开。它具有1750亿个参数,当时震惊了业界。tian

如今也有越来越多基于GPT-3模型的产品出现,最让我印象深刻的还是昆仑万维与奇点智源联合推出的瑶光和天枢模型。

瑶光的性能更强,适用于需要生成大量内容(论文、小说等)场景的应用,天枢则适用于需要实时生成的场景,例如:聊天对话、智能客服等。

它们都拥有多样的下游能力,包括续写,对话,中英翻译,内容风格生成,推理,诗词对联等:

并在各项专业性领域的任务中(例如分类,匹配,填空,识别,识别)表现突出,与现有大模型的比试中也排列前茅(下图是它的“瑶光”模型与市面上主流的其它AI模型的参数对比):

能取得如此优异的成绩得益于他们针对中文领域构建了千亿级别的高质量数据集,通过高性能a100-gpu集群,训练(200张显卡,训练了4周,后续优化合计2周)得到百亿参数量的GPT-3生成模型。

上面提到的对话,中英翻译、对联等功能我们可以在奇点智源官网上体验到。

这里我分享下我体验到的一些功能:

1) 对对联

上联:只想摸鱼不上班,AI生成的下联是:常思致富不为官:

这对出来的:常思致富不为官,确实把我惊艳到了,对的非常工整,也契合上联的含义:。

2) 内容续写

我填写的内容是:写一篇小文章。今天去了游乐园

AI生成的内容如下:

也没有偏离题意,而且生成的内容文笔也不错,我们再稍微改改就可以得到一篇佳作了。要是我上学的年代有这样的技术,我的作文分数就不会那么低了。

AI生成代码

代码自动生成对很多程序员包括我认为都是很难有达到商业级水准的效果,是一项非常复杂、困难的挑战。但随着开发阿尔法go的公司deepmind推出的alphacode让这件事变得不再困难。令人惊讶的是,AlphaCode此前参加了网站Codeforces举行的10场编程比赛,排名前54.3%,击败了46%的参赛者,Elo评分1238。当然现阶段AlphaCode也只不过是在程序员的竞争中混了个一般水平,但随着时间的推移,在它经历越来越多的训练和改进后一定会产生出非常不错的效果。alphacode的原理架构图并不复杂:

  1. pretrain:在github的数据集上做pretrain。模型就是BERT,pretrain方法也差不多。

  2. fine-tune:在 codeforce 数据集上做 fine-tune,这个模型是标准的基于 transformer 的 encoder-decoder 结构,encoder输入是题目的描述(也包括:题目的tags、solution使用的语言、题目中的样例),decoder的输出对应的ground-truth是一个solution,可以是对的,也可以是错的。

  3. 用训练完的模型 sample 大量的 solution 出来,并且做过滤和聚类。过滤是为了去掉无法通过样例的代码(会干掉绝大部分),聚类是为了让实现不同但输出相同的代码只提交一次(节约提交的budget)。聚类中,还需要一个独立训练的生成测试数据的模型。这个步骤是针对竞赛题设计的,从这个步骤看,直接用生成的代码直接run错误的概率很高。

  4. 从聚类最大的类开始挑选,选出10个solution来提交。

昆仑万维在此领域也推出了第一款多语言开源编程大模型天工智码SkyCode,能够根据代码注释写代码(解题)等,还支持根据中文注释来序列代码。目前市面上的多种主流代码语言(java, javascript, c, c++, python, go, shell)等都得到了支持,该模型可以说是大大提高了写代码的效率,恐怕不久的将来,程序员只需要review代码就OK了。而且生成代码量的速度可以达到每百字的输出,下表对比了 Sky-code 模型与其他代码生成模型的性能:

模型生成的js代码:

模型生成的Python flask代码:

现阶段天工智码SkyCode支持Visual Studio Code插件扩展,我们可以在扩展中搜索skycode进行安装使用,具体的使用教程可以参考官网的插件使用引导:

未来它们还会陆续支持 Visual Studio, Neovim, JetBrains 等一系列的IDE和编辑器。

、总结

“昆仑天工”是由昆仑万维集团与合作伙伴奇点智源推出的全系列AIGC模型与算法,昆仑万维作为中国领先的互联网平台出海企业,逐渐在全球范围内形成了海外信息分发及元宇宙平台Opera、海外社交娱乐平台StarX、全球移动游戏平台Ark Games、休闲娱乐平台闲徕互娱、投资板块等五大业务,市场遍及中国、东南亚、非洲、中东、北美、南美、欧洲等地,为全球互联网用户提供社交、资讯、娱乐等信息化服务。截至2022年上半年,全球平均月活跃用户近 4 亿, 海外收入占比达 75%。昆仑万维于2015年登陆创业板,集团旗下的业务和子公司已先后拓展至美国、俄罗斯、日本、韩国、印度,以及欧洲、非洲、东南亚等地的其他国家。

2022年可以说是AIGC的元年,AIGC的时代也从此刻到来。AIGC 作为 UGC 后新一类创作方式,是数智时代的典型应用创新,它的快速发展不仅正在革新数字文化创作的生产范式,也在改变用户与人工智能的交互模式。当然,它现在还处于发展的初期,还有很多的问题等着去解决,还有不明确的未知需要去探索、踩坑。但相信在不久的将来,在高速发展的今天,在技术进步的推动下,在商业前景大好的前提下,AIGC 也将拓展出更多应用方式,更好地服务人们的生活。如 ChatGPT 一样的 AIGC 产品,终将越来越频繁地出现在我们的社会场景之中,成为常态。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9537.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智头条|欧盟达成《人工智能法》协议,全球前沿科技齐聚AWE 2023

行业动态 华为云联手多方推进数字化,软通动力深度参与 华为云宣布启动“‘百城万企’应用现代化中国行”,旨在推动应用现代化进程、助力数字中国高质量落地。软通动力是该行动的参与者之一,共同探索符合区域特点、产业趋势、政企现状的数字化…

数据驱动+AI引擎,为MarTech打开全新的想象空间

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 近年来,随着全球数字化、信息化进程不断提速,企业营销的战场也逐渐转移至线上。一方面,消费者行为的数字化使得企业营销活动更加依赖于线上数字营销;另一方面,包括…

解读陆奇博士的“大模型世界观”

腾讯科技频道记者张小珺一篇《陆奇最新演讲实录—我的大模型世界观》刷爆朋友圈。文章知识点丰富、字里行间处处流淌着创业方法论和AI应用商机,含金量极高! PS:一家之言、不求苟同。如有不爽之处,欢迎来 找我。 腾讯新闻原文&…

讯飞星火认知大模型小试牛刀

讯飞星火认知大模型小试牛刀 测试写一份周报旅游新闻工作汇报 不足申请注册流程 目前,国内开放的大模型(百度、阿里、科大讯飞)都是邀请制。科大讯飞的大模型邀请制审批挺快的,这里做一个记录。 首测于微信公众号:代码…

持续更新1000+AI行业研究报告......

中国信通院&AIAB:人工智能研发运营体系(MLOps)实践指南(2023年)-72页 计算机行业专题报告:Al应用成本快速下降,MaaS模式下商用空间有望打开-20230313-浙商证券-15页 中国人工智能产业发展趋势报告2023-18页 计算机行业深度报告:大模型应用百花齐放&#x…

安徽男子9秒被AI换脸骗132万;商务部表示对美光公司审查是维护国家安全的必要措施;360与云知声达成战略合作丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 百度正内测基于大模型技术的“AI伙伴”、“AI BOT”以及NEW APP等产品 5月25日,百度集团资深副总裁、百度移动生态事业群组总经理何俊杰表示,要以AI原生思维重构百度移动生态&#xff0c…

WPS AI内测申请窍门;AI数字人最全工具盘点;AI超级个体必读书籍;产品国际化与本地化指南;生成式AI应用路线图 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 生成式AI应用路线图:多模态AI的应用能力演进 随着生成式AI「对生成内容的可控性」不断提高,其应用场景也在不断…

ChatGPT 推出两个月后用户达到 1 亿

分析师表示,前所未有的接受度可能使 AI 聊天机器人成为有史以来增长最快的消费者互联网应用程序 OpenAI logo 前手机上的 chatgpt 图示 编辑搜图 请点击输入图片描述(最多18字) ChatGPT(中文:小发猫)由微…

怎样注册邮箱账号?

邮箱账号的注册可以按照以下2种途径: 一、Web端注册 1、网页端搜索:http://163.net,点击“立即注册” 2、4个邮箱套餐,可以根据自己的使用情况进行选择 3、填写申请的邮箱账号&输入密码,手机号码,完…

批量邮箱注册申请,邮箱注册申请这样才靠谱!

我们进行批量邮箱注册过程中,在性价比这方面时而不知如何选择,今天来为大家分析,批量注册的时,各邮箱品牌性价比有哪些特点? 了解邮箱基本信息: 邮箱品牌信息 目前五大邮箱品牌如TOM邮箱、搜狐、新浪、网…

如何申请email账号注册,如何批量注册申请邮箱?

如何申请email账号注册,如何批量注册申请邮箱?在申请邮箱时性价是我们重要的考量因素,今天来为大家分析,申请邮箱账号时,都有哪些好用的品牌可以选择呢? 邮箱是一种很长情的陪伴,一旦使用则不会…

国外教育邮箱购买?国外邮箱哪个好?

许多留学生为了去国外留学时沟通交流更方便,都会注册一个国外邮箱用于学习。但一般国外教育邮箱购买并不容易,有没有什么其他好用的国外邮箱呢?接下来就给大家介绍一下国外邮箱购买什么,哪个国外邮箱比较好。 国外邮箱哪个好&am…

国内邮箱免费邮箱注册哪个好?

大家每个人都有很多个电子邮箱,免费邮箱都是注册各种网络平台用,正式用还是要用收费的邮箱,那么收费的VIP邮箱怎么忘记密码怎么找回? 当使用TOM vip邮箱绑定随心邮时,遇到密码错误的提示,建议您采取以下办…

电子邮箱账号是如何注册的?可以注册免费的电子邮箱账号么?

你在公司使用的邮箱是什么邮箱呢?企业邮箱、个人VIP邮箱或者是什么办公软件呢?那么你的电子邮箱号码都是怎么注册的呢?其实公司使用的话,还是建议注册一个企业邮箱来使用,管理起来也十分方便,发送邮件便捷还…

2022购买企业邮箱账号价格,个人手机号怎么注册邮箱?

从一个人的办公桌面、家里物品的摆放,就可以知道这个人的生活是否井井有条。我有个朋友,她很会整理收纳,进入到她的领域,让人感觉特别舒心。她说整理物件就是整理心情,是整理生活品质,不用花钱,…

Python 的 type() 和 isinstance() 函数

type()、isinstance()都是对象类型操作函数,用于判定 Python 对象类型,用哪个函数更好哩? 【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free:大咖免费“圣经”教程《 python 完全自学教程》&…

用 Phthon 写抽奖程序

一共 10 人参与抽奖,四人中奖,其中一人固定不变。 【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅仅是基础那么简单…… 地址&#xff1a…

字符串、字符串列表,倒序生成字典。

带数字的字符串以数字为key倒序生成字典,字符串列表按其元素索引为key倒序生成字典。 【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅仅是基础那么简…

Python 异常类型捕获( try ... except 用法浅析)——Don‘t bare except (不要让 except 裸奔)

不要让 except 裸奔!裸奔很爽,但有隐忧。 (本笔记适合学完 Python 五大基本数据类型,有了些 Python 基础的 coder 翻阅) 【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free:大咖免费“圣经”教程…

Python 字典修改对应的键值

将 key ‘1’ 的值[ ‘1’, ‘3’, ‘5’ ]字符元素,修改为[ ‘2’, ‘4’, ‘5’ ]。 【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅仅是基础那么简…