AIGC新时代,注意政策走向,产业方向,拥抱可信AI。需要了解基本理论,基础模型,前沿进展,产品应用,以及小小的项目复现

  • AIGC(AI-Generated Content,AI生成内容)是指基于生成对抗网络(GAN)、大型预训练模型等人工智能技术的方法,通过对已有数据进行学习和模式识别,以适当的泛化能力生成相关内容的技术。类似的概念还包括合成式媒体(Synthetic media),它主要指基于人工智能生成的文字、图像、音频等媒体内容。AIGC是AI大模型,特别是自然语言处理模型的一种重要应用;ChatGPT则是AIGC在聊天对话场景的一个具体应用。AIGC可以生成的内容很多,具体的种类和范围可能随着技术的发展而不断扩大。目前,一些常见的AIGC内容包括:

    • 文字:最基本的AIGC内容,可以与人类进行实时对话,生成不同风格的文字,诗歌、故事,甚至计算机代码等。

    • 图像:可以由文字或者图片,直接生成各种类型的图片。可以辅助人类进行绘画设计和发散想象力,大致可以分为图像自主生成工具和图像编辑工具两类。

    • 视频:可以通过文字描述,生成一段情节连贯的视频。比如广告片、电影预告片、教学视频、音乐视频等。也可以当作视频的剪辑工具。

    • 音频:可以生成逼真的音效,包括语音克隆、语音合成、文本生成特定音,音乐生成、声音效果等。

    • 游戏:游戏的剧情设计、角色设计、配音和音乐、美术原画设计、游戏动画、3D模型、地图编辑器等都可以让AIGC帮助完成。

    • 虚拟人:可以生成虚拟明星、虚拟恋人、虚拟助手、虚拟朋友等。指存在于非物理世界(如图片、视频、直播、一体服务机、VR)中,并具有多重人类特征的综合产物。

  • 常见的AIGC应用

    • ChatGPT是由OpenAI开发的一款大型预训练语言模型,就像一个会聊天的机器人。

    • Midjourney是由美国旧金山的一家独立研究实验室创立的图片类AIGC应用程序,可以通过语言描述来生成图片。

    • Stable Diffusion,图片生成类AI大模型,可以在给定的任何提示词下生成图像,并支持根据关键词和图片检索。

    • Bing AI就是搭载了GPT-4的Bing浏览器,它能够更好地理解用户意图,提供更加智能化、个性化的搜索和服务体验。

    • 在这里插入图片描述

  • AIGC由三个关键组件组成:数据、硬件和算法。音频、文本和图像等高质量数据是训练算法的基本构建块。数据量和数据源对预测的准确性有着至关重要的影响。硬件,尤其是计算能力,构成了AIGC的基础设施。随着对计算能力的需求不断增长,更快、更强大的芯片以及云计算解决方案变得至关重要。硬件应该能够处理具有数百万个参数的数兆字节的数据和算法。加速芯片和云计算的结合在提供高效运行大型模型所需的计算能力方面发挥着至关重要的作用。最终,算法的性能决定了内容生成的质量,而数据和硬件的支持对于实现最佳结果至关重要。

    • 数据:ChatGPT的功能表明,数据是云计算和智能人工智能业务迭代的基础和基础。

    • 硬件:在海量数据为大数据和人工智能应用提供重要支持的同时,新的存储需求也迫在眉睫。

    • 算法:在当前智能数据挖掘算法的帮助下,可以通过迭代优化学习范式和网络结构内的参数来独立学习数据中固有的潜在规则。

  • AIGC的基础模型

    • 模型名称提出时间应用场景
      深度变分自编码(VAE)2013年图像生成、语音合成
      生成对抗神经网络(GAN)2014年图像生成、语音合成
      扩散模型(Diffusion Model)2015年图像生成
      Transformer2017年语言模型
      Vision Transformer(ViT)2020年视觉模型
    • VAE分为两部分,编码器与解码器。编码器将原始高维输入数据转换为潜在空间的概率分布描述;解码器从采样的数据进行重建生成新数据。

    • GAN包含两个部分:生成器,学习生成合理的数据。对于图像生成来说是给定一个向量,生成一张图片。其生成的数据作为判别器的负样本。判别器:判别输入是生成数据还是真实数据。网络输出越接近于0,生成数据可能性越大;反之,真实数据可能性越大。

    • 扩散是受到非平衡热力学的启发,定义一个扩散步骤的马尔科夫链,并逐渐向数据中添加噪声,然后学习逆扩散过程,从噪声中构建出所需的样本。扩散模型的最初设计是用于去除图像中的噪声。随着降噪系统的训练时间越来越长且越来越好,可以从纯噪声作为唯一输入,生成逼真的图片。

  • 虽然过去各种模型层出不穷,但是生成的内容偏简单且质量不高,远不能够满足现实场景中灵活多变以高质量内容生成的要求。预训练大模型的出现使AIGC发生质变,诸多问题得以解决。大模型在CV/NLP/多模态领域成果颇丰,并如下表的经典模型。诸如我们熟知的聊天对话模型ChatGPT,基于GPT-3.5大模型发展而来。

    • 计算机视觉(CV)自然语言处理(NLP)多模态
      微软Florence(SwinTransformer)谷歌Bert/LaMDA/PaLMOpenAI的CLIP/DALL-E
      OpenAI的GPT-3/ChatGPT微软的GLIP
      Stability AI的Stable Diffusion
  • 基础模型与预训练大模型的发展,促使AIGC迎来质变期与大规模应用期,未来随着核心技术演进、产品形态丰富、场景应用多元化、生态建设的日益完善,AIGC将充分释放应用价值与商业潜力。

  • 人工智能生成内容(AIGC)白皮书(2022年)–中国信通院 (caict.ac.cn)

  • AIGC发展趋势报告(2023) (qq.com)

  • 清华大学:2023年AIGC发展研究报告1.0版_极客网 (fromgeek.com)
    fromgeek.com)](https://www.fromgeek.com/report/1231-533442.html)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18860.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

a16z最新预判——AI虚拟陪伴生态全解析!

导语 “AI的魔力在于它的不断演变。有一天,它会比真实的“女朋友”更出色。未来某一天,选择真实的伴侣反而会成为第二优先级的选择。” 这是来自CarynAI社区的一位早期用户,在这个社区中已经有超过20,000人了。这个社区的用户们每分钟支付1美…

A16Z:AI Companion的趋势洞察

[ AI技术在人际交往中的应用是否会对人类关系产生负面影响? ] shadow 我想发起一场实验:你愿意参与这一场全程由AI主导的社交游戏吗?你只需要接受or拒接AI给你的任务。 听起来就很有意思 # # 预约参加 …… opus 今天推荐的是A16Z的一篇文章&…

第一批用ChatGPT坐牢的人,都玩的是哪些套路?

通过GPT在短时间内生成完整诈骗话术,套路啊套路 “虚拟角色”可以虚拟客服,还可以虚拟恋人玩杀猪盘 让受害人以为自己“坠入爱河” 套路还是从前的套路 但骗子用上了新的工具 又换上了很多马甲 防不胜防 你以为OpenAI不知道骗子会用这个工具来做坏…

我用GPT搭建了一个虚拟女友!

Datawhale干货 作者:仲泰,Datawhale成员 1. 作者知乎:https://www.zhihu.com/people/yong-tan-39-67 2.我用GPT搭建了一个虚拟女友-哔哩哔哩:https://b23.tv/GYYwMcq 3. 五月学习:ChatGPT应用组队学习来了&#xff01…

人人都可拥有的自主性AI:有记忆会使用工具,还会自我学习!底层自研框架即将开源...

明敏 发自 凹非寺量子位 | 公众号 QbitAI 要说AutoGPT为啥会迅速蹿红? 还不是把人类对AI的想象力再次打开了。 使唤AI不用再一句句引导,更不用去研究提示工程了。 人人像钢铁侠那样拥有超级AI贾维斯不是梦。 而就在现在,这种Auto AI Copilot已…

被颠覆、被捅刀、被群嘲:谷歌还能打赢这场AI之战吗?

去年12月,AI聊天机器人ChatGPT3.5对外发布几周后,谷歌就意识到了危险,CEO桑达尔皮查伊(Sundar Pichai)对内发出了“红色警报”(CodeRed)。 这是一场噩梦的开始。 过去4个月,皮…

深度剖析ja3指纹及突破

声明 以下只是搬运下我公众号的东西。很早就发过了。原帖地址: 深度剖析ja3指纹及突破 (qq.com) 已经发公众号的为什么还发csdn 有的圈内朋友,不经过我的允许,删减摘录我公众号的内容,这里就不提谁了,心里清楚&#x…

《Linux是怎样工作的》读书笔记

目录 前言Chapter 1 计算机系统概要1.1 计算机的硬件1.2 OS1.3 用户模式和内核模式1.4内核 Chapter 2 用户模式实现的功能2.1系统调用2.2系统调用的包装函数2.3 OS提供的程序 Chapter 3 进程管理3.1进程与线程进程线程进程和线程的区别 3.2 fork3.3 execve3.4 结束进程 Chapter…

用 Real-ESRGAN 拯救座机画质,自制高清版动漫资源

本文约1200字,建议阅读8分钟Real-ESRGAN 是 ESRGAN 升级之作,主要有三点创新:提出高阶退化过程模拟实际图像退化,使用光谱归一化 U-Net 鉴别器增加鉴别器的能力,以及使用纯合成数据进行训练。 相比于如今画面优良精美的…

Git学习

安装Git 可参考:https://blog.csdn.net/mukes/article/details/115693833?ops_request_misc%257B%2522request%255Fid%2522%253A%2522168121346716800192220040%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id16812134671680019…

线性回归 梯度下降原理与基于Python的底层代码实现

线性回归基础知识可查看该专栏中其他文章。 文章目录 1 梯度下降算法原理2 一元函数梯度下降示例代码3 多元函数梯度下降示例代码 1 梯度下降算法原理 梯度下降是一种常用的优化算法,可以用来求解许包括线性回归在内的许多机器学习中的问题。前面讲解了直接使用公…

面渣逆袭:Java集合连环三十问

大家好,我是老三。上期发布了一篇:面渣逆袭:HashMap追魂二十三问,反响很好! 围观群众纷纷表示👇 不写,是不可能不写的,只有卷才能维持了生活这样子。 当然,我写的这一系…

Android-Activity生命周期

文章参考:文章参考1 文章参考:文章参考2 五大状态 StartingRunningStoppedPausedDestroyed 借用一张已经包浆的图 PS:Running和Paused是可视阶段,其余都是不可视 几大函数 onCreate:通过setContentLayout初始化布局…

Java 八股文-集合框架篇

Java 集合框架 一、常见集合 1.说说有哪些常见集合? 集合相关类和接口都在java.util中,主要分为3种:List(列表)、Map(映射)、Set(集)。 其中Collection是集合List、Set的父接口&#xff0c…

python爬虫入门篇

接下来的一些时间会分享一些爬虫相关的代码和知识 有人会问爬虫怎么舔女神? 我只能说浅了 看完伟大的Technical Licking Dog 的文章你将会对舔狗的认知得到一个升华! 目录 接下来的一些时间会分享一些爬虫相关的代码和知识 正文 爬虫的运行原理&…

程序人生 - 为什么表情包越转发越模糊,还会变绿?

当代人聊天离不开什么? 表情包!!! 没有表情包,怎么表达我的感情?(当然,我对你基本没什么感情~只是想秀一下沙雕表情包!)在过去的日子里,江湖上流传…

⚡【C语言趣味教程】(1) 深入浅出 HelloWorld | 通过 HelloWorld 展开教学 | 头文件详解 | main 函数详解

🔗 《C语言趣味教程》👈 猛戳订阅!!! ​—— 热门专栏《维生素C语言》的重制版 —— 💭 写在前面:这是一套 C 语言趣味教学专栏,目前正在火热连载中,欢迎猛戳订阅&#x…

正确保护Macbook

MacBook该如何正确保护呢?不是各种键盘膜、保护壳通通用上就是最好的,那么该如何正确做呢?下面是macw小编带来的详细指导,快来学习! 在接下来的文章中,笔者将展示哪些配件是可取的,哪些配件是坚…

从做产品的角度分析吕布为什么非死不可?

这是一篇小品文,作者是“产品家实战营3期”学员…… 马中赤兔,人中吕布,本意虽褒,但个人觉得将人与牲口类比,其段位貌似也没高到哪里,:) 不过说起三国里的武将武力排名,吕…

中国撸串指北:13万家烧烤店的吃货最爱

戳蓝字“CSDN云计算”关注我们哦! 数据分析:还是更爱火锅的朱小五 内容撰写:最爱干豆腐卷的王小九 来源|凹凸数读 对美食最大的肯定无疑就是那操着不同口音说出的“好吃!”二字。 ——《人生一串》豆瓣短评 以美食慰藉夜归人&…