AIGC领域优秀的资源汇总(应用、论文、开源项目)

AIGC领域介绍,及一些比较优秀的应用,和论文,开源项目汇总。

AIGC大纲

一、AIGC概念

​ AIGC,全名“AI generated content”,又称生成式AI,意为人工智能生成内容。例如AI文本续写,文字转图像的AI图、AI主持人等,都属于AIGC的应用。

​ AIGC也被认为是继PGC(Professionally Generated Content,专业生产内容)和UGC(User Generated Content,用户生产内容)之后的新型内容生产方式,AI绘画、AI写作等都属于AIGC的具体形式。

二、AIGC发展过程

​ AIGC的发展历程可以分为三个阶段:早期萌芽阶段(上世纪50年代至90年代中期),沉淀累积阶段(上世纪90年代至本世纪10年代中期),快速发展阶段(本世纪10年代中期至今)。

在早期萌芽阶段(1950s~1990s)

​ 由于技术限制,AIGC仅限于小范围实验与应用,例如1957年出现首支电脑创作的音乐作品《依利亚克组曲(Illiac Suite)》,80年代末至90年代中由于高成本及难以商业化,因此资本投入有限导致AIGC无较多较大成绩。

在沉淀累积阶段(1990s~2010s)

​ AIGC从实验性转向实用性,2006年深度学习算法取得进展,同时GPU,CPU等算力设备日益精进,互联网快速发展,为各类人工智能算法提供海量数据进行训练。2007年首部人工智能装置完成的小说《I The Road》(《在路上》)问世,2012年微软展示全自动同声传译系统,主要基于“深度神经网络”(Deep Neural Network,DNN)自动将英文讲话内容通过语音识别等技术生成中文。

在快速发展阶段(2010s~至今)

​ 2014年深度学习算法“生成式对抗网络”(Generative Adversarial Network, GAN)推出并迭代更新,助力AIGC新发展。2017年微软人工智能少年“小冰”推出世界首部由人工智能写作的诗集《阳光失了玻璃窗》,2018年NVIDIA (英伟达)发布StyleGAN模型可自动生成图片,2019年DeepMind发布DVD-GAN模型可生成连续视频。2021年Open AI推出DALL-E并更新迭代版本DALL-E-2,主要用于文本、图像的交互生成内容。

2023年

​ 而2023年更像是AIGC入世元年,AIGC相关的话题爆炸式的出现在了朋友圈、微博、抖音等社交媒体,正式被大众所关注。其中令人印象深刻的是微软全系融入AI创作和OpenAI GPT-4的发布:

​ 2023年1月,微软必应搜索(Microsoft Bing Search)推出了一项创新的功能,即聊天模式(Chat Mode)。这项功能允许用户通过聊天框与必应搜索进行交互,获取信息、娱乐、创意等各种内容。必应搜索利用了先进的自然语言处理(NLP)和生成技术,能够理解和回答用户的各种问题和请求,同时提供相关的网页搜索结果、建议、广告等。必应搜索还能够根据用户的选择,切换不同的模式,如平衡模式(Balanced Mode)、创意模式(Creative Mode)和精确模式(Precise Mode),以满足用户的不同需求和偏好。必应搜索的聊天模式是AIGC领域的一个突破,展示了人工智能与人类交流的可能性和潜力。

​ OpenAI在2023年3月发布了GPT-4模型:基于GPT-3改进的新一代预训练语言模型,参数达到2000亿,能够生成高质量的文本内容,支持多种语言和任务。GPT-4模型通过OpenAI Playground和OpenAI Codex等平台向公众开放,也通过受控API向企业提供服务。

三、AIGC应用

​ (这一代AIGC的应用)

​ AIGC通过让机器模仿人类的思维和创造力,使用自然语言处理、深度学习、图像处理等技术生成具有一定逻辑性和创意性的内容。相比于人工创作,AIGC具有自动化、高效、大规模生产、可定制等优势,可以应用于新闻报道、广告、文案撰写、音乐创作、影视制作等领域。在新闻报道领域,AIGC可以自动生成新闻摘要、事件报道、体育赛事等内容。在广告营销领域,AIGC可以根据用户画像和需求,自动生成广告文案、海报、短视频等广告素材。在音乐创作领域,AIGC可以自动生成音乐曲谱、和声、旋律等,也可以将不同的音乐元素组合起来生成新的音乐作品。在文学创作领域,AIGC可以自动生成诗歌、小说、散文等文学作品,甚至可以生成对话、情节、人物等元素。在视觉艺术领域,AIGC可以自动生成图像、视频、动画等作品。

举例一些应用功能:

​ 应用技术的成熟度:

​ 我们使用技术准备水平(TRL)来评估每种技术的成熟度。它的定义接近NASA的TRL概念。从1到9,其中9是最成熟的技术。

  1. 报告的基本原则
  2. 制定技术概念和/或应用
  3. 关键功能概念证明
  4. 可用的研究工作
  5. 研究原型验证
  6. 样机由专业用户操作
  7. 由最终用户操作的原型
  8. 由最终用户完成并验证的实际产品
  9. 经过大量终端用户日常验证的实际产品

这个列表中的大多数技术应该属于4或以上

文本生成(nlp)

在这里插入图片描述

文本-文本

NameTRLMore Links
Brad5-6
ChatGPT8-9[API] [Paper]
Claude5-6[Paper]
Copilot (Code only)8-9
GPT-47-8[API] [Paper]
LLaMA6-7[Paper] [Code]
New Bing7-8
StableLM5-6[Code]

文本-图片

NameTRLMore Links
DALL·E 27-8[API] [Paper]
MidJourney8-9
Stable Diffusion7-8[Paper] [Code]
TEXTure (Texture only)4-5[Paper] [Code] [Demo]

文本-视频

NameTRLMore Links
Fliki8-9[API]
Make-A-Video4-5[Paper]
Phenaki4-5[Paper]

文本-网格(3D)

NameTRLMore Links
DreamFusion4-5[Paper] [3rd Party Code]
DreamFields4-5[Paper] [Code]
Magic3D4-5[Paper]
Text2Mesh4-5[Paper] [Code]

文本-语音

NameTRLMore Links
Murf7-8[API]

文本-音乐

NameTRLMore Links
Mubert8-9[API]

图片生成

图片-文本

NameTRLMore Links
BLIP-24-5[Paper] [Code]

图片-图片

NameTRLMore Links
img2img6-7[Paper] [Code]

图片-网格(3D)

NameTRLMore Links
GET3D4-5[Paper] [Code]
nvdiffrec5-6[Paper] [Code]
pix2pix3D5-6[Paper] [Code]

图片-视频

NameTRLMore Links
Make-A-Video4-5[Paper]

表格来源:

git-hub: awesone-aigc
感兴趣的可以点击查看

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13115.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

白嫖GPT-4最强竞品!20秒速通92页论文,不怕跟不上技术进展了

梦晨 发自 凹非寺量子位 | 公众号 QbitAI GPT-4最强竞品Claude前两天来了个史诗升级,支持十万token上下文,可以一次输入一本书,把大模型卷到新高度。 可惜的是,从Anthropic官网申请试用要收费,不少感兴趣的读者表示想玩…

将springboot单体项目部署到腾讯云服务器上

前言 在服务器上运行springboot项目,需要有jdk环境,而此文的项目案例使用的数据库是mysql,所以也需要安装mysql,教程如下: CentOS7安装jdk8CentOS7快速安装mysql 1.打包springboot单体项目 1.springboot单体小项目…

【干货贴】当人工智能与艺术碰撞 | AI写诗

生成式人工智能产品(AIGC) ​前几天,扎克伯格称:Meta 将组建顶级 AI 团队,专注生成式人工智能产品,在短期内,公司将专注于构建创造性和表现力的工具。 说到富有创造力和表现力的艺术行为&#…

ChatGPT被广泛应用,潜在的法律风险有哪些?

ChatGPT由OpenAI开发,2022年11月一经面世便引发热烈讨论,用户数持续暴涨。2023年初,微软成功将ChatGPT接入其搜索引擎Bing中,市场影响力迅速提升,几乎同一时间,谷歌宣布其研发的一款类似人工智能应用Bard上…

张峥、小白谈GPT与人工智能:可能是好事,也可能不是

张峥、小白(章静绘) 最近几个月,以ChatGPT为代表的聊天机器人引起全世界的广泛关注。GPT是如何工作的?它会有自我意识吗?人工智能将对我们的社会、文化、知识系统造成何种冲击和重构?奇点到了吗&#xff1f…

我们现在怎样做父亲

离开了中学的课本后再没读过鲁迅的文章,今年想再读鲁迅。《我们现在怎样做父亲》这个题目本是鲁迅《坟》杂文集中的一篇,怎样做父亲是个人生大命题,毕竟一生中在这件事上不太能靠积累经验来熟练。所以,在做父亲这件事上不是一个技…

获英伟达和Accel9000万美金投资,AI视频Synthesia要对标Runway?

AI的狂欢已不再仅仅属于ChatGPT,下一个风口将剑指AI视频生成。 制作出高质量的专业视频内容耗时且昂贵,但人工智能的技术进步促使企业掌握了更多筹码和选择。一家总部位于英国伦敦的AI视频创作平台Sunthesia正在AI视频生成的路上摸索。Synthesia历经七年…

巴比特 | 元宇宙每日必读:OpenAI CEO称短期内不会训练GPT5,公司正通过外部审计等措施评估潜在危险...

摘要:据财联社报道,OpenAI首席执行官Sam Altman周三(6月7日)在印度《经济时报》主办的一次会议上称,目前OpenAI仍然没有培训GPT-5。Altmam还反驳了一些对人工智能最直言不讳的担忧声,称该公司已经在通过外部…

未来已来,大模型无处不在。音视频技术人,你准备好了吗?

“音视频领域正面临着一场人机交互体验的革命,是算力、连接、显示整个端到端革命的升级,市场也在呼唤着颠覆式的终端,现象级的内容以及全新的产业生态。” 技术是从什么时候开始改变我们的生活的? 打开电视,电影《瞬息…

阿里CTO线退出历史舞台/ AI视频公司Runway估值破百亿/ OpenAI确认不用API数据训练…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是5月6日,又一个“星期五”。 科技圈更多新鲜事儿,下滑走起~ 阿里CTO线退出历史舞台 据雪豹财经社独家消息,充当各业务技术中台的阿里CTO线近日完成了组织架构的…

快影内测多款AIGC新功能,短视频智能创作时代即将到来?

AIGC作为AI细分之下的重要赛道,迅速在短视频、绘画、音乐创作等领域出圈,吸引了如阿里、字节、百度、美团等多个互联网大厂,并纷纷布局和计划推出AI类的产品。 特别是百度旗下生成式AI产品“文心一言”,已成为不少文字创作者的辅助…

一天搞定50条视频!AI替你打工的流程有人已经跑出来了

梦晨 金磊 发自 凹非寺量子位| 公众号 QbitAI 最近的AI狂欢属于ChatGPT,接下来该轮到AI生成视频了。 想做UP主但又不知道怎么剪视频的人,这下真的可以放开手脚,专心管内容创作,剩下的工作完全丢给AI来生成了。 最重磅的…

免费体验Stable Diffusion deforum文转视频插件,还有deforum API 接口部署介绍!

如何使用 Serverless Devs 和函数计算快速体验部署 Stable Diffusion,这个是小白也能简单体验安装部署的教程.有电脑就能操作,依托阿里云原生服务.不用考虑硬件问题 本篇主要讲解怎么安装跟部署自定义安装插件跟模型.以deforum文转视频插件举例.deforum api 接口 自…

华人团队颠覆CV!SEEM完美分割一切爆火,一键分割「瞬息全宇宙」

作者 | 新智元 编辑 | 自动驾驶与AI 点击下方卡片,关注“自动驾驶与AI”公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心【语义分割】技术交流群 后台回复【领域综述】获取自动驾驶全栈近80篇综述论文! Meta的「分割一切」的横空出世&…

SEEM:微软基于 CV 大模型新作,分割“瞬息全宇宙”

文 | 智商掉了一地 交互式视觉分割新作,具有语义感知的新模型~ 自从 Meta 发布了“分割一切”的 SAM 之后,各种二创如雨后春笋般冒出,昨天微软的一篇论文又在推特上引起讨论,虽然最开始吸引小编的是它的名字——分割“瞬息全宇宙”…

带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性

带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性 1.什么是语言模型? 大家或多或少都听过 ChatGPT 是一个 LLMs,那 LLMs 是什么?LLMs 全称是 Large Language…

分享一个ChatGPT提示词技巧

先说原理: 核心点:利用ChatGPT的训练特性模仿功能; 先从网上找10来个优质的提示词; 然后把这些优质提示词“喂”给ChatGPT,目的是让它学会这些优质提示词的套路; 接着,我们再提供一个主题&a…

GPT-4发布!能打败ChatGPT的只有OpenAI自己!

众所周知,chatGPT的对话生成模型用的是GPT3.5,而今发布的GPT4相比GPT3,又有了巨大的升级: 输入仅文本 > 输入文本和图像,具备了强大的识图能力 文字输入限制3k字 > 2.5w字 准确率、对细节的理解能力大幅提升 o…

ChatGPT,音乐,与数据库

小编君是个不务正业,喜欢搞跨界,干啥啥不成的DBA,大概在十一年前就有个不成熟的妄念,能否用计算机来写音乐? ▌用ChatGPT来搞音乐? 音乐是一个个的音符,按照乐理规则排列的。音符之间是否和谐…

吴恩达 ChatGPT Prompt Engineering for Developers 系列课程笔记--08 Chatbot

08 Chatbot ChatGPT的一种重要功能是作为一个聊天机器人,本节将展示如何和ChatGPT进行对话 1) 不同的角色(Roles) 前面几节的课程中,我们通过如下函数调用ChatGPT的接口,输入用户输入的prompt,返回模型生…