干货!最新综述带你全面了解ChatGPT,AIGC和扩散模型:底层原理、技术路线、应用场景......

点击蓝字

ea4170a5e120ec1ecd0b568dd6ccbda7.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

c3e0798cbe0dacd8a78d62fd9a9dd675.gif

2022年,ChatGPT的成功发布引起了全球科技圈的轰动,而它的成熟应用也成为了AIGC时代到来的标志。目前,AIGC已经以超乎人们预期的速度迅速催生了全新的科技系统与产业格局。2023年4月20日,AI TIME举办的大模型专场三活动邀请了韩国庆熙大学助理教授张超宁和他的合作学生,来自韩国科学技术院的博士生张晨爽、韩国科学技术院硕士生张梦纯、北京理工大学博士生郑胜、韩国庆熙大学博士生乔羽。五位嘉宾分享了多篇与ChatGPT,AIGC和扩散模型相关的综述论文,从不同的角度介绍了生成式AI的最新进展,展望了生成式AI面临的机遇和挑战。

张超宁

Generative AI

张老师首先介绍了自己的个人学习和工作经历,然后给大家分析了人工智能前沿领域等面临的难题与挑战,并展示了自己目前已有的一些研究工作和成果,最后重点阐述了自己对下一步研究方向——Segment Anything Model的研究思路和创新观点,并热情邀请对计算机视觉、机器学习等领域有兴趣的研究者在后期进行更加深入的交流与合作。

2b8bf6a3b6b8b2fc5a79391a0e686288.png

Segment Anything项目是一个用于图像分割的新任务、模型和数据集,研究者旨在通过引入三个相互关联的组件来构建分割的基础模型:即时分割任务、支持数据注释并通过即时工程将零样本传输到一系列任务的分割模型。SAM目前解决了视觉领域模型泛化性弱的问题,并且在边缘检测方面的性能较好,张老师提到,后期将从SAM模型的扩展性以及数据的高效性两个角度开展与其他模型的交叉应用研究。

张晨爽

Text-to-image Diffusion Models in

Generative AI: A Survey

Diffusion Model最早在图像领域因为其强大的图像生成能力而获得了巨大的关注。其中,文本-图像的扩散生成模型是一项令人印象深刻的工作。这篇综述主要从背景、创始工作、应用场景三个方面介绍了扩散模型是如何应用到文本-图像生成之中的。

张晨爽首先介绍了文本-图像任务的具体定义和历史上经典的里程碑式的研究工作,其中重点介绍了DALL-E模型的理论思想以及扩散模型的工作原理及其相较于Autoregressive models在解决实际问题上的优势;其次详细分析了扩散模型应用在文本-图像的4项经典工作,共可以分为两大类——Frameworks in pixel space、Frameworks in latent space;然后梳理了在最新工作中最主要的4类改进方向:模型结构、用于空间控制的草图、用于概念控制的文本转变、超分布的检索方法。最后介绍了文本-图像任务在实际生活中的应用,主要有:视觉艺术生成、视频生成、3D对象生成、文字引导图像编辑等。

8558551b93ac8c06190eaa69dc7edb19.png

在第二篇音频扩散模型的工作中,张晨爽着重介绍了研究者重点关注的两大任务——Text To Speech、Speech Enhancement。其中重点分析了Text To Speech的发展阶段和Speech Enhancement在研究过程中的需要解决的两大任务:语音增强、提高语音的超分辨率。

张梦纯

A Survey on Graph Diffusion Models:

Generative AI in Science for Molecule,

Protein and Material

由于图的巨大表达能力,近年来越来越多的研究将机器学习与图的分析和生成相结合,图也在社会科学、知识库、化学材料分子结构等众多研究领域中得到了非常广泛的应用。张梦纯本次分享了一篇关于Graph扩散模型的文献综述:在分子蛋白质和材料中的生成式AI。

她首先介绍了图的广泛应用、图的扩散模型以及综述的总体框架;其次根据算法分类简要回顾了深度图生成模型的4种主流的生成方法,分别是:Auto-regressive Models、Normalizing Flows、Variztional Autoencoders (VAE)、Generative Adversarial Networks (GAN),并总结了深度图生成模型的统一框架,针对每一个模型归纳了相应的关于图生成的经典模型方法;第三,介绍了扩散模型的相关背景知识,展示了目前基于扩散模型研究的三种主要表述方式并总结了这三种模型各自的前线过程、逆转过程及优化目标;但是,尽管扩散模型显示出优异的前景,但由于图形数据的独特属性要求,这需要在标准扩散过程中进行适当的调整从而使其更加适合于图形任务。有以下三种具体的修改过程:离散型扩散、低等级扩散、旋转平移的等价性和不等价性。图生成模型强大的性能使得其在Molecules分子、Protein蛋白质及其他方面有着广泛的应用。在本篇综述中不仅介绍了它的应用场景,还总结了常用的图数据集以及一些常用于验证生成模型有效性的图评估指标;最后,概述了图生成模型面临的一些挑战,主要包括评价标准、图的多样性、可扩展性、违规行为、可解释性的问题。

1da3abb725a72826541b79c4ef0f8269.png

郑胜

One Small Step for Generative AI,

One Giant Leap for AGI:A Complete Survey

on ChatGPT in AIGC Era

ChatGPT自发布以来,受到众多圈内外学者的广泛关注,其强大的交互生成能力为人们的工作、生活都带来了诸多便利。郑胜首先简要介绍了ChatGPT的相关背景,分析了ChatGPT可以为日常生活、科学研究等带来的影响和作用,比如ChatGPT使用交互式形式对用户提出的问题提供详细且准确的回答、已成为搜索引擎的有力竞争者、平衡了类似人类的输出与偏差等;其次从底层技术、GPTs发展路径两个方面阐述了ChatGPT发展的技术路线;然后分别从科学写作、教育领域、医疗领域、其他领域四个角度展开对ChatGPT应用场景的介绍,全面评估了ChatGPT应用在新场景中的优势,分析表明ChatGPT已经在不同的学科领域展现出强大的创造能力;最后,从技术限制、滥用、伦理问题、监管政策的角度多维地分析ChatGPT面临的挑战,比如没有情感和主观经验、有可能泄露个人隐私和机密信息、决策过程缺乏透明度等问题,并从不同角度展望未来ChatGPT的发展与改进方向。

221b4e9552d70fb661139185baf1dca4.png

在技术层面,将ChatGPT与其他AIGC工具相结合,将有希望打造全能型的ChatGPT;而在非技术层面,通用人工智能(如ChatGPT)在未来有可能对高薪工作构成更大威胁,相关的研究证明ChatGPT已经开发出具有自己意识和意图的能力,从而对人类可能造成危害,所以对通用人工智能的讨论和发展在未来是有很大的不确定性的。

乔羽

A Complete Survey on Generative AI (AIGC): 

is ChatGPT from GPT-4 to GPT-5 All You Need?

AIGC是一个快速发展的领域,具有很多潜在的应用,在带来巨大发展机遇的同时也面临着诸多的挑战与问题。乔羽首先从内容需要、技术条件两个角度分析了AIGC变得颇受欢迎的原因并具体分析了AIGC背后的基本技术;其次,从文本生成、图像生成、视频生成等方面具体阐述了AIGC能够解决的特殊化任务,在各类生成任务比如文本生成。近期的工作可以基于自监督模型先在大规模数据集上进行预训练,然后在小的数据上进行微调,该方法可以应用于低资源语言,处理不同的说话风格或噪音条件,以及转录多种语言。他从教育、游戏和元宇宙、媒体、广告、电影、音乐等多个领域展示了AIGC在生活工作中的应用场景及巨大作用,AIGC不仅促进了内容形式的多元化,为观众提供了更好的体验,也让相关从业者的工作更加高效,比如使用AI工具生成多样化的新闻素材,使用写稿机器人提升效率。最后,乔羽也提出了在当下AIGC面临的几大问题,如缺乏可解释性、道德和法律问题、特定领域的技术挑战、需要被更灵活地控制等,这都需要在未来被更多的研究者关注和解决。

963453f1fbde1fd987ddf4121371707b.png

机器翻译会自动将文本从一种语言翻译成另一种语言。开创性工作seq2seq首将encoder-decoder RNN结构应用于机器翻译。当句子变长时,Seq2seq的性能会变差,为此提出了一种注意力机制来帮助翻译长句子并增加单词对齐。现在流行的方法是采用预训练的语言模型,比如BERT和GPT,这两种方法能够大大加快文本翻译的速率,并且在准确性方面有较好的保证。

整理:陈研

审核:张超宁、张晨爽、张孟纯、郑胜、乔羽

往期精彩文章推荐

813817fcbfa4b58804cc6321a2fe5094.jpeg

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1000多位海内外讲者,举办了逾550场活动,超600万人次观看。

24ed4bcb4ec908b40d0f4f7a288e4f53.png

我知道你

在看

~

ff829a34fd61c3b3395cfac921c8ddd5.gif

点击 阅读原文 查看回放!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3500.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flutter ChatGPT | 代码生成器

ChatGPT 作为一个自然语言处理工具,已经火了一段时间。对待 ChatGPT 不同人有着不同的看法,新事物的出现必然如此。利益相关者形成 抵制 和 狂热 两极;哗众取宠者蹭蹭热度,问些花活,博人眼球;猎奇者尝尝鲜&…

与ChatGPT进行高效对话,生成想要的代码

Prompt Engine:释放创造力的新工具 Prompt EnginePrompt Engine的背景和目的简介背景目的 如何让 Codex 生成您想要的代码什么是prompt-engine-py安装简介架构图下面是PromptEngine类中可以用到的函数以及继承的函数 使用PromptEngine生成prompt使用CodeEngine生成p…

ChatGPT的代码生成是怎么做的?「基于深度学习的代码生成方法」最新研究进展...

机器学习研究组 代码生成(Code Generation), 是指根据自然语言描述生成相关代码片段的任务. 在软件开发过程中, 常 常会面临大量重复且技术含量较低的代码编写任务, 代码生成作为最直接辅助开发人员完成编码的工作受到学术 界和工业界的广泛关注. 让机器理解用户需求, 自行完成…

一个基于 ChatGPT 的视频神器,开源了!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 自今年开始,AIGC 行业爆火,直接带动了不少产业的发展,这其中自然也包括电商直播、新媒体营销等等。 虽说现在可以利用不少工具,快速基于文案…

php storm 安装,PhpStorm安装教程

PhpStorm安装教程 admin • 2020 年 07 月 01 日 下载 点击DOWNLOAD NOW下载 安装 create desktop shortcut(创建桌面快捷方式),系统32位就选32-bit,这个要勾选。 update path variable(restart needed)更新路径变量(需要重新启动),add launchers dir to the path(将启动器目…

如何帮助 ChatGPT 更好地学习和进化:纠正其错误的回答

如果您发现了 ChatGPT 的回答存在错误,可以通过向 ChatGPT 提供正确的答案来帮助它更好地学习和改进。ChatGPT 可以立即接受您提供的信息,并将其整合到它的知识库中,以便在未来类似问题的回答中更准确地回答相关问题。 1、首先回答加密用MD5…

ChatGPT的进化版?AutoGPT怎么用

AutoGPT是什么 首选给大家介绍,ChatGPT与AutoGPT的区别 目前AutoGPT被称为最接近AGI的人工智能,它是ChatGPT的进化版? “ChatGPT” 只能提供2021年9月之前的信息,所以你问它告诉我今天的天气,它回答不了 “AutoGPT” …

【终结篇】ChatGPT再“进化”,能胜任文章撰写工作吗?

本期文章由数字罗塞塔计划出品,于2023年3月9日在“浙江档案杂志”公众号首先发布,原名《兰台讲堂丨再“进化”的ChatGPT,能胜任文章撰写工作吗?》(兰台讲堂中仅选取作者和ChatGPT的部分聊天记录,本文将完整…

ChatGPT:向未来智能客服进化的必由之路

ChatGPT:向未来智能客服进化的必由之路🚀 1.什么是chatGPt1.文本分词2.语言理解3.自然语言生成 2. ChatGPT的原理3. chatgtp未来的发展趋势1.前言2.模型优化3.多语言处理4.行业应用5.智能匹配 4.chatgpt人工智能对人类社会造成的影响5.chatgtp与传统行业…

ChatGPT进化了,全新GPT-4发布,识图做网页,阅万行代码改BUG都不在话下,实在太强!...

一、开篇 近日,GPT4(Generative Pre-trained Transformer 4)的发布引起了全球范围内的轰动。GPT4是一种基于人工智能的语言生成模型,可以模拟人类的自然语言,并且可以产生高度逼真的语言和文本。其出现再次将人工智能技…

大模型训练一次200-1200万美元!ChatGPT多烧钱?

随着以ChatGPT为代表的生成式AI兴起,其背后以大模型为基础的人工智能成为业界投入的方向。 所谓“大模型”,通常是在无标注的大数据集上,采用自监督学习的方法进行训练。之后在其他场景的应用中,开发者只需要对模型进行微调&…

ChatGPT是怎么变得这么强的?拆解追溯ChatGPT各项能力的起源

©作者 | 符尧、彭昊等 最近,OpenAI 的预训练模型 ChatGPT 给人工智能领域的研究人员留下了深刻的印象和启发。毫无疑问,它又强又聪明,且跟它说话很好玩,还会写代码。它在多个方面的能力远远超过了自然语言处理研究者们的预期…

绝对想不到,Chatgpt 优缺点都有这些

ChatGPT 是一种基于自然语言处理 (NLP) 模型的对话生成程序,它的核心是通过机器学习算法训练得到的语言模型。GPT (Generative Pre-trained Transformer) 是ChatGPT的基础,这是一种使用Transformer架构的预训练语言模型。 ChatGPT的工作原理是通过输入一…

ChatGPT缺点之为什么ChatGPT、文心一言这么厉害了,还经常会把古诗词的作者弄错?

因为Chatbot模型在中国古典文学方面确实还有较大提高的空间。包括: 训练数据不够丰富。这些模型的训练数据主要来自网络爬取的文本,古典文学相关的高质量数据相对较少,导致模型对这方面知识掌握不够深入全面。 gpt3.5-框中诗句作者应为陆游 作者信息不…

ChatGPT还有哪些不足?

从技术角度来看,ChatGPT作为一个基于神经网络的自然语言处理模型,其优势在于能够处理大量的语言数据,并生成自然流畅的语言表达。ChatGPT还可以通过对话历史的分析,对当前对话进行上下文感知和情境推理,从而提供更加个…

调用科大讯飞语音转文本

文章目录 一、创建应用二、测试接口 一、创建应用 点击控制台,创建新应用 点击应用,进入详情页,可获取APPID、APISecret、APIKey 二、测试接口 安装包 pip install websocket pip install websocket-client0.57.0#!/usr/bin/env python …

“讯飞星火”大模型计划10月底赶超ChatGPT

文章目录 前言你使用过这种对话式AI吗?有什么看法或感受?“讯飞星火大模型将超越chatgpt?”这类型的人工智能对现在的社会有什么意义?这类型的人工智能,未来前景如何?申请体验写在最后 ✍创作者&#xff1a…

讯飞星火认知大模型内测【附申请链接与方式】

🥑 Welcome to Aedream同学 s blog! 🥑 一直发不出去,说是广告宣传,真离谱😭 直接把介绍内容全删了 原定于5月6日正式对外发布科大讯飞“星火”认知大模型 提前内测了!! 又一国内类chatgpt产品…

科大版中国版ChatGPT来啦!抢先体验

随着文心一言、通义千问等国内顶尖级ChatGPT大模型相继问世,具有语言理解和生成能力的人工智能正在引领行业创新发展。作为人工智能公司中的佼佼者,科大讯飞也开始加入到这场竞争中来。 4月20日,科大讯飞宣布即将于5月6日正式发布其最新的“…

科大讯飞的类ChatGPT今日发布开始大规模注册体验,手慢则无!

国外的ChatGPT要科学上网, 很多人无奈只能付费买个套壳, 盼星星盼月亮, 国产ChatGPT出来了, 百度的文心一言, 阿里的通义千问, 风风光光地开了发布会, 说是可以注册体验, 一访问官方…