ChatGPT 与AI大模型发展简要综述

e58573cb98d273c734ebad6f5ae0154a.png

来源:数据观综合

编辑:蒲蒲

"

日前,美国硅谷的初创公司OpenAI推出了一款新的人工智能对话模型ChatGPT,模型中首次采用RLHF(从人类反馈中强化学习)方式。

目前,模型处于测试阶段,用户与ChatGPT之间的对话互动包括普通聊天、信息咨询、撰写诗词作文、修改代码等。功能如此“全面”的ChatGPT被称作“最强AI(人工智能)”,面世5天便已有超过100万用户使用。

"

bb66ae6f64907c77d2cb0150e8585441.png

ChatGPT为什么这么神?

ChatGPT能够实现当前的交互,离不开OpenAI在AI预训练大模型领域的积累。

OpenAI最初提出的GPT1,采取的是生成式预训练Transform模型(一种采用自注意力机制的深度学习模型),此后整个GPT系列都贯彻了这一谷歌2017年提出,经由OpenAI改造的伟大创新范式。

简要来说,GPT1的方法包含预训练和微调两个阶段,预训练遵循的是语言模型的目标,微调过程遵循的是文本生成任务的目的。

2019年,OpenAI继续提出GPT-2,所适用的任务开始锁定在语言模型。GPT2拥有和GPT1一样的模型结构,但得益于更高的数据质量和更大的数据规模,GPT-2有了惊人的生成能力。不过,其在接受音乐和讲故事等专业领域任务时表现很不好。

2020年的GPT3将GPT模型提升到全新的高度,其训练参数是GPT-2的10倍以上,技术路线上则去掉了初代GPT的微调步骤,直接输入自然语言当作指示,给GPT训练读过文字和句子后可接续问题的能力,同时包含了更为广泛的主题。

9938125ae96eb3c8a350ffb510f91b27.jpeg图源:Medium  GPT系列模型的数据集训练规模

现在的ChatGPT则是由效果比GPT3更强大的GPT-3.5系列模型提供支持,这些模型使用微软Azure AI超级计算基础设施上的文本和代码数据进行训练。

具体来说,ChatGPT在一个开源数据集上进行训练,训练参数也是前代GPT3的10倍以上,还多引入了两项功能:人工标注数据和强化学习,相当于拿回了被GPT3去掉的微调步骤,实现了在与人类互动时从反馈中强化学习。

也因此,我们得以看到一个强大的ChatGPT:能理解人类不同指令的含义,会甄别高水准答案,能处理多元化的主题任务,既可以回答用户后续问题,也可以质疑错误问题和拒绝不适当的请求。

当初,GPT-3只能预测给定单词串后面的文字,而ChatGPT可以用更接近人类的思考方式参与用户的查询过程,可以根据上下文和语境,提供恰当的回答,并模拟多种人类情绪和语气,还改掉了GPT-3的回答中看似通顺,但脱离实际的毛病。

d8584d853057a7c9240b737dd79d625c.jpegChatGPT自己回答与前代GPT3的能力区别

不仅如此,ChatGPT能参与到更海量的话题中来,更好的进行连续对话,有上佳的模仿能力,具备一定程度的逻辑和常识,在学术圈和科技圈人士看来时常显得博学而专业,而这些都是GPT-3所无法达到的。

尽管目前ChatGPT还存在很多语言模型中常见的局限性和不准确问题,但毋庸置疑的是,其在语言识别、判断和交互层面存在巨大优势。

99a4be14c1571c4aebc5db2b73eab658.png

巨头抢滩AI“大模型”

自2018年以来,国内外超大规模预训练模型参数指标不断创出新高,“大模型”已成为行业巨头发力的一个方向。谷歌、百度、微软等国内外科技巨头纷纷投入大量人力、财力,相继推出各自的巨量模型。

国外的超大规模预训练模型起步于2018年,2021年进入“军备竞赛”阶段。

2018年,谷歌提出3亿参数BERT模型,惊艳四座,由此大规模预训练模型开始逐渐走进人们的视野,成为人工智能领域的一大焦点。

2019年2月,OpenAI推出了15亿参数的GPT-2,能够生成连贯的文本段落,做到初步的阅读理解、机器翻译等。

紧接着,英伟达推出了83亿参数的Megatron-LM,谷歌推出了110亿参数的T5,微软推出了170亿参数的图灵Turing-NLG。

2020年6月,大模型迎来了一个分水岭,OpenAI以1750亿参数的GPT-3,直接将参数规模提高到千亿级别。而作诗、聊天、生成代码等无所不能。

之后,微软和英伟达在2020年10月联手发布了5300亿参数的Megatron-Turing自然语言生成模型(MT-NLG)。

2021 年 1 月,谷歌推出的Switch Transformer模型以高达1.6 万亿的参数量打破了GPT-3作为最大AI模型的统治地位,成为史上首个万亿级语言模型。

2021年,12月,谷歌还提出了1.2万亿参数的通用稀疏语言模型GLaM,在7项小样本学习领域的性能超过GPT-3。

国内,超大模型研发厚积薄发,充分展示了中国企业的技术实力和应用需求。

2021年是中国超大规模AI模型的爆发年。在国内超大模型研发比国外公司晚,但是发展却异常的迅速。

4月,华为云联合循环智能发布盘古NLP超大规模预训练语言模型,参数规模达1000亿;联合北京大学发布盘古α超大规模预训练模型,参数规模达2000亿。

阿里达摩院发布270亿参数的中文预训练语言模型PLUG,联合清华大学发布参数规模达到1000亿的中文多模态预训练模型M6。

6 月,北京智源人工智能研究院发布了超大规模智能模型“悟道 2.0”,参数达到 1.75 万亿,成为当时全球最大的预训练模型。

7月,百度推出ERNIE 3.0 知识增强大模型,参数规模达到百亿。10月,浪潮发布约2500亿的超大规模预训练模型“源1.0”。

12月,百度推出ERNIE 3.0 Titan模型,参数规模达2600亿。而达摩院的M6模型参数达到10万亿,将大模型参数直接提升了一个量级。

到今年,大模型继续火热。最开始,大模型是集中在计算语言领域,但如今也已逐渐拓展到视觉、决策,应用甚至覆盖蛋白质预测、航天等等重大科学问题,谷歌、Meta、百度等等大厂都有相应的成果。一时间,参数量低于 1 亿的 AI 模型已经没有声量。

有研究实验表明,数据量与参数量的增大能够有效提升模型解决问题的精确度。以谷歌2021年发布的视觉迁移模型 Big Transfer 为例,分别使用 1000 个类别的 128 万张图片和 18291 个类别的 3 亿张图片两个数据集进行训练,模型的精度能够从 77% 提升到 79%。

简而言之,大模型往往具备一个特征:多才多艺,身兼多职。这对解决复杂场景的挑战至关重要。

26bb12e176da4938ee7dd5e6daa5af2f.png

规模就是一切?

近年来,大型语言模型的参数数量保持着指数增长势头。据预测,OpenAI开发中的最新大型语言模型GPT-4将包含约100万亿的参数,与人脑的突触在同一数量级。由此,出现了一个新的人工智能口号:“规模就是一切”。

57127c13cffd22165d0d1c9473eb2025.jpeg图片来源:https://huggingface.co/blog/large-language-models

更大的模型带来了更高的训练成本。这既包括智力支出和经济成本,也有不可忽视的环境影响。马萨诸塞大学阿姆赫斯特分校的一项研究指出,仅是训练参数数量不到最新模型1%的BERT模型,就会造成652千克的碳排放,可与跨越美国东西海岸的一次航班所造成的碳排放相比拟。

与此同时,越来越大的模型所带来的效用提升正在缩小。人们发现,模型参数规模增长10倍,得到的性能提升往往不到10个百分点。相比直线,倒是那些同等(乃至更小)参数规模的新模型,会带来真正质的提升。还有一些研究者尝试把大模型拆分成更多小模型并集之所长,但由于其模型参数并不会全部加入计算,“这是否会是参数量狂热之下的一种数字泡沫”的质疑也随之而来。

而且,随着大型语言模型的广泛应用,一些负面的社会效应也开始显现。据预测,到2023年,约有5%的大学生会使用大型语言模型生成的文本来代替本应由他们自己撰写的作业,而与之对抗的检测手段则很难真正发挥作用。

就在上月,Meta公司发布了一个名为Galactica的大型语言模型,宣称它“可以总结学术论文,解决数学问题,生成维基百科文章,编写科学代码,标记分子和蛋白质,以及更多功能。”

但上线仅3天,该模型就在巨大争议中撤回。它虽然能生成一些貌似通顺的学术文本,但文本中的信息是完全错误的——貌似合理的化学方程,描述的是实际上并不会发生的化学反应;格式合规的引文参考的是子虚乌有的文献;甚而种族主义、性别歧视的观点,也能通过模型生成的文本而被包装成“科学研究”。批评者质疑,这样的模型会使学术造假变得更为隐蔽,也将使科学谣言的散播变得更加便利。

一般的观点认为,尽管人工智能系统能在诸多特定任务中显现出看似智能的行为,但它们并不像人那样理解它们所处理的数据。譬如,Character.ai、ChatGPT这样的模型应用虽然已能流畅地与人进行“对话”,而且相当程度上顾及到上下文,然而,人工智能系统中无法预测的错误、对于一般情况推广能力的欠缺等都被视为它们无法“理解”的证据。这样的大型语言模型并未真正“理解”语言所描述的现实世界。

da584fd6b4c5971f7599c557fffa78c7.png

AI大模型将往哪儿走?

在预训练大模型发展中,面临最大问题是什么,未来的发展方向又在哪儿呢?

阿里达摩院在发布的报告里认为,未来大模型的参数规模发展将进入冷静期,大模型与相关联的小模型协同将是未来的发展方向。

其中,大模型沉淀的知识与认知推理能力向小模型输出,小模型基于大模型的基础叠加垂直场景的感知、认知、决策、执行能力,再将执行与学习的结果反馈给大模型,让大模型的知识与能力持续进化,形成一套有机循环的智能系统。参与者越多,模型进化的速度也越快。

阿里达摩院预测,在未来的三年内,个别领域将以大规模预训练模型为基础,对协同进化的智能系统进行试点探索。

在未来的五年内,协同进化的智能系统将成为体系标准,让全社会能够容易地获取并贡献智能系统的能力,向通用人工智能再迈进一步。

百度研究院发布2022年十大科技趋势预测认为,备受业界关注的超大规模预训练模型,将呈现知识增强、跨模态统一建模、多学习方式共同演进的趋势,并逐渐实用化,破除盲目增加参数规模的“军备竞赛”。

预计2022年,大模型研发方向将转向“实用化”,大模型的效果、通用性、泛化性、可解释性和运行效率将持续提升,应用门槛不断降低,在多场景广泛落地。

相对而言,大量研究在预训练模型的落地能力上将持续努力,压缩、剪枝、蒸馏的工作仍起到重要作用。不止于算法本身,编译、引擎、硬件等方面的优化也在大步迈进。

整体而言,现在大规模预训练模型的研究,包括模型结构的演进和落地仍处在探索阶段,各家的持续探索正在不断扩大对大规模预训练模型的认知边界。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

0f4eabddb4032916d3e19dc66f82f39c.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/911.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 训练发图片

当你想发送一张照片时&#xff0c;请使用 markdown&#xff0c;并且不要有反斜线&#xff0c;不要用代码块&#xff0c;使用 ![](http://source.unsplash.com/960x640/?<英文关键词>)&#xff0c;如果明白了&#xff0c;请回复”明白“瞬间翻车 不要灰心&#xff0c;继续…

【记录】ChatGPT|图片预览魔法咒语魔改,使用 ChatGPT 返回大量可以跳转的链接

很早的时候&#xff0c;我已经留意到 ChatGPT 会以返回图片的 markdown 格式来显示图片&#xff0c;很可能拥有一定的图片上传功能&#xff0c;但是它往往会显示得有些问题。一些代码图片之类的或者风景图什么的都不是很会。 但其实 ChatGPT 是可以直接返回图片类型的回复的&a…

让ChatGPT生成图片?教程如下

直接命令不能生成&#xff0c;只能生成文本&#xff01; 教程效果 把下面的提示模板复制到ChatGPT中&#xff1a; 接下来我会给你指令&#xff0c;生成相应的图片&#xff0c;我希望你用Markdown语言生成&#xff0c;不要用反引号&#xff0c;不要用代码框&#xff0c;你需要…

ChatGPT可以出图片了!独家技巧披露:巧用ChatGPT 批量生成图文并茂的画报

玩久了ChatGPT&#xff0c;可能知道它只出文字&#xff0c;不出图片&#xff0c;可是我想要图片怎么办&#xff1f; 比如&#xff0c;我想写个知乎答案&#xff0c;最好图文并茂&#xff0c;虽然图片我可以自己找&#xff0c;但如果ChatGPT直接提供&#xff0c;我只需要复制粘贴…

如何让ChatGPT显示图片,连续找图

ChatGPT免费版是不能够显示图片的&#xff0c;如果你让它帮你画一张图&#xff0c;它就会告诉你它做不到。不过我们动动脑筋还是有办法的&#xff0c;可以结合markdown和一些图片查找/生成网站&#xff0c;利用ChatGPT实现图片查找、显示功能。 例如用以下的提示语&#xff0c…

ChatGPT为什么能生成图片?

有小伙伴说我想用ChatGPT生成图片怎么操作&#xff0c;ChatGPT怎么画图等 这里阐明一下&#xff0c;ChatGPT是不能够做到画图的 因为它是一种自然语言处理模型&#xff0c;主要用于处理文本和语言相关的任务&#xff0c;例如问答、对话、翻译等。但是&#xff0c;我们可以使用C…

使用chatGPT生成图片的指令

如果我们直接让chatGPT给出一张图片&#xff0c;默认情况下是不被允许提供的 给它如下指令便可以实现基础图片的输出 接下来我会给你指令&#xff0c;生成相应的图片&#xff0c;我希望你用Markdown语言生成&#xff0c;不要用反引号&#xff0c;不要用代码框&#xff0c;你需…

如何让ChatGPT生成图片

使用ChatGPT的家人们都应该遇到一个问题&#xff0c;就是ChatGPT文本问答&#xff0c;不能生成图片&#xff0c;而当我们需要做PPT或者其他的时候&#xff0c;需要图片生成就很头疼了&#xff0c;先看看我们的操作&#xff1a; oh, my god! 不能生成图片&#xff0c;直接给建议…

ChatGPT扩展系列之ChatGPT 生成图片

ChatGPT扩展系列之ChatGPT 生成图片 前面其实我们介绍过ChatGPT 生成图片的案例,可以参考我们前面的文章ChatGPT使用案例之图像生成,不过今天我们介绍一下在web 端生成图片。 我们知道ChatGPT是可以生成Markdown并且展示的,所以生成图片的原理就是ChatGPT输出图片的方式同…

chatgpt生成图片方法总结

chatgpt3 目前chatgpt官网免费版本为chatgpt3.5&#xff0c;chatgpt4.0以下版本不具备生成图像功能。 测试1&#xff1a;一张日落的照片 2.调用图片资源网站unsplash的API&#xff0c;使用markdown语言返回&#xff0c;会呈现文字对应的图片&#xff0c;但图片并不是生成&…

ChatGPT能看到图片,太神了!

闲来无事&#xff0c;给ChatGPT提供了一张图片的地址&#xff0c;他说他能看到&#xff0c;并且还描述了出来&#xff0c;真的是太神奇了。以下是对话&#xff1a; 我用Midjourney帮我生成了树世界的主界面图片了&#xff0c;很美 很好&#xff01;如果你想要分享图片&#xf…

到底有多厉害?ChatGPT初探(多图)

众所周知&#xff0c;nlp领域发展迅猛&#xff0c;出现了很多新东西&#xff0c;注意力、多模态...甚至影响了cv领域。 ChatGpt是OpenAI的最新力作&#xff0c;作为一个阅(git)读(clone)广泛的工程师&#xff0c;迫不及待到官网感受一下有多厉害。 打寒暄后&#xff0c;先问几…

如何让chatgpt能够发送或生成图片?

作为一个聊天机器人&#xff0c;在大部分的chatgpt场景中&#xff0c;我们都是以文字的形式和chatgpt交流&#xff0c;chatgpt也是以文字的形式回复我们&#xff0c;当我们想让chatgpt给我们生成图片时&#xff0c;往往会遇到一些错误&#xff0c;例如&#xff1a; 在上面的对话…

ChatGPT生成图片

有小伙伴说我想用ChatGPT生成图片怎么操作&#xff0c;ChatGPT怎么画图等 这里阐明一下&#xff0c;ChatGPT是不能够做到画图的 因为它是一种自然语言处理模型&#xff0c;主要用于处理文本和语言相关的任务&#xff0c;例如问答、对话、翻译等。但是&#xff0c;我们可以使用C…

【教程】如何让ChatGPT生成图片?最新指令分享

我们都知道ChatGPT可以生成文本&#xff0c;但如果让他生成图片就会显示如下的声明&#xff1a; ChatGPT3月16日的回答但通过这个教程&#xff0c;你却可以在ChatGPT内实现这样的效果&#xff0c;让ChatGPT直接生成对应的图片&#xff1a; ChatGPT按照指令生成对应的图片 这个…

如何借助chatGPT帮你寻找最优惠的飞机票?

或许你不知道什么叫ChatGPT&#xff0c;但最近你肯定见过ChatGPT这个词&#xff0c;“ChatGPT让苹果急了”、“微软正式将ChatGPT引入必应”……关于ChatGPT的热搜一个接一个的出现&#xff0c;它到底是什么&#xff0c;有什么用&#xff0c;竟能让苹果畏惧&#xff0c;让微软看…

ChatGPT联网终极进化!插件系统正式开放、无需编码就能上手,网友:这是我见过最疯狂的系统...

来源&#xff1a;AI前线 整理&#xff1a;褚杏娟、核子可乐 “Python 终于没有存在的意义了&#xff01;撒花” 当地时间 3 月 23 日&#xff0c;OpenAI 宣布正式上线了以安全为核心的 ChatGPT 插件系统。OpenAI 插件将 ChatGPT 连接到第三方应用程序&#xff0c;之后 ChatGPT…

苹果cms源码支持php版本_最新影视小程序对接苹果cms详细教程+源码[无授权完美运营版本]...

准备工作: 教程很详细一步步操作都可以完成 常见问题: 问:域名需要备案吗? 回:如果你使用的是国内服务器需要备案域名,如果你使用的是国外服务器那就不需要备案 问:个人可以做吗? 回:个人也可以 问:小程序需要授权吗? 回:我资源网发布的是无授权版本,足够研究你学…

OpenAI 插件可以让 ChatGPT 做什么?

2010年苹果发布了iPhone4&#xff0c;那一年我本科同学在iPhone上开发了一款应用&#xff0c;名字叫"万年历"&#xff0c;可能有不少人都用过&#xff0c;然后他就财富自由了。 今天&#xff0c;OpenAI官宣ChatGPT支持插件开发&#xff0c;你最想开发的插件是什么功能…

最新重磅!ChatGPT插件商店全开放!我发现了未来互联网的新入口

四月初&#xff0c;当ChatGPT首次提出联网和插件计划并放出测试Demo的时候&#xff0c;曾着实让人们惊艳了一把。 从当时的内部测试来看&#xff0c;ChatGPT不仅能够比搜索引擎更加智能地来帮你查找最新信息&#xff0c;还能够变身为“App Store”成为万能应用生态的总入口&am…