没有银弹,ChatGPT并不是凭空出现的神话。

ChatGPT热度高居不下。从12月至今,其热度已经持续了三个月有余,甚至还有继续延续的趋势。

  • ChatGPT上线后的短短5天内,用户破百万,一朝引爆全网关注,AI概念股价格飙升。

  • 新版微软Bing上线内测,一个更加智能和显示引用来源的聚合型搜索助手出现。

  • 国内大厂纷纷官宣自家布局,不甘落后。百度官宣“文心一言”,阿里、京东、腾讯等也放出类似消息。

  • 复旦大学团队发布类ChatGPT模型MOSS,由邱锡鹏教授团队打造。

先行者已经迈出脚步,作为未来新时代的预示产品,ChatGPT到底为何出现?

背后的技术

以下部分内容来自王守崑老师在12月份的文章:

ChatGPT 的基础模型是 InstructGPT,而InstructGPT 是在 GPT-3 基础之上,增加了人工标注数据以及 OpenAI API 开放后用户提交的提示词(prompts),并利用基于人工反馈的强化学习模型精调GPT-3模型做得到的。

因此,ChatGPT 的基础依旧是 GPT-3(确切的说是InstructGPT,为简便起见我们使用GPT-3),OpenAI 官方称其为 GPT-3.5。

自然语言处理包含一系列的常规任务,比如翻译、问答、阅读理解、完形填空、摘要、提纲、推理、补全、文章撰写等等。

通常会事先训练一个语言模型作为基础,根据不同的场景和任务做一定的精调

因此,这个事先训练好的模型决定了解决问题的基本能力。过去几年,在自然语言处理领域的重大进展,就是模型的规模越来越大,训练所需的语料越来越多。

510f1d643c572566ddd1a349877e726d.jpeg预训练模型规模

有了GPT-3这个语言模型作为基础,ChatGPT 引入了两项非常重要的改进:

  • 引入优质的人工标注数据,以及积累的用户交互数据做问答精调

  • 引入强化学习模型,针对用户意图做优化训练

事实上,这正是为什么 ChatGPT 在问答这项任务上表现如此之好的原因,用论文里的原话说,就是:

aligning language models with human intent.
让语言模型与人类的意图保持一致

GPT-3 是一个基础性的预训练模型,它更像是一个具备通用能力的底座,对外提供能力输出。

ChatGPT 则是架构在其上的具体应用,利用其能力,结合场景特点完成服务。

在问答这个任务中,用户的感受是第一位。并且,这个感受并不是一个非黑即白的开关,而是多维度的评价。

OpenAI 特意严格挑选并组建40人的团队,专门为 ChatGPT 做问答标注,确保这个团队的知识性、多样性和最大程度降低偏见。

多加的这一层强化学习,就是要保证这部分高质量的标注数据进入到模型中形成正向循环,确保“人类的意图”得到贯彻。

b7b9be25309fe60eb3686f42140b8b0b.png基于人类反馈的强化学习框架

高质量的数据 + 强化学习,这更多的是在基础的预训练模型之上针对特定场景、特定任务的优化,基础的模型还是 GPT-3 的 Transformer,因此 OpenAI 把它叫做 GPT-3.5 而非 GPT-4。

说起这个 Transformer(是的,和变形金刚是一个词,微软和NVIDIA联合搞了个更大的模型叫 Megatron,威震天,用的也是 Transformer),算是近几年在深度神经网络领域最重要的进展之一。

包括最近一直很热的图片生成服务 Stable Diffusion,其语言理解部分也使用了 Transformer 模型。

相比CNN(Convolution Neural Networks,卷积神经网络)和 RNN(Recurrent Neural Networks,循环神经网络),在自然语言处理任务中,Transformer 通过注意力机制能够在理解上下文的同时,更好的保持对全局的关注。

因此,最近几年越来越多的团队把精力投入到这个模型之中。

强化学习则一直以来在游戏和交互式任务中有非常好的表现,我个人也始终认为强化学习和人类学习知识、适应环境的模式更相似,通过强化学习模型训练出来的行为以及整个的训练过程,我们人类更容易理解、更能够从中获得启发。

这两项技术的结合,在对话这样一个需要重度用户参与、以用户的主观感受为评价标准的场景下,产生了出人意料的惊艳效果。

因此,与其说是单纯的技术突破或更新换代,不如说是技术与场景的完美结合造就了ChatGPT 现象级的成功表现。

技术进展本身也是层层累进、不断迭代而来的,没有什么凭空出世、横扫天下的神话,也没有什么是能解决所有问题的银弹。

有意思的应用

ChatGPT当前更多地是在语言文字的处理上,还没有开始理解语音、图片等等。当ChatGPT开始多模态融合,可以预见的是未来我们会有更多有意思的应用出现。

据可靠消息,越来越来的企业开始接入“类ChatGPT”的产品,赋能或整合进自家应用,降本增效,辅助业务运转。

AI可能会在未来,在多个方面帮助人类工作,一片新的商业蓝海正等待我们探索。

4b2d3eb3d27a5a9cc24b3691b94f113c.jpeg

3月4日晚8点

对谈|王守崑X刘江

ChatGPT背后的产品技术与思想脉络

直播议题

  • ChatGPT成功出圈的产品技术因素有哪些?

  • 大模型的边界到底在哪里?

  • AI商业化的机会和挑战有哪些?

3febfc6617512ae2694add00d4df82ea.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15956.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从rookie到基佬~009:无密码卸载Symantec

今天是变直小技巧 今日份洗脑:无密码情况下卸载Symantec(赛门铁克) 结论:赛门铁克的服务一旦启动,怎么卸载都需要密码,反过来说,你不让他启动,他就是待宰的羔羊。 坐标国内某企业…

网络模拟器 eNSP、EVE-NG、GNS3、Packet Tracert

工欲善其事必先利其器,学习网络不可能都有真实的网络环境可以使用,这时就需要使用网络模拟软件,模拟一些网络环境,构建一些网络拓扑,然后学习研究网络技术 初学时不要在模拟器的选择上纠结,PT、GNS3 就足够…

Umi‘s Friends——突破GameFi传统,游戏界新的P2E潮流先锋

“打破GameFi传统玩法,Umis Friends引领玩赚新趋势”主题AMA活动圆满落幕! 2023年3月25日晚上20点整,Umis Friends官方Discord迎来了一场热闹非凡的AMA活动。此次演讲嘉宾为Umis Friends CTO Mike和中文社区Mod Frank。两位嘉宾为Umis Frien…

关于趋势科技防毒墙网络版的卸载

这个软件我是很佩服 如果不知道密码 卸载很麻烦 网上的方法很多 当然 我这个电脑趋势的卸载 最后成功了 本来是老妈公司的系统 所以说密码不知道 网上最多的情况就是Allow Unistall 的键值不允许由0 改为1 好吧 我也是进了这坑 说说卸载过程 1 1.1 控制面板-&…

EVE-NG 安装

EVE-NG 简介 EVE-NG(全称Emulated Virtual Environment - NextGeneration),继Unetlab 1.0后的Unetlab的2.0新版本,改了名字,原名是UnifiedNetworking Lab统一网络实验室。笔者觉得名字改的非常合理,这款模…

chatgptH5源码开发

hatGPTH5源码开发需要以下步骤: 确定需求:在开发ChatGPTH5应用之前,需要明确用户的需求和目标,以便进行合理的设计和开发。 技术选型:选择适合的前端技术框架和工具,如React、Vue、Angular等&#…

ChatGPT常用的提示语(prompts)系列一

以下内容翻译自:https://github.com/f/awesome-chatgpt-prompts 1、作为Linux终端 英文原文: I want you to act as a linux terminal. I will type commands and you will reply with what the terminal should show. I want you to only reply with…

5个令人惊艳的AI项目,开源了。。

大家好,我是 Jack。 今天清明,小伙伴们都去哪里玩了? 上个月我已经出去浪过了,清明就老实在家歇着了。 翻看了一些最近热点的开源项目,发现还是 AIGC 的天下。 今天,我将继续着重挑选几个近期的优质开源…

替代MySQL半同步,Meta技术团队推出MySQL Raft共识引擎

【CSDN 编者按】Meta运行着世界上最大规模的MySQL部署之一。该部署驱动着社交图谱以及许多其他服务,如消息、广告和动态。在过去几年中,他们实施了MySQL Raft,这是一个与MySQL集成的Raft共识引擎,用于构建复制状态机。目前已大部分…

突然放大,Midjourney 来中国了!

突然放大,Midjourney 来中国了! 一、 Midjourney内测版本的推出 Midjourney,一款新颖的 AI 视觉艺术平台,近日在中国开放了内测版。这个内测版本在 QQ 频道上进行,每周一和周五的 18:00 开放入口,人数一旦满…

Spring Boot + 规则引擎 URule,可视化配置太爽了!

点击关注公众号,Java干货及时送达 学习 Spring Cloud 微服务的正确姿势! 用上 ChatGPT 啦,强的离谱! 几乎覆盖 Spring Boot 所有操作! 作者:知了一笑来源:juejin.cn/post/7210194936276680759 一…

小米辟谣武汉总部35岁以上员工只保留10%;ChatGPT官方iOS应用上线;ofo创始人赴美创业:卖珍珠咖啡 | EA周报...

EA周报 2023年5月19日 每个星期1分钟,元宝带你喝一杯IT人的浓缩咖啡,了解天下事、掌握IT核心技术。 周报看点 1、马化腾:AI 是互联网百年不遇的机遇 2、OpenAI官方AI聊天机器人ChatGPT上架App Store 3、张勇发全员信:阿里云将分拆…

一文搞懂ChatGPT相关概念和区别:GPT、大模型、AIGC、LLM、Transformer、羊驼、LangChain…..

ChatGPT横空出世后,伴随而来的是大量AI概念,这些概念互相之间既有联系也有区别,让人一脸懵逼,近期大鱼做了GPT相关概念的辨析,特此分享给你。 1)Transformer 2)GPT 3)InstructGPT …

为什么国外程序员加班少?他们这样评价国内996的!

本文原创公众号&#xff1a;不会笑青年&#xff0c;授权转载请联系微信(laughyouth369)&#xff0c;授权后&#xff0c;请在原创发表48小时后再转载。 < END > 作者&#xff1a;不会笑青年 漫画师&#xff1a;空灵的冰 点击右上角 "..." 设为星标&#xff0c;可…

为什么程序猿 996 会猝死,而企业家 007 却不会?

点击蓝色“五分钟学算法”关注我哟 加个“星标”&#xff0c;天天中午 12:15&#xff0c;一起学算法 作者 | 程序员吴小胖 来源 | 程序员吴小胖 有热门推荐? 1.【程序员】全球最厉害的 14 位程序员 2.【GitHub】我在 GitHub 上看到了一个丧心病狂的开源项目&#xff01; 3.【算…

为什么美国程序员不用加班,而中国程序员就只能996?

点击上方“码农突围”&#xff0c;马上关注 这里是码农充电第一站&#xff0c;回复“666”&#xff0c;获取一份专属大礼包 真爱&#xff0c;请设置“星标”或点个“在看”梅宁航 发自 凹非寺量子位 报道 按惯例&#xff0c;先问是不是&#xff0c;再问为什么。 从知乎回答浏览…

为什么程序员 996 会猝死,而老板 007 却不会?

点击“开发者技术前线”&#xff0c;选择“星标”让一部分开发者看到未来转载自公众号&#xff1a;程序员吴小胖 员工白天996&#xff0c;企业家晚上669&#xff01; 最后给读者整理了一份大厂面试真题&#xff0c;需要的可扫码加我微信获取。 前线推出学习交流群&#xff0c;加…

996下的程序员,该如何保证自己的身体健康?

作者&#xff1a;陈大鱼头github&#xff1a;KRISACHAN 自从开始写代码之后&#xff0c;一天里大部分的时间都贡献了给了电脑跟那张从X总办公室里搬回来的人体工学椅了。 鱼头也经历过无数次的 肥胖 -> 减肥 -> 反弹 -> 减肥 -> 再次反弹 -> 不减了 的过程。 在…

比 996 更可怕的是职场 PUA

loonggg 读完需要 5分钟 速读仅需 2 分钟 最近职场 PUA 很多&#xff0c;都上了微博热搜了&#xff0c;起因就是&#xff1a;前火箭少女 101 成员 Yamy 在社交平台公开一段配有字幕的音频&#xff0c;引发热议。在音频中&#xff0c;其所在经纪公司老板徐明朝在内部会议上用 “…

聊一聊人工智能与视频技术的5大发展趋势与应用

随着互联网的快速发展&#xff0c;视频时代已经到来。据统计&#xff0c;目前互联网内容中&#xff0c;视频内容占据高达82%的流量&#xff0c;未来仍将持续增长。今天我们就来聊一聊关于视频技术的发展&#xff0c;以及现在的大热门–人工智能技术与视频技术的结合。 视频技术…