ChatGPT 速通手册——开源社区的进展

开源社区的进展

在 ChatGPT 以外,谷歌、脸书等互联网巨头,也都发布过千亿级参数的大语言模型,但在交谈问答方面表现相对 ChatGPT 来说都显得一般。根据科学人员推测,很重要的一部分原因是缺失了RLHF(Reinforcement Learning with Human Feedback,人类反馈强化学习)和PPO(Proximal Policy Optimization,近线策略优化)部分。因此,开源社区开始尝试在当前开源的千亿级参数大语言模型基础上,添加 RLHF 技术,尽力复现 ChatGPT 效果。

目前已知有两个开源项目在进行中:

  • colossal:https://github.com/hpcaitech/ColossalAI/tree/main/applications/ChatGPT
  • chatllama:https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama

目前而言,尚未看到这两个项目的实际性公开测试结论。一些零星的,对 LLAMA 模型的单机版体验报告,也都表示达不到 meta 公司发表的 LLAMA 论文中宣称的,更小参数规模匹配 GPT-3 效果的程度。

不过多年来开源社区和商业厂商分阵营对抗的历史经验,依然让很多人目光投向了还在蹒跚学步的开源模型们。甚至已经有岗位招聘中,开始要求"熟悉学界、业界最新研究成果,包括但不限于 instructGPT、LLaMA、LaMDA,国内的悟道、M6 等大模型"。

即使有了开源模型的第一步基础,要通过开源技术,在本地化部署环境中完整复现 ChatGPT,依然还有重重难关。

首先,ChatGPT 已知是千亿级参数规模的大模型,单独一张 GPU 卡连最基础的加载都无法完成。本地化训练需要大规模的 GPU 并行计算能力。openai 公司没有公布 ChatGPT 的训练成本,但外界有多种不同的猜测。第一种猜测依据 openai 曾经公开的 GPT-3 训练数据,根据当时 V100 显卡的公有云最低优惠包年价,计算得到理论极限最低成本为 460 万美元。第二种猜测依据 AI 业界著名人士 Elliot Turner 的推文,但他没有提供任何消息的准确来源,据称是 1200 万美元。

此外,还有一些其他可类比的情况。比如上一次震惊世界的 AI,围棋界的 alphago,训练投入是3500 万美元。比如 NVIDIA 公布自己的千亿级参数规模大模型 Megatron-LM,训练过程使用了 3072 张 80GB A100 显卡。根据市价,一张 A100 显卡大概需要两万美元,这 3072 张显卡的市价超过六千万美元,转换为人民币大概在四伍亿元左右。

考虑到 GPU 硬件技术的发展,每一代 CPU 产品性能都有接近 50% 的提升,重新训练一个 ChatGPT 的成本肯定会逐渐下降,但短期来看,至少两三年内,还不是一般科技公司可以畅想的未来。大家更可能的选择,是在大公司的模型或云服务基础上,实现自己的上层应用。

其次,ChatGPT 作为 GPT-3.5 的兄弟模型,在标准的 GPT 思想以外,还加入了 RLHF(Reinforcement Learning from Human Feedback)技术。并针对 Chat 这个场景,引入了和 instructGPT 不同的标注数据:由专门的人员,编写一部分对话数据加入训练。这些对话中,他们即扮演提问用户,也扮演 AI 机器人。然后 ChatGPT 在强化学习的奖励模型中,又让专门的人员对随机生成的若干条回答手动标记排名,通过 PPO(Proximal Policy Optimization)策略进行微调。

在初始训练中,openai 公司只雇佣了 40 个标注人员。但产品上线以后,ChatGPT 两个月内获取了 1 亿用户,海量标注数据在产品运行中自然而然的产生。在最近一次用户协议迭代中,openai 公司宣布直接使用 API 调用 ChatGPT 能力的用户数据不会被用于训练。换言之:通过网页端直接聊天的数据,已经足够 ChatGPT 的模型优化更新了。

中国在以往的 AI 应用中,同样大量使用了标注手段,相对低廉的人工成本和工程师成本在这方面也有一定的优势。但这些数据,是否会公开成为开源模型的一部分,供所有公司使用?还是沿着 ChatGPT 的路线,几家大公司比拼谁能更早构建用户反馈数据的护城河?

最后,即使获得了可靠的预训练大模型,在本地化部署环境做推理计算,依然有较高的成本。对特定领域内容进行微调也有一定难度。可能后续还是需要引入一些模型压缩方案,例如量化、蒸馏、剪枝、参数共享等等。知识蒸馏是之前大模型压缩的常用方案,但目前 ChatGPT 只开放 API 不开放模型,就很难直接进行知识蒸馏。一种可能的途径是利用 ChatGPT 的思维链功能,将问答记录里的思维链过程作为压缩小模型的训练数据。但这种使用方式在 openai 的用户协议中是明确禁止的。

无论如何,作为 ChatGPT 技术的使用者,我们可以关注类似技术的迭代更新,并保持对几年后,技术普及化的美好期待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8831.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023最新ChatGPT网站源码+支持ChatGPT4.0+支持Midjourney绘画+用户会员套餐+用户每日签到领取+后台管理+一键更新版本

2023最新ChatGPT网站源码支持ChatGPT4.0支持Midjourney绘画用户会员套餐用户每日签到领取后台管理一键更新版本,支持手机电脑不同布局页面自适应。 一、系统安装教程 一台VPS服务器(CentOS 7 64 ) 搭建宝塔面板 解析绑定域名 上传程序至根目录…

ChatGPT帮我编程自动演奏手机钢琴一曲《故乡的亲人》

我是如何紧跟新技术革命,玩转ChatGPT,帮我电脑Windows,树莓派Linux和手机Android三者数码硬件控制和软件开发编程技术突飞猛进的!首先确立一个学习目标,就是数码和音乐控制编程结合,紧紧抓住最新出现的科技…

类ChatGPT的各种语言大模型LLM开源Github模型集合​

作为开发人员,面对堪称科技奇点爆发的ChatGPT,我们如何应对。当然是努力跟进,虽然ChatGPT不开源,但是有诸多不输ChatGPT的各类语言大模型LLM有分享。我们筛选出其中影响力较大的各个开源Github仓库,收录到 类ChatGPT的…

如何在DOS上,和ChatGPT聊天?(暴露年龄了吗?

MixGPT MS-DOS是一种早期操作系统,全称为Microsoft Disk Operating System。在上个世纪80年代被广泛使用,成为IBM PC的标准操作系统。作为一个基于命令行的操作系统,用户需要通过键盘输入命令来完成操作。正是因为MS-DOS的成功,为…

ChatGPT报错:Sorry, you have been blocked解决方法

今天打开ChatGPT,发现再一次报错了! 又一次出问题了。。。。。。。无语! 原因分析 1、内容过滤:某些平台或网站可能使用内容过滤系统,该系统可能将AlI语言模型视为潜在的风险,从而对其进行封锁或限制。这…

2023数字化转型十大趋势(限时领取)

点亮智库&中信联团队基于多年来对数字化转型的研究和对十万家企业服务实践,形成了《数字化转型十大趋势》。 趋势一: 数据要素催化传统要素连锁化学反应的聚合效应显现 数据要素价值开发,包括激活传统要素价值潜能和开发数据要素自身新价…

ChatGPT爆火出圈,高质量文本标注数据成关键

“2022年11月30日,OpenAI发布了ChatGPT——一个对话式AI,上线仅五天,注册用户数突破100万,爆火出圈,成为社会热议话题。截止今年1月末,ChatGPT的月活用户数量破亿,成为史上用户数增长最快的消费…

“ChatGPT爆火后,NLP技术不存在了”

允中 发自 凹非寺量子位 | 公众号 QbitAI 从2012年到2022年,机器学习引发的新一轮人工智能热潮已经十年。 巧合的是,2022年的Diffusion和ChatGPT,以大众可感知、可体验的方式,让大模型涌现的超能力成功破圈。 从学术界到工业界&am…

ChatGPT可怕吗?还有更可怕的

你是否想过, 类似ChatGPT人工智能的应用, 将来会极其火爆? 工作停摆咋整?不能恰饭咋整? 社恐发作咋整…… 试试彼时的网络人工智能, 把知识图谱和神经网络结合起来用, 答案会自己往外蹦。…

互联网晚报 | 李彦宏回应:如何看待AI代替人类工作;广汽三菱回应退出中国传闻;HM回应女子试衣用新衣垫脚...

阿里巴巴设立六大业务集团,张勇兼任阿里云智能集团CEO 3月28日,阿里巴巴集团董事会主席兼首席执行官张勇发布全员信,宣布启动“16N”组织变革。在阿里巴巴集团之下,将设立阿里云智能、淘宝天猫商业、本地生活、菜鸟、国际数字商业…

中国算力的想象力有多大?|产业特稿

巨头入场和“东数西算”的助推,让中国离这个万亿级算力蓝海更近了一步。 作者|思杭 编辑|皮爷 出品|产业家 2023年初,在青岛、济南、日照等12座城市,一座座崭新的大型数据中心拔地而起。 其中,最引人瞩目的属2月23日&#xff…

深度解析国产AI芯片发展历程与厂商

原文链接:深度 | 国产AI芯片,玩家几何 (qq.com) 从2022.11.30的ChatGPT,到2023.6.13的360智脑大模型2.0,全球AI界已为大模型持续疯狂了七个多月。ChatGPT们正如雨后春笋般涌现,向AI市场投放一个个“炸弹”:…

吴军 | ChatGPT七问七答

苇草智酷 作者 | 吴军 谷歌中日韩搜索算法主要设计师、知名人工智能、自然语言处理专家 转自 | 响铃说 从野蛮社会到人工智能,计算机科学家吴军为你讲解ChatGDP的来龙去脉。 4月3日晚上,吴军就人工智能和ChatGPT等当下热议的话题展开了一次直播。 Q1&a…

我实测了国内外GPT,问了10个问题,差点把电脑砸了...

观点| Mr.K 主笔| Wendy.L 编辑| Emma 来源| AI新猿人(ID:aixyr2023) 虽然ChatGPT早就火出圈好几个月,但是我敢保证有好多人还是不知道GPT三个字母代表什么。 G代表的是generative,表示有生产力的; P代表的是pre-trained 的意…

文心一言 VS chatgpt (6)-- 算法导论2.3 1~2题

一、使用图 2-4作为模型,说明归并排序在数组 A(3,41,52,26,38,57,9,49)上的操作。 文心一言: 使用图 2-4作为模型,说明归并排序在数组 A(3,41&a…

文心一言 VS chatgpt (14)-- 算法导论3.2 2~3题

二、证明等式(3.16):a ^ {\log_b c} c ^ {\log_b a}。 文心一言: chatgpt: 我们需要证明的等式为: a log ⁡ b c c log ⁡ b a a^{\log_b c} c^{\log_b a} alogb​cclogb​a。 首先,将 l…

文心一言 VS chatgpt (3)-- 算法导论2.1

一、以图 2-2 为模型,说明INSERTION-SORT 在数组 A(31,41,59,26,41,58)上的执行过程。 文心一言: 以图 2-2 为模型,说明INSERTION-SORT 在数组 A(31,41,59&…

文心一言 VS chatgpt (16)-- 算法导论4.1 1~2题

一、当A的所有元素均为负数时,FIND-MAXIMUM-SUBARRAY返回什么? 文心一言: 当A的所有元素均为负数时,FIND-MAXIMUM-SUBARRAY返回-1。 这是因为在二进制中,当所有元素均为负数时,A的每个元素都对应一个负数&#xff…

文心一言 VS chatgpt (1)-- 算法导论1.1

1.给出现实生活中需要排序的一个例子或者现实生活中需要计算凸壳的一个例子。 文心一言: 现实生活中需要排序的一个例子: 在一个商店里,顾客需要购买一些商品。他们需要按照价格从低到高排序,以便更容易地找到他们想要的商品。…

letcode算法,ChatGPT来救场(每日一学)

ChatGPT与letcode ChatGPT解释说明一个时间复杂度小于 O(n2) 的算法 众所周知ChatGPT是一种大型语言模型,使用深度学习技术学习大量的语料库,从而模仿人类语言和思维方式,回答用户的问题 我们那他来辅助letcode刷题,有答疑还有详细…