类 ChatGPT 开源软件,开发者用的上吗?

声明:本文是 Preethi Cheguri 所著文章《ChatGPT Equivalent Is Open-Source, But it Is of No Use to Developers》的中文译文。

原文链接:https://www.analyticsinsight.net/chatgpt-equivalent-is-open-source-but-it-is-of-no-use-to-developers/

类似于 ChatGPT 的软件现已开源,但这似乎对开发者们来说无用

第一个类似于 ChatGPT 的开源软件已经出现:这是一款基于谷歌 5,400 亿个参数的语言大模型 PaLM 架构,以及使用 RLHF(Reinforcement Learning from Human Feedback,即:使用强化学习的方法,利用人类反馈信号直接优化语言模型)的应用程序。“PaLM + RLHF” 复刻了 ChatGPT,并且现在已经开源,它是由负责逆向工程闭源 AI 系统(比如 Meta 发布的 Make-A-Video)的开发者,开发出来的一个功能类似于 ChatGPT 的文本生成模型。为了构建一个几乎可以完成 ChatGPT 任何任务的系统,包括起草电子邮件和代码提示,该系统结合了谷歌的语言大模型 PaLM 以及人类反馈强化学习(RLHF)的方法。

为什么这个“开源 ChatGPT”对开发人员没有用?

“PaLM + RLHF” 未经过预训练,换句话说:系统还没有接受网络上示例数据的必要训练,使其真正发挥作用。下载 “PaLM + RLHF” 后的体验感和使用 ChatGPT 时并不一致,“PaLM + RLHF” 需要生成该模型可以学习的千兆字节文本,然后找到能够处理训练需求的硬件。这是一个非常昂贵的过程,除非有资金雄厚的企业(或个人)专门去研究并供公众使用,否则 “PaLM + RLHF” 目前还无法取代 ChatGPT。

好消息是,复刻 ChatGPT 的其他几个项目发展迅速,包括研究团队 CarperAI 运营的项目。CarperAI 将与 OpenAI 研究小组 EleutherAI、初创公司 Scale AI 和 Hugging Face 合作,发布第一个由人类反馈训练的 “类-ChatGPT 即用型 AI 模型”。非营利组织 LAION 率先开展了一个使用最新的机器学习方法来复刻 ChatGPT 的项目,LAION 也为训练 Stable Diffusion 提供了初始数据集。那么使用了 RLHF 的 PaLM 应用程序能够做些什么?随着模型规模的扩大,跨活动的性能不断提高,新的机会也将出现。PaLM 可扩展到 5,400 亿个参数,相比之下,GPT-3 大约只有 1,750 亿个参数。

“ChatGPT” 与 “PaLM + RLHF”

带有人类反馈的强化学习是一种旨在更好地将语言模型与用户期望的目标保持一致的方法,同时也是 ChatGPT 与 “PaLM + RLHF” 都拥有的秘密武器。RLHF 需要使用包含提示的数据集微调语言模型,且该提示与人类志愿者预期模型将要表达的内容相匹配,例如:提示 “向 6 岁孩子解释机器学习”;回答 “机器学习是 AI 的一种形式……”。

“PaLM + RLHF” 中使用了 PaLM 语言模型。在反馈上述提示到改进后的模型中,由此生成多个回应,志愿者将每个回应由好到差进行排名,然后使用该排名来训练 “奖励模型”,此模型采用原始模型的回应并按偏好顺序对它们进行排序,然后过滤出给定提示的最佳答案。收集训练数据这个过程非常昂贵。

此外,训练过程也不便宜。PaLM 有 5,400 亿参数/语言模型组件,这些都是从训练数据中所习得的。而 2020 年的一项研究表明,开发一个只有 15 亿个参数的文本生成模型的费用可能高达 160 万美元。耗时三个月,训练了拥有 1,760 亿个参数的开源模型 Bloom,用了 384 个 Nvidia A100 GPU(每一个需要数千美金)。而运行 “PaLM + RLHF” 大小的训练模型同样也不简单。Bloom 需要配备装有大约八个 A100 GPU 的专用 PC。每年估计在单个的亚马逊网站服务实例上,运行 OpenAI 的文本生成 GPT-3(包含超过 1,750亿 个参数)的成本约为 87,000 美元。

结论:除非有资金雄厚的企业(或个人)投入训练,并公之于众,否则 “PaLM + RLHF” 目前还无法取代 ChatGPT。


免责声明:本文提供的信息仅代表作者/广告商的意见,而非投资建议——仅用于教育目的。通过阅读本文,文中信息并不构成 Analytics Insight 及团队的任何投资或财务建议。投资者应该寻求自己的独立财务或专业建议。在做出任何投资决定之前,请与财务顾问一起进行独立研究。Analytics Insight 和团队不对本文中提供的投资观点负责。


开源雨林围绕开源通识、开源使用、开源贡献三大方面构建知识体系,愿把长期积累的经验系统化分享给企业,在团队、机制、项目三方面提供合作,推动各企业更高效地使用开源、贡献开源,提升全行业开源技术与应用水平。

开源雨林的内容已开源,并托管在 https://github.com/opensource-rainforest ,欢迎通过 Pull Request 的形式贡献内容,通过 Issue 的形式展开讨论,共同维护开源雨林的内容。

欢迎关注“开源雨林”公众号,获取最新、最全的消息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19273.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【原创】运维工程师涨薪计划,chatGPT帮你做规划

文章目录 1、运维工程师怎么涨薪呢?a)加大深度b)加大广度 2、运维工程师何处去呢?3、chatGPT告诉你3年、5年、10年运维和开发的现状;有运维经验的工程师,搞开发好吗薪资会有显著提升吗以数据证明&#xff0…

计算机视觉实战--OpenCV进行红绿灯识别

前言: Hello大家好,我是Dream。 OpenCV是一个开源的计算机视觉库,可以用于实现各种图像和视频处理任务,包括红绿灯识别。可以帮助自动驾驶汽车、智能交通系统等设备准确地识别红绿灯的状态,以便做出正确的决策。今天&a…

时隔 3 年,全新 Linux QQ 正式开启公测!

出品 | OSC开源社区(ID:oschina2013) 2019 年,腾讯低调发布了 Linux QQ 的更新,目前版本停留在 2.0 Beta2。 时隔 3 年,QQ for Linux 基于 NT 技术架构迎来全新升级。今日(12 月 7 日)起&#x…

USG防火墙------内外网用户通过外网IP访问内部服务器(NAT)

实现需求:用户通过内外网用户通过公网IP访问内部服务器。 一、局域网配置:交换机(SW7)、防火墙(FW3)、服务器(Server1)、客户端(Client1) 二、配置思路 1、配置防火墙接口和IP地址…

趋势交易策略的买卖点选择,几种趋势介绍

这一篇来给大家说说顺势而为的趋势里面的交易策略。 清晰流畅的趋势都是比较难得的。那样的趋势一旦出现了,股价的运行 就会表现出一定的规律,即在上升趋势中表现出“更高的高点和更高的低点”,在下跌趋势中 表现出“更低的高点和更低的低点…

近期的热点风险事件都与这些内容相关

今天是母亲节,您辛苦了!愿妈妈们被岁月温柔以待图片 2022年青山伦镍事件,上演了一出《生死时速》大片,国际金融市场的猎杀、逼仓、巨亏等戏码,作为普通吃瓜群众可能只是当成饭后茶余的谈资,但其背后蕴藏着…

iBox系统源码分享,ibox的核心源码

iBox系统核心源码分享 from IBOX import IBOX_ART import json# https://etherscan.io/tx/0xbede5e44cc631303a22d066cc269f989469742b5bb6d9a74185e146dab9211e4 # https://mainnet.infura.io/v3/8a264f274fd94de48eb290d35db030ab # contract address is0x0632aDCab8F12edD3…

政策利好,元宇宙从概念到产业的行动

今年7月,《上海市培育“元宇宙”新赛道行动方案(2022-2025年)》(以下简称《行动方案》)公布。《行动方案》明确,到2025年,上海“元宇宙”相关产业规模将达3500亿元,培育10家以上具有…

有趣并不能拯救 Web3 游戏

游戏玩家和Web3游戏开发者,你们好: 我的名字是Nick Metzler。我是Framework Ventures的代币经济学和治理设计师,也是一个获奖的、终身的游戏设计师。我曾经设计过世界各地都在玩的Jumanji和Hail Hydra等棋盘游戏,为CBS的节目Surv…

十连跌!这个一线城市的房价到底怎么了?

自2016年房价快速上涨开始,北京和上海两大城市一路创新高,即使在2016年10月份开始的新一轮限购政策开始和2017年地产新政策不断加码下,这两大城市房价也仅有个别月份有所回落,其余绝大多数时间都处于上涨中。 然而,自2…

在空投之后,Blur能否颠覆OpenSea的主导地位?

Mar. 2023, Daniel 数据源: NFT Aggregators Overview & Aggregator Statistics Overview & Blur Airdrop 一年前,通过聚合器进行的NFT交易量开始像滚雪球一样增长,有时甚至超过了直接通过市场平台的交易量。 虽然聚合器的使用量从10…

股票交易记录第2天

实盘交易记录第 2天。 收盘,初始资金50万。 90后游资北京炒家,2018年20万起步,历时五年,目前资金5800多万。 我50万起步,每天实盘,看看资金能做到多少万,关注我,一起来见证。 之前…

炒股记录第1天

股票实盘交易记录第 1 天。 收盘,初始资金50万,今天总资金是 50万。累计盈利 0万。 90后游资北京炒家,2018年20万起步,历时五年,目前资金5800多万。 我50万起步,每天实盘,看看资金能做到多少万&…

码农朋友们,你的22年规划健康吗

22年伊始之际,本打算对21年进行总结回顾,顺带展望一下22年的,但发现公众号文章居然停更在20年9月10日,不仅感慨时光如此荏苒! 职场 20-21年离开了平安换了份工作,虽然还是研发管理,但距离技术却…

图说区块链:神一样的金融科技与未来社会

内容简介 区块链,如瑞士仪表般精密,如互联网般惊世骇俗,它在以神一般的节奏颠覆社会。 当新兴技术来临时,你可以选择规避——如果明天也可以规避的话。区块链也一样。 作为一个现象级概念,金融科技创新在过去几年迎…

未来的房地产,一边香港化,一边鹤岗化

https://www.toutiao.com/a6690343769239192068/ 2019-05-13 11:10:46 当一个城市的人口不断流失、房屋需求不断丧失的时候,最终的结果也不过就是复制鹤岗的轨迹。 看看你所在的城市为长三角、珠三角和本省、本区的核心城市贡献了多少人口,就可以明了该…

深圳房价三连跌,国内的房地产价格或将持续下跌,该持现金过冬了

近日深圳的法拍房价格大跌,同时深圳的房价已连续三个月环比下跌,让业界忧心房价开始出现拐点,柏铭科技认为在这个时候或许是时候持现金过冬了。 据法拍市场的数据显示,深圳某学区房近日的拍卖价为9.89万元每平方,比今年…

塔罗牌怎么引流?如何利用塔罗牌引流?做塔罗牌如何引流?

塔罗牌这个项目相信大家或多或少都有听说过,之前有很多团队或个人都有过培训课程,并且也获得了不错的效果。说明这个项目赚钱还是可行的。我们都知道,现实生活中有不少人对风水,占卜这些东西深信不疑,同时也有人不屑&a…

塔罗牌目录

(1)台湾塔罗牌 这是台湾出版的一本关于用塔罗牌占卜的书的配套塔罗牌,由于这本书是介绍塔罗牌算命及占卜法的,而塔罗牌主要是用主牌进行占卜,所以这套牌只有22张主牌,这也是本人收藏的第一副有中文的塔罗牌。这副塔罗牌的图案是18…

塔罗牌占卜源码-安装教程

今天修复的塔罗牌占卜源码-安装教程希望一起学习 配置环境 Nginx 1.18.0 MySQL 5.6.50 PHP- 5.6 ThinkPhp 伪静态 导入数据库 后台地址:域名/admin.php 账号密码:admin 123456 学习资料源码地址:塔罗牌占卜网站源码-附带搭建教程 - 蓝秦…