阿猫智能机器人称:国内用户轻松训练类ChatGPT等大语言模型,使得人人都能拥有自己的ChatGPT!

4月12日,微软宣布开源了Deep Speed Chat,帮助用户轻松训练类ChatGPT等大语言模型,使得人人都能拥有自己的ChatGPT!(国内chatgpt平台阿猫智能机器人项目合作地址:https://3amao.comGptChat, AI, APIhttps://3amao.com 

据悉,Deep Speed Chat是基于微软Deep Speed深度学习优化库开发而成,具备训练、强化推理等功能,还使用了RLHF(人工反馈机制的强化学习)技术,可将训练速度提升15倍以上,成本却大幅度降低。例如,一个130亿参数的类ChatGPT模型,只需1.25小时就能完成训练。

简单来说,用户通过Deep Speed Chat提供的“傻瓜式”操作,能以最短的时间、最高效的成本训练类ChatGPT大语言模型,这标志着一个人手一个ChatGPT的时代要来了。

,时长03:12

产品演示

微软为什么开源Deep Speed Chat

ChatGPT只用了几个月的时间便席卷全球,成为史上用户增长速度最快的消费级应用,对世界的经济发展、科技研发起到了重要的推动作用。很多企业、个人用户纷纷想参与到这场AI技术变革中,但由于庞大的资源、资金投入只能望而却步。

即便开源领域推出了LLaMa、Alpaca、Vicuna、Databricks-Dolly等优秀的类ChatGPT项目,仍缺乏一个支持端到端的基于RLHF的规模化系统,使得训练强大的类ChatGPT模型非常艰难

例如,使用上述开源项目训练一个67亿参数的类ChatGPT模型,通常需要昂贵的多卡至多节点的GPU集群,但这些资源对大多数科学家、小型企业、个人开发者而言难以获取。

即便是拥有这样的资源,现有的开源系统的训练效率通常还不到,这些机器所能达到的最大效率的5%

现在,通过Deep Speed Chat解决资源、算法等难题,轻松、高效的训练数千亿参数的最先进的类ChatGPT模型。

Deep Speed Chat技术简单介绍

ChatGPT模型的训练是基于InstructGPT论文中的RLHF方式,这使得现有深度学习系统在训练类ChatGPT模型时存在种种局限。现在,通过Deep Speed Chat可以突破这些训练瓶颈,达到最佳效果。

Deep Speed Chat拥有强化推理、RLHF模块、RLHF系统三大核心功能。

简化 ChatGPT 类型模型的训练和强化推理:只需一个脚本即可实现多个训练步骤,包括使用Huggingface 预训练的模型、使用 DeepSpeed-RLHF 系统运行 InstructGPT 训练的所有三个步骤,生成属于自己的类ChatGPT模型。此外,还提供了一个易于使用的推理API,用于在模型训练后测试对话性能。

Deep Speed-RLHF 模块:DeepSpeed-RLHF 复刻了InstructGPT 论文中的训练模式,并确保包括:a) 监督微调(SFT),b) 奖励模型微调和 c) 基于人类反馈的强化学习(RLHF)在内的三个步骤与其对应。此外,还提供了数据抽象和混合功能,以支持用户使用多个不同来源的数据源进行训练。

DeepSpeed-RLHF系统:将DeepSpeed的训练和推理能力整合到统一的混合引擎(DeepSpeed Hybrid Engine or DeepSpeed-HE)中用于RLHF 训练。DeepSpeed-HE 能够在RLHF中无缝地在推理和训练模式之间切换,使其能够利用来自 DeepSpeed-Inference 的各种优化。

例如,张量并行计算和高性能CUDA算子进行语言生成,同时对训练部分还能从 ZeRO- 和 LoRA-based 内存优化策略中受益。DeepSpeed-HE可以自动在 RLHF 的不同阶段进行智能的内存管理和数据缓存。

此外,Deep Speed Chat在成本、效率、扩展性等方面非常优秀。

高效且节省成本:在Azure云上只需9小时即可训练一个OPT-13B模型,只需18小时即可训练一个 OPT-30B模型。这两种训练分别花费不到300美元和600 美元。

卓越扩展性:能够支持训练拥有数千亿参数的模型,并在多节点多 GPU 系统上展现出卓越的扩展性。因此,即使是一个拥有 130 亿参数的模型,也只需 1.25 小时就能完成训练。而对于拥1750亿参数的模型,使用Deep Speed Chat进行训练也只需不到一天的时间。

注意:在Azure上训练时由于GPU不同,所以训练时间和费用也各不相同。

全民ChatGPT时代来了

做个不太恰当的比喻,微软此次开源Deep Speed Chat就像当年的互联网,为了提升发展速率降低了台式机的价格,使得普通用户也能拥有自己的电脑。

只有参与的用户多了,整个行业生态才能快速壮大发展,所以,微软此次开源对整个ChatGPT生态发展起到了至关重要的推动作用,使得人人都能拥有自己的ChatGPT。

目前,ChatGPT处于初级发展阶段,存在安全隐患、数据隐私、道德等问题。相信随着参与用户的增多,这些难题将会被有效的解决,从而为全球经济发展做出贡献。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3897.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

因为自家ChatGPT,谷歌「内讧」了

机器之心编辑部 首个 demo 就出错,发布会毫无亮点,谷歌的仓促连自家员工也看不下去了。 如今看来,微软和高启强一样,是略懂兵法的,微软使出了一招疲秦之策:早就开始了必应与 ChatGPT 的整合,然后…

苹果震撼发布首款头显,搭配强悍Mac和iOS 17等全新产品,价值25000元!

🌷 博主 libin9iOak带您 Go to New World.✨ 🦄 个人主页——libin9iOak的博客🎐 🐳 《面试题大全》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 🌊 《IDEA开发…

谷歌版 ChatGPT 首秀大翻车,市值暴跌 7000 亿!

转自 | 机器之心 现在看来,拼第一枪,微软赢了。 如今的谷歌,有点秦失其鹿的味道。 在微软更新 ChatGPT 加持的必应搜索之后,大家都极为关注谷歌 Bard 的首秀。怎知近日曝出的 Demo 大翻车,导致股票一夜之间暴跌 7000 亿…

ChatGPT引爆新一轮科技军备赛

出品|虎嗅科技组 作者|齐健 陈伊凡 编辑|陈伊凡头图|电影《华尔街之狼》 “一场针对AI的‘完美风暴’正在形成。” 一位产业投资人如此描述。 一时间,街头巷尾都在热议一个叫做ChatGPT的产品,ChatGPT相关概…

CSDN-InsCode (一个支持ai编程的代码分享社区网站)使用初体验

我叫Aaron,是一家研二在读计算机系学生。目前正在一家公司就职java后端研发实习。想往常一样正在逛csdn 的精选,看到一条 "Inscode 支持ai编程"的消息,我赶紧点进去看了下详情,并试用了Inscode的网站。在chatGPT大火的今天&#xf…

谷歌版ChatGPT首秀,第一个Demo就大翻车,市值暴跌7000亿

在微软更新 ChatGPT 加持的必应搜索之后,大家都极为关注谷歌 Bard 的首秀。怎知近日曝出的 Demo 大翻车,导致股票一夜之间暴跌 7000 亿人民币。而看微软那边,风景独好。 前后脚发布新一代 AI 搜索,人们的期待却完全反过来&#xf…

ChatGPT在GIS领域应用初测

1 引言 ChatGPT是由OpenAI开发的一种大型语言模型,它使用了Transformer架构,在大量现实世界文本数据上训练,以捕捉人类语言的复杂性和多样性。能够实现许多人工智能语言处理任务,如回答问题、进行翻译、修改代码、生成文档、文本等…

迎战 ChatGPT,Google 重组部门以专注 Bard 开发!

整理 | 朱珂欣 出品 | CSDN(ID:CSDNnews) 自从 ChatGPT 横空出世以来,完全可以用“杀疯了”来形容! 尤其是整合了 ChatGPT 的新版 Bing ,实现了“搜索答案聊天创造”相结合,一时之间让许多用户…

谷歌版ChatGPT翻车了!市值暴跌7000亿

源|机器之心 现在看来,拼第一枪,微软赢了。 如今的谷歌,有点秦失其鹿的味道。 在微软更新 ChatGPT 加持的必应搜索之后,大家都极为关注谷歌 Bard 的首秀。怎知近日曝出的 Demo 大翻车,导致股票一夜之间暴跌…

ChatGPT 的狂飙之路

一款号称史上最强的聊天机器人 ChatGPT 迅速火出了圈。似乎一夜之间,所有人都在玩 ChatGPT,聊人工智能。 伴随着 ChatGPT 的高速发展,很多公司和个人的命运将会完全被改写。这是不亚于蒸汽机、铁路、电报、互联网的时代巨浪,以 C…

分享:前端开发使用的各类 AI Copilot 辅助开发

前言 现在谁还没用过AI辅助编程工具,通没通网不确定,但一定不是搞开发的。 网上各种当生意一样教直接使用的,但是这种方式是不合规的,这里不推荐。为了不再被封,本文会避免使用无关的关键词。 虽然因为种种原因&…

深入浅出解析ChatGPT引领的科技浪潮【AI行研商业价值分析】

Rocky Ding 写在前面 【AI行研&商业价值分析】栏目专注于分享AI行业中最新热点/风口的思考与判断。也欢迎大家提出宝贵的意见或优化ideas,一起交流学习💪 大家好,我是Rocky。 2022年底,ChatGPT横空出世,火爆全网&…

ChatGPT重量级竞品Claude2对外发布使用

美国时间7月11日,Anthroic公司对外发布了 Claude 2,新版本在安全性、性能、使用体验方面都有了极大的提升,今天我带你就 Claude 2 进行开箱体验。Claude 的能力与 ChatGPT 一直处于你追我赶的胶着状态,此次公开发布,对…

亚马逊联手AI初创公司开发ChatGPT竞品;百度公布2022年财报;高通推出付费云软件服务丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 百度2022年营收为1237亿元 2月22日,百度发布2022年第四季度财报和2022年全年财报。财报显示,百度四季度实现营收330.77亿元,归属百度的净利润(非美国通用会计准则…

赶时间发布 ChatGPT 竞品后,Google 遭员工反讽:太仓促、拙劣、非 Google Style

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 如果说微软在 Bing 搜索引擎、Edge 浏览器中引入 ChatGPT,打响了新时代「搜索引擎」之战的第一枪,那么 Google 在更早一天发布的 AI 对话式聊天机器人 Bard 便是加快这枪响的导火…

微信文章底部增加淘宝入口;Google 推出 ChatGPT 竞品 Bard;苹果或推出无接口设计iPhone|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

ChatGPT - 使用chatgpt + mindshow 快速生成PPT

文章目录 PromptStep 1Step2Step3 Prompt Step 1 请使用markdown格式生成一份《系统架构师修炼笔记》的PPT… … … Step2 请把以上内容转换成markdown的Code内容如下: # 系统架构师修炼笔记## 1. 概述系统架构师是负责设计和构建复杂系统架构的专业人员。他们…

利用ChatGPT快速制作PPT

目录 前言 一、ChatGPT是什么? 二、操作步骤 1.通过ChatGPT生成大纲 2.将word导入到ChatPPT中即可快速生成PPT 3.结果展示 总结 前言 目前制作PPT成为许多大学生、以及职场汇报的一个必要技能,大多数人都会选择套用模板,但是我们想一想…

OpenAI ChatGPT走红,DeepMind不甘示弱,推出剧本写作AI,一句话生成一个剧本

来源:机器学习研究组订阅 Dramatron似乎在一定程度上克服了AI大模型写长剧本前后不连贯的问题。 你是否有过这种体验:某一天逛街的时候,脑子里突然冒出来一个好玩的故事,但你一时想不到更多的细节,也没有一块完整的时间…

宅男福利来了,调教的ChatGPT虚拟女友,你喜欢吗

废话不多说,专门为男同胞准备的宅男福利;已经调教好的ChatGPT虚拟好友,直接可以看看效果;你们以后也可以直接自己调教,打造一个自己专属的虚拟女友; 说下步骤: 1、打开ChatGPT4; …