一块GPU搞定ChatGPT;ML系统入坑指南;理解GPU底层架构

2167a49eadb17ec2bb6b3d5cfa50aa0c.jpeg

1. 跑ChatGPT体量模型,从此只需一块GPU

在发展技术,让大模型掌握更多能力的同时,也有人在尝试降低AI所需的算力资源。最近,一种名为FlexGen的技术因为「一块RTX 3090跑ChatGPT体量模型」而获得了人们的关注。

虽然FlexGen加速后的大模型看起来仍然很慢 —— 跑1750亿参数的语言模型时每秒1个token,但令人印象深刻的是,它已经把不可能变成了可能。传统上,大型语言模型(LLM)推理的高计算和内存要求使人们必须使用多个高端AI加速器进行训练。本研究探索了如何将LLM推理的要求降低到一个消费级GPU并实现实用性能。

链接:

https://mp.weixin.qq.com/s/ZdW_jZov3bAcGc_9SqiL-A

2. ChatGPT数据集之谜

至今,OpenAI并没有公开ChatGPT的相关训练数据集来源和具体细节,一定程度上也暂时卡了追赶者的脖子,更何况,业界公认中文互联网数据质量堪忧。本文作者则整理分析了2018年到2022年初从GPT-1到Gopher的相关大型语言模型的所有数据集相关信息,希望帮助有志于开发“类ChatGPT”模型的团队少走一步弯路。

链接:

https://mp.weixin.qq.com/s/9vOc-OyqvzrO_w5LApurbg

3. ChatGPT背后的经济账

ChatGPT能否取代Google、百度这样的传统搜索引擎?为什么中国不能很快做出ChatGPT?当前,对这些问题的探讨大多囿于大型语言模型(LLM)的技术可行性,忽略或者非常粗糙地估计了实现这些目标背后的经济成本,从而造成对LLM的开发和应用偏离实际的误判。

本文作者从经济学切入,详细推导了类ChatGPT模型搜索的成本、训练GPT-3以及绘制LLM成本轨迹的通用框架,为探讨LLM成本结构和其未来发展提供了可贵的参考视角。

链接:

https://mp.weixin.qq.com/s/aAg1ptEkQ6ahdjs-3s_g3A

4. 解读ChatGPT背后的技术重点:RLHF、IFT、CoT、红蓝对抗

近段时间,ChatGPT 横空出世并获得巨大成功,使得 RLHF、SFT、IFT、CoT 等这些晦涩的缩写开始出现在普罗大众的讨论中。这些晦涩的首字母缩略词究竟是什么意思?为什么它们如此重要?我们调查了相关的所有重要论文,以对这些工作进行分类,总结迄今为止的工作,并对后续工作进行展望。

链接:

https://zhuanlan.zhihu.com/p/602458131

5. 为什么所有GPT-3复现都失败了?使用ChatGPT你应该知道这些

为什么所有公开的对 GPT-3 的复现都失败了?我们应该在哪些任务上使用 GPT-3.5 或 ChatGPT?对于那些想要复现一个属于自己的 GPT-3 或 ChatGPT 的人而言,第一个问题是关键的。第二个问题则对那些想要使用它们的人是重要的(下文提到 GPT-3,主要是指 GPT-3.5 或 InstructGPT 的最新版本,除了一些指向 GPT-3 原文的情况)。

链接:

https://mp.weixin.qq.com/s/fWe9RtP8qe8uxMSukeAjKA

6. 超越GPT 3.5的小模型来了

众所周知,ChatGPT 是在 GPT-3.5 系列模型的基础上微调而来的,我们看到很多研究也在紧随其后紧追慢赶,但是,与 ChatGPT 相比,他们的新研究效果到底有多好?近日,亚马逊发布的一篇论文,他们提出了包含视觉特征的 Multimodal-CoT,该架构在参数量小于 10 亿的情况下,在 ScienceQA 基准测试中,比 GPT-3.5 高出 16 个百分点 (75.17%→91.68%),甚至超过了许多人类。

链接:

https://mp.weixin.qq.com/s/gv_FJD0aIpDNbky54unj2Q

7. 聊聊对大模型的一些看法

外行看热闹,内行看门道。逻辑链的把握,对长程上下文的捕捉和适应,以及生成语句的通顺度,这几点在作者试验过的大量的case里都得到了验证,于是对于大模型这个技术方向"现实上的怀疑"也开始被打消了。

链接:

https://zhuanlan.zhihu.com/p/607680446

8. 一文理解大型语言模型的“上下文学习”

最近几年大语言模型(LLM) 获得了越来越多的关注,其中最知名的当属 ChatGPT模型。ChatGPT模型展现了一些大模型才具备的突现能力(就是模型规模必须得增大到一定程度才会显现的能力,比如至少百亿级),其中一项能力就是上下文学习(In-Context Learning)。这也引发了研究人员对该能力产生原因的思考和探索。

链接:

https://mp.weixin.qq.com/s/sTTRl7QPyFDYVw4Jwzn9dQ

9. 理解GPU的底层架构

笔者是新进GPU行业从业者,之前在CPU芯片行业做一些底层软件驱动开发工作,深知熟悉CPU的底层结构原理对驱动编写和阅读他人驱动代码大有裨益,本文则介绍了GPU的底层工作原理。

链接:

https://zhuanlan.zhihu.com/p/598173226

10. ML System入坑指南

最近ChatGPT大火,越来越多开始关注大模型,但对于大模型落地,除了先进的算法,其背后的ML System(机器学习系统),从分布式训练到高效推理的完整链路同样重要,好的基础设施是应用爆发的基础。本文主要围绕作者学习的经历来构筑,希望能给希望入坑的新人一个指引,也给非Mlsys背景但感兴趣的其他领域的同学一些启发。

链接:

https://zhuanlan.zhihu.com/p/608318764

11. 开源机器学习软件对AI的发展意味着什么

过去十年,只要构建过ML模型的人都知道MLOSS至关重要,无论是Deepmind的研发工程师,还是印度的高中生都无一例外会使用开源软件来构建模型。作者采访了24名ML从业者,他们都给出了相同的答案:MLOSS工具在模型构建中的地位举足轻重。

从业者都在免费使用MLOSS工具,也就意味着这类工具会对人工智能发展产生巨大影响。然而,探索MLOSS对AI发展影响的研究人员却寥寥无几。

链接:

https://mp.weixin.qq.com/s/7bB3_32h0jKBJ-8OGEiLSw

12. OneFlow源码解析:静态图与运行时

OneFlow静态图的训练效率远高于动态图(eager模式)。本文试图通过一个简单例子,结合v0.8.0版本的代码,解读一下静态图和运行时的实现机制。

链接:

https://mp.weixin.qq.com/s/3sR7fLWC80sG2nFToJa7vA

13. CUDA编程:矩阵乘运算从CPU到GPU

本文主要介绍用CUDA实现矩阵乘法运算(C = A x B)的几个基本方法,帮助理解矩阵在GPU上面的运算与CPU上的有何异同,通过实践上手CUDA的优化计算,相比基础方法,能提速10倍以上。本文内容涉及到CUDA矩阵1D运算、2D运算、共享内存、CUBLAS的使用。

链接:

https://zhuanlan.zhihu.com/p/573271688

14. CUDA SASS汇编器:CuAssembler

尽管CuAssembler主要的目的是把nvdisasm的输出重新转回cubin,但它并不是从零开始写汇编。作者推荐从CUDA C开始,除了kernel代码外,其他初始化代码都是尽量用Runtime API,这样使用和修改都最简单直接。

链接:

https://zhuanlan.zhihu.com/p/348234642

15. 全面碾压AdamW:谷歌新出优化器内存小、效率高

来自谷歌、 UCLA 的研究者提出了一种通过程序搜索发现深度神经网络训练的优化算法的方法,进而发现 Lion(EvoLved Sign Momentum)优化器。


实现这一目标面临两个挑战:首先是在无限稀疏的程序空间中寻找高质量的算法;其次是选择可以从小型任务泛化到更大、SOTA 任务的算法。为了应对这些挑战。该研究采用了一系列技术,包括具有热启动和重启的进化搜索、抽象执行、funnel 选择和程序简化。

链接:

https://mp.weixin.qq.com/s/QK7mBxmjkNfWyLKiNhTL2Q

16. YOLOv5全面解析教程③:更快更好的边界框回归损失

本文总结了边界框回归中的三个几何因素,即重叠面积(overlap area)、中心点距离(central point distance)和高宽比(aspect ratio),在此基础上提出了完全IoU(CIoU)损失,从而促进了更快的收敛和更优的性能。

链接:

https://mp.weixin.qq.com/s/LIOnJqJj_GrpakKbLeWEDQ

17. 下载量突破10亿,MinIO的开源启示录

在开源创业公司里,MinIO的成长之路对其他开源企业/项目来说无疑是一个很好的参考范例。近期,他们的CMO Jonathan Symonds在一篇博客中分享了MinIO如何超越专有软件公司,以及如何在未来巩固自身优势,重点阐述了他们在开源商业模式、产品、社区构建以及开源信仰方面的想法,这些内容或许值得开源社区的初创企业借鉴。

链接:

https://mp.weixin.qq.com/s/ecgooN_5ggM3lS6AXThEDg

其他人都在看

  • ChatGPT搜索风暴

  • OneFlow v0.9.0正式发布

  • 从0到1,OpenAI的创立之路

  • YOLOv5解析教程:目标检测模型精确度评估

  • 比快更快,开源Stable Diffusion刷新作图速度

  • OneEmbedding:单卡训练TB级推荐模型不是梦

  • GLM训练加速:性能最高提升3倍,显存节省1/3

欢迎Star、试用OneFlow最新版本GitHub - Oneflow-Inc/oneflow: OneFlow is a deep learning framework designed to be user-friendly, scalable and efficient.OneFlow is a deep learning framework designed to be user-friendly, scalable and efficient. - GitHub - Oneflow-Inc/oneflow: OneFlow is a deep learning framework designed to be user-friendly, scalable and efficient.https://github.com/Oneflow-Inc/oneflow/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8351.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

谷歌研究科学家:ChatGPT秘密武器的演进与局限

来源|TalkRL OneFlow编译 翻译|徐佳渝、贾川 同样是基于GPT预训练模型,为什么ChatGPT的效果要远远超出GPT-3等前几代模型?答案已经揭晓,成就ChatGPT的秘密武器在于RLHF,也就是人类反馈的强化学习。 在预训…

用ChatGPT搞定K8s!

Kubernetes(K8s)非常火,但被人诟病最多的还是其复杂性,并且不管是在云中还是本地,都没有很好的集群故障排除的方法。因此,尽管K8s的采用率持续增长,但许多开发人员和运维团队对这项较新的技术感…

任正非:ChatGPT对我们的机会是什么,内部讲话实录!

ChatGPT狂飙160天,世界已经不是之前的样子。 我新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 为感谢全国火花奖获奖者对于产业界及科学界做出的重大贡献,华为组织了与部分获奖老师与专家的座谈会。座谈会上&…

ChatGPT突遭大面积封号!网友应急出解封教程

一觉醒来,ChatGPT大面积封号的消息突然炸了。 据传闻,受影响的账户已经达到了数百万,亚洲是重灾区,其中不少都是国内的账号。 社交媒体上哀鸿遍野,网友纷纷表示自己的账号忽然就被封禁了,没有得到任何警告…

复旦发布类ChatGPT模型Moss;Linux 6.2 发布|极客头条

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&…

理想汽车CEO李想:要挑战30到50万SUV市场20%份额

雷递网 雷建平 2月28日 理想汽车(纳斯达克:LI;香港交易所:2015)今日公布财报。财报显示,理想汽车2022年收入总额为452.9亿元(65.7亿美元),较2021年的270.1亿元增加67.7%。…

计算机状态下的语言学问题

【赏析】计算机状态下的语言学问题 ——读《传神的汉字》 摘要:两手都要硬--科学与马克思主义 传神的汉字——中国对世界最杰出的第五大发明。    修改为:    1、传神的汉字——中国对世界杰出的第五大发明。    评注:逻辑错误&#…

任正非正面回应!万字问答全文来了,涉及AI、教育、基础科学等多个重磅命题...

来源: 深城物联 3月17日,上海交通大学先进产业技术研究院披露了一篇《擦亮花火、共创未来——任正非在“难题揭榜”花火奖座谈会上的讲话》的文章,全文约1万字,曝光了华为创始人任正非对天才少年、校企合作等热点话题的看法&#…

ChatGPT爆火,AI正在冲击传统教育

ChatGPT横扫校园?遭受封杀? 01.黑马如何诞生 OpenAI开发的聊天机器人ChatGPT发布于2022年11月30日,随即在全球刮起了一股猛烈的旋风。市场研究机构Similarweb数据显示,2023年1月,ChatGPT独立访问用户达1.015亿&#xf…

探讨教育如何应对ChatGPT的冲击

许多年之后,史书写到 AI 时代时,将会提及 2023 年那个狂飙突进的春天。 2月初,瑞银(UBS)分析师指,ChatGPT 发布仅仅两个月就突破了 1 亿月活用户,成为史上普及最快的消费级应用。 ▲史上各项技…

任正非内部讲话:ChatGPT对我们的机会是什么(实录)

因公众号更改推送规则,请点“在看”并加“星标”第一时间获取精彩技术分享 点击关注#互联网架构师公众号,领取架构师全套资料 都在这里 0、2T架构师学习资料干货分 上一篇:ChatGPT研究框架(80页PPT,附下载)…

任正非最新谈中美、科技、ChatGPT

我们还是要把科学和技术分开,如果一讲做事要有目的性,目的性就是技术,不是科学。科学就是你的兴趣爱好,为了搞清楚不惜一切代价 文 | 任正非 近日,华为在深圳坂田总部隆重举办“难题揭榜”火花奖颁奖典礼,为…

第20课:解决痛点|如何让ChatGPT记住指令并随时调用呢?

经常使用ChatGPT的人,会有一些烦恼,比如如何把调试好的一些prompt 管理起来?如何在使用ChatGPT的时候随时调用我之前输入过的历史指令呢?等等吧。。。 我们先把这个问题抛给ChatGPT来看看它是怎么回复的? 从ChatGPT的回答,我们可以获取到一些信息,ChatGPT本身并不具备…

500% 回报率?史上最强基金经理 ChatGPT 造!

公众号关注 “菜鸟学Python” 设为 “星标”,每天带你学Python! 转自新智元 编辑:润 拉燕 兄弟们,ChatGPT,要把人类基金经理也给替代了? 英国的一家金融咨询网站 Finder 表示,他们在 3 月 6 日创…

号称ChatGPT“最强竞争对手”的Claude,今天迎来史诗级更新!

转 量子位 | 公众号 QbitAI 号称ChatGPT“最强竞争对手”的Claude,今天迎来史诗级更新—— 关于Claude如何使用:我们专栏有详细的介绍(最强的ChatGPT竞品来了!免费好用,不需要兔魔法,小白都能用的GPT!) 模型记忆力原地…

太强啦!!!ChatGPT能上传文件了,能执行Python代码啦!

转自 梦晨 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT又出试验型新模式,不少网友陆续收到代码解释器Alpha测试资格。 简单来说,这个模式提供两个功能:执行Python代码,接受文件上传下载。 为什么是这两个功能的组合? 可…

AutoGPT 全功能API 接入指南 (云记忆、联网、语音朗读、图像生成)

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 一、核心OpenAI API-key(必备) 点击 Create new secret key 获取 OPEN AI API KEYS 起个名字然后点击Cr…

给天猫精灵赋予chatgpt

前言 自从chatgpt火了之后,一直想把智障的天猫精灵对接个chatgpt,奈何天猫精灵不提供接口,终于在github上找到大佬做的小爱同学对接chatgpt的教程,于是根据他的原理,也搞出了个简陋的版本 成功展示 开发中遇到的问题…

别只关注chatGPT能不能写论文了,它还支持49中场景,代码都给你写好了,速领

简介 chatGPT最近非常不稳定,访问一不小心就出现了网络错误,根本就不能很好的使用。那么我们该怎么办呢?勇哥给大家想到了一个种办法,就是用程序去调用openapi的接口,这个接口虽然是收费的,但是可免费使用…

第08课:Prompt Engineering——提问ChatGPT的艺术

通过前面的学习,我们知道用户可以通过提示(Prompt)来指导ChatGPT生成特定主题的文章、提供特定领域的建议、回答特定类型的问题等。 而提示工程(Prompt Engineering,也称为In-Context Prompting)指在不更新模型参数的前提下、通过输入文本等方法来操控大型语言模型(Large …