斯坦福“草泥马”火了:100美元就能比肩GPT-3.5!手机都能运行的那种

梦晨 金磊 发自 凹非寺
量子位 | 公众号 QbitAI

一夜之间,大模型界又炸出个big news!

斯坦福发布Alpaca(羊驼,网友口中的“草泥马”):

只花100美元,人人都可微调Meta家70亿参数的LLaMA大模型,效果竟可比肩1750亿参数的GPT-3.5(text-davinci-003)。

而且还是单卡就能运行的那种,甚至树莓派、手机都能hold住!

0bbfa58b3a15c8c9446d558dcceef9f3.png

还有一个更绝的“骚操作”。

研究所涉及到的数据集,是斯坦福团队花了不到500美元用OpenAI的API来生成的。

所以整个过程下来,就等同于GPT-3.5自己教出了个旗鼓相当的对手AIfba8bb143fe2f76aa23d6e3e4bdd236d.png

(薅羊毛高手……)

然后团队还说,用大多数云计算平台去微调训练好的模型,成本也不到100美元:

复制一个GPT-3.5效果的AI,很便宜,很容易,还很小。

而且团队还把数据集(秒省500刀)、代码统统都给开源了,这下子人人都能去微调个效果炸裂的对话AI:

e4ff6ffd7471f781c9c2fd4ed6ea1d36.jpeg

项目在GitHub发布才半天时间,便已经狂揽1800+星,火爆程度可见一斑。

Django联合开发者甚至对斯坦福的新研究用“惊天大事”来形容:

02446513d7cdb640318113db173956a2.png

不仅如此,斯坦福团队还搞了个demo,在线可玩的那种。

话不多说,我们现在就来看看这个“草泥马”的效果。

比肩davinci-003的草泥马Aplaca

在斯坦福官方的演示中,他们先小试牛刀地提了一个问题:

什么是羊驼?它和美洲驼的区别是什么?

8667110dc545cb1000e9a3b558e1f8f1.png

草泥马Aplaca给出的答案较为干练:

羊驼是一种小型骆驼科动物,原产于秘鲁、玻利维亚、厄瓜多尔和智利;它比美洲驼小,羊毛更细,也没有驼峰。

而后又简单的介绍了二者群居生活的不同。

同样的问题若是交给ChatGPT(GPT3.5-turbo),则答案就不会像草泥马Aplaca那般简洁:

16b6aeda0b8d2a92fc8aaee591ef3541.png

对此,团队给出的解释是:

Alpaca的答案通常比ChatGPT短,反映出text-davinci-003的输出较短。

而后团队演示了让草泥马Alpaca写邮件

写一封e-mail祝贺被斯坦福大学录取的新生,并提到你很高兴能亲自见到他们。

草泥马Alpaca对于这个任务也是信手拈来,直接给出了一个像模像样的邮件模板:

0da1c01c354c0b89538fb5474214cbd5.png

难度再次进阶,团队这次提出了让草泥马Alpaca写论文摘要的需求:

写一篇经过深思熟虑的机器学习论文摘要,证明42是训练神经网络的最优seed。

草泥马Alpaca给出的答案从内容上来看,非常符合大多数论文的摘要形式:试图回答什么问题、用了什么方法、结果如何,以及未来展望。

71ddd5f8ebff0aa7dbdc7f4bccd863de.png

当然,也有迫不及待的网友亲自下场试验,发现草泥马Alpaca写代码也是不在话下。

49498a78633f73831f82bc9d3b75b855.png

不过即便草泥马Alpaca能够hold住大部分问题,但这并不意味着它没有缺陷。

例如团队便演示了一个例子,在回答“坦桑尼亚的首都是哪里”的问题时,草泥马Alpaca给出的答案是“达累斯萨拉姆”。

但实际上早在1975年便被“多多马”取代了。

9a87e2c4dd11672d8ee132cbc010cecf.png

除此之外,若是亲自体验过草泥马Alpaca就会发现,它……巨慢:

114ed2c6ee961e7bb7714da369e4890e.png

对此,有网友认为可能是使用的人太多的原因。

e3883f2ecad78b338402db6af086d338.png

笔记本、手机、树莓派都能跑

Meta开源的LLaMA大模型,刚发布几周就被大家安排明白了,单卡就能运行。

所以理论上,基于LLaMA微调的Alpaca同样可以轻松在本地部署。

没有显卡也没关系,苹果笔记本甚至树莓派、手机都可以玩。

在苹果笔记本部署LLaMA的方法来自GitHub项目llama.cpp,使用纯C/C++做推理,还专门对ARM芯片做了优化。

d8ad71b2c828ed224b2b8531634f6d7b.png

作者实测,M1芯片的MacBook Pro上即可运行,另外也支持Windows和Linux系统。

233ca49edafd34b43e4c7c9683def192.png

还是这个C++移植版本,有人成功在4GB内存的树莓派4上成功运行了LLaMA的 70亿参数版本。

虽然速度非常慢,大约10秒生成一个token(也就是一分钟蹦出4.5个单词)。

7f9a133936946da044bcc4009a424d43.png

更离谱的是仅仅2天之后,有人把LLaMA模型量化压缩(权重转换成更低精度的数据格式)后成功在Pixel 6安卓手机上运行(26秒一个token)。

Pixel 6使用谷歌自研处理器Google Tensor,跑分成绩在骁龙865+到888之间,也就是说新一点的手机理论上都能胜任。

2f7e860eb26126283073d7f798a52115.png

微调数据集也开源

斯坦福团队微调LLaMA的方法,来自华盛顿大学Yizhong Wang等去年底提出的Self-Instruct。

48bf17cd4e751d503b8dc79ebac44274.png

以175个问题作为种子任务,让AI自己从中组合出新的问题以及生成配套答案实例,人工过滤掉低质量的,再把新任务添加到任务池里。

所有这些任务,之后可以采用InstructGPT的方法让AI学会如何遵循人类指令。

套娃几圈下来,相当于让AI自己指导自己。

dfc46917541aeb244418fe972d3d0b49.png

斯坦福版Alpaca,就是花了不到500美元使用OpenAI API生成了5.2万个这样的示例搞出来的。

这些数据同样开源了出来,并且比原论文的数据多样性更高。

978c4a33116c0dee688a2cfecd4e60b4.png

同时还给出了生成这些数据的代码,也就是说如果有人还嫌不够,可以再去自行扩充微调数据,继续提高模型的表现。

adac4cbeb8545fe56e06a925f491618d.png

微调代码也会在HuggingFace官方支持LLaMA后放出。

06beaba55ece8f33991e2a6d4073f44c.png

不过Alpaca最终的模型权重需要Meta许可才能发布,并且继承了LLaMA的非商用开源协议,禁止任何商业用途。

并且由于微调数据使用了OpenAI的API,根据使用条款也禁止用来开发与OpenAI形成竞争的模型。

One More Thing

还记得AI绘画的发展历程吗?

2022年上半年还只是话题热度高,8月份Stable Diffusion的开源让成本下降到可用,并由此产生爆炸式的工具创新,让AI绘画真正进入各类工作流程。

语言模型的成本,如今也下降到了个人电子设备可用的程度。

最后还是由Django框架创始人Simon Willison喊出:

大语言模型的Stable Diffusion时刻到了。

9eb8fbbdd15a2c01bb78e4b6d4147d7e.png

「中国AIGC产业峰会」启动

邀您共襄盛举

「中国AIGC产业峰会」即将在今年3月举办,峰会将邀请AIGC产业相关领域的专家学者,共同探讨生成新世界的过去、现在和未来。

峰会上还将发布《中国AIGC产业全景报告暨AIGC 50》,全面立体描绘我国当前AIGC产业的竞争力图谱。点击链接或下方图片查看大会详情:

被ChatGPT带飞的AIGC如何在中国落地?量子位邀你共同参与中国AIGC产业峰会

521c1f0da32c3950e24de1370486f777.gif

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/65032.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TFBoys谁最红?BTS和EXO谁更红?杨幂杨颖谁更漂亮?看看ChatGPT怎么答送命题的(狗头)

最近大火的ChatGPT,不知道各位有没有玩,我倒是拿它来帮我编辑邮件内容、写述职报告、写文章等等的,简直太好用了哈哈哈 突然心血来潮,我想问问它娱乐圈的三大送命题:TFBoys谁最红?BTS和EXO谁更红?杨幂杨颖…

液压比例溢流阀R901170278、DBET-62/200G24-8K4V

DBET 型比例溢流阀是一种采用阀座设计的远程控制阀,可用于限制系统压力。借助带对中螺纹和可拆卸线圈的比例电磁铁进行操作。线圈的内部与油口 T 连接,并装满液压油。根据电气控制值的不同,这些阀门对要限制的系统压力进行无级设置。 这些阀…

浸液式液冷:数据中心主流液冷技术,龙头全梳理

引言 如今,随着人工智能的不断发展,数据中心越来越被重视。而数据中心的发展需要大量的IT设备,这些设备的持续运行将产生大量热量,需要不断被散发。为了保证数据中心的稳定运行,降温散热是必不可少的。当前液冷技术是数…

知识分享!冷却液温度传感器的结构、特性及功能-道合顺大数据

(一)冷却液温度传感器结构 冷却液温度传感器为负温度系数电阻计NTC,内部是由一个半导体热敏电阻构成,它具有负温度系数NTC。 当发动机冷却液温度逐渐升高时,热敏电阻的阻值将逐渐下降,相反则增大,结果发动机冷却液温…

数据中心服务器冷却技术,盘点数据中心液体冷却系统

多年来,由于增加服务器的密度并减少其体积的大小,服务器的密度变得越来越高,数据中心正日益产生更多的热量。因此,每平方英尺产生热量的瓦数正在不断上升,这种功率密度的增加严重制约了传统的冷却方法和技术。液体冷却作为是数据中心最新的制冷技术,正在被人们所接纳并应…

微流控芯片进样用多通道正负压力控制器的解决方案

摘要:在微流控芯片进样、化学反应进样和长时间药物注射领域,都需要能提供正负气压可精密控制的压力控制器。本文特别针对微流控芯片进样对多通道压力控制器的技术要求,提出了相应的解决方案,并详细介绍了方案中多通道气路结构、控…

厂商踊跃、数据中心观望 液冷距离爆发还差一场风

近年来,液冷技术在数据中心领域的遭遇可以用一个词形容:又冷又热。 技术冷:作为冷却介质,液体的冷却效能远远高于空气,所以在冷却效果上比风冷更“冷”一筹。 关注热: 随着技术发展与产业环境、政策变化&am…

浪潮信息:2025年,实现数据中心风冷、液冷同价

算力作为一种重要的生产力,俨然成为数字经济发展的关键驱动力。而数据中心作为算力的最重要的“输出方”,其作用不言而喻。特别是近来人工智能大模型相关产业的发展,对算力的需求呈指数级增长。大力发展数据中心、提升算力,成为经…

让用户真正放心的液冷技术来了

纵观人类历史,每次技术革新都伴随着生产要素和生产力的跨越式发展。如今,随着全球算力日益增长,数据中心单位空间中产生的热量正在不断增加、功率密度持续增大。赛迪顾问预测,快速增长的数据中心算力将推动高功率单机柜快速普及&a…

浪潮信息建设天池液冷产业基地 降低应用门槛 加速液冷技术普及

液冷技术的创新迸发,为产业提速输送了充沛的动力,期间,只有让液冷技术走向更多客户的数据中心,才能真正促进产业变革。 3月31日,浪潮信息举办了首个天池液冷产业基地开放日,展示了企业拥有的先进的液冷智造…

AI算法发现3种新纳米结构,研究时间从1个月压缩到6小时

衡宇 发自 凹非寺量子位 | 公众号 QbitAI AI又达成了一个新成就! 只用6个小时,发现新的纳米结构。如果使用传统方法,完成这个任务至少需要1个月。 这一结果发表在Science子刊Advance上。 △扫描电子显微镜图像描绘了AI发现的新型纳米结构 实验…

minigpt4搭建过程记录,简单体验图文识别乐趣

引言 从3月开始,aigc进入了疯狂的开端,正如4月12日无界 AI直播 在《探索 AIGC 与人类合作的无限可能》中关于梳理的时间线一样,aigc的各种产品如雨后春笋般进入了不可逆的态势,里面有句话很形象,人间一日,…

让天下没有难Tuning的大模型-PEFT(参数效率微调)技术简介

​ https://www.yuque.com/meta95/hmc3l4/ozgy13dx4akv7v17?singleDoc# 《让天下没有难Tuning的大模型-PEFT技术简介》 最近,深度学习的研究中出现了许多大型预训练模型,例如GPT-3、BERT等,这些模型可以在多种自然语言处理任务中取得优异的…

TransUnet训练自己的数据集

github的源代码https://github.com/Beckschen/TransUNet 一.先对自己的数据集进行处理 1.原始数据集如下图所示分images和labels,若数据集是png/jpg....格式,首先需要将每一张图的image和其对应的label合并转化为一个.npz文件. # 自建的将图片及对应标…

数据中台的商机

阿里拆中台了,很多人来问数据中台还要不要的问题,我认为中台总是要有的,无非是薄厚的问题。然后又有人来问数据中台价值创造的问题,这个其实是数据中台最核心的问题,我就来正式聊一聊,里面有很多的批判&…

能以 PDF或Word 格式导出,微软必应聊天上线新特性

根据微软必应工程和产品部负责人 Jordi Ribas 分享的最新推文,微软已经向部分必应聊天(Bing Chat)用开放新特性,可以分享和导出某个聊天内容。 将鼠标悬停在某条聊天内容上方,会出现一行快速操作按钮,包括“…

现在很多人都想做抖音短视频,那我们应该怎样去做呢?一起来看一吧

因为现在很多人虽然想通过做短 视频账号来谋取一定的利益,但是有很多人都是不太会如何玩,那我们在 看到他们有的新手就是一发视频就只有几个点 赞量,而且播放量也是低的很低。 而我们认真研究抖音就会发现有的人玩抖音第一个视频就能够破百万…

抖音短视频剪映制作教程:软件界面介绍(1)

剪映是我们安卓系统和苹果系统手机都能使用的剪辑软件。今天我们分为两点来介绍:第一软件的下载,第二软件的界面使用介绍,那就让我们开始吧! 第一,软件的下载 为什么要讲软件是如何下载的呢?因为有很多伙伴…

抖音短视频运营指南

最初在中国的视频分享应用程序刚刚在全球激增,成为了2019年全球青年最热的地方。而且,在人群中,品牌营销人员紧跟它的步伐。但是抖音并不是您常规的即插即用营销平台,因为它的用户具有很高的洞察力,任何感觉不到“真实…

抖音短视频创业,抖音机房怎么样搭建?有哪些技巧

大家好我是RXLicong抖音机房搭建这个项目国家没有禁止,国家立法的是抖音云控系统。不是抖音硬控,进直播间批量进,进去以后跟播互动都是真人操作的同时面向全国进行分公司加盟 抖音机房搭建都需要什么条件,大家好我是欢迎交流讨论 …