几行代码,GPT-3变ChatGPT!吴恩达高徒、华人CEO震撼发布Lamini引擎

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【计算机视觉】微信技术交流群

转载自:新智元 | 编辑:Aeneas 好困

【导读】这个全新发布的Lamini引擎,大大拉低了模型训练的门槛,开发者人手一个ChatGPT的梦想成真了。

快速定制模型的LLM引擎Lamini来了,开发者狂喜!

ChatGPT虽好,但始终有门槛。通常,只有拥有AI博士学位的大型机器学习团队,才能这样训练一个模型。

为了把这个门槛打下来, 团队构建了Lamini引擎,从此,每个开发者都能够拥有从GPT-3训练ChatGPT的超能力!

划重点:可以商用!可以商用!可以商用!

25efa8159cd3bc7aa69f7cbdcfe78dbb.png

项目地址:https://github.com/lamini-ai/lamini/

Lamini的开发团队表示,你需要的只是几行代码,就可以用托管数据生成器俩训练自己的LLM,包括权重和其他所有的内容。

此外,你也可以使用开源的LLM,用Lamini库对生成的数据进行微调。以及访问完整的LLM训练模块,使用从LoRa等速度优化,到虚拟私有云 (VPC) 部署等企业功能。

07631e12df83381950472632e18f5fa7.png

对此,英伟达科学家Jim Fan表示, LLaMa+自定义数据正在成为新的范式,而Lamini的推出也带了一种全新的模式——FaaS,微调即服务。

1ad0d17e4f4c72f0a3d232aa8182442f.png

MLOps的未来是「LMOps」。哪里有标准化,哪里就有机会。

OpenAI科学家,前特斯拉人工智能总监Andrej Karpathy也表示,LLM定制化的生态正在愈发火爆。

a1ac77f9aed9079ccf70e03c3a31d9f5.png

训LLM就像prompt-tuning一样简单

写一个prompt如此容易,但想要从基础模型训练出一个大语言模型,却是如此困难。

因为需要花费大量时间,来找出微调模型失败的原因,所以对数据集微调的迭代周期都是以月为单位的。

与之相反,微调prompt的迭代,只需要几秒钟,并且在几个小时内,性能都能保持稳定。

这个过程只需要把有限数量的数据整合到prompt中就可以了,并不需要动辄几TB的数据。

2cfdc900809c848c60189984935c05e0.png

ChatGPT的诞生十分艰难,OpenAI的团队花了几个月的时间,在基础的GPT-3模型上微调,并进行RLHF。这个门槛极高,只有大型的ML团队才能完成这种训练。

有500强企业的技术负责人这样抱怨过:「我们团队的10名机器学习工程师用了OpenAI的微调API,结果我们的模型反而变得更差了,怎么办啊。」

「我真的不知道该怎么充分利用数据,我已经用尽了所有从在线教程中能学到的prompt魔法了。」

这,就是研究者构建Lamini的原因:让每个开发者可以直接从GPT-3训练ChatGPT。

任意LLM,秒变ChatGPT!

Lamini是一个LLM引擎,可以让不仅仅是机器学习专家的任何开发人员,都能在大型数据集中,把高性能的LLM训练得像ChatGPT一样好。

这个过程,只需要Laimini库的几行代码即可。

值得注意的是,这个库中的优化(optimization)远远超出了现在开发者可以使用的范围,从更具挑战性的优化(如RLHF)到更简单的优化(如减少幻觉)。

比如,你想从不同的角度生成一个广告文案。

首先,从llama模块导入LLM引擎:

 
from llama import 
LLMllm = LLM(name="marketing")

接下来,需要定义输入和输出类型。注意,这里一定要包括上下文(Context),因为可以有助于LLM在自然语言中进行理解。

 
from llama import Type, Contextclass AdAspects(Type):tone: str = Context("tone of the marketing copy")product_features: list = Context("product features to promote")audience: str = Context("target audience for the message")subject: str = Context("subject or topic of the message")goal: str = Context("goal of this marketing campaign and message")class AdCopy(Type):title: str = Context("google ad title tag")description: str = Context("google ad description")keywords: list = Context("keywords for the search engine")

然后就可以开始提问了:

语气:大胆,但不傲慢

特色:亚洲酱料和香料、家常调料和套餐包,可以轻松在家烹饪。

 
aspects = AdAspects(tone="bold and bright, but not arrogant",product_features=['asian sauces and aromatics','home-cooked seasonings and meal packs that can be easily cooked at home'],audience="suburban families",subject="delicious asian meals without going to a restaurant",goal="get suburban moms and dads to try buy their first omsom pack or free tasting kit"
)
ad_copy = llm(input=aspects, output_type=AdCopy)
print(f"Ad copy: {ad_copy}")

模型输出:

尝试 Omsom 的美味亚洲酱料、香料、家常调料和套餐包。轻松为家人在家做出美味佳肴。

 
> title='Delicious Asian Meals Without Going to a Restaurant | Omsom'description="Try Omsom's delicious Asian sauces, aromatics, and home-cooked seasonings and meal packs. Easily cook delicious meals at home for your family."keywords=['Asian sauces','Aromatics','Home-cooked seasonings','Meal packs','Delicious meals','Suburban families','Omsom']

如何创建自己的「ChatGPT」

基础模型能理解一般的英语,但如果需要它们学习一些垂直语言和规则,prompt微调并不足够,很多时候我们都需要构建自己的LLM。

利用用下面这个步骤,就能获得像ChatGPT一样遵循指令的LLM。

4fba4e6b70ee52b9019917d4114d04df.png

  1. 尝试prompt-tuning ChatGPT或其他模型

可以使用Lamini库的API,在不同模型之间快速进行prompt-tuning,只需一行代码,即可在OpenAI和开源模型之间切换。

Lamini库已经优化了正确的prompt,这样开发者就可以使用不同的模型,不必担心如何为每个模型设置prompt的格式。

  1. 构建一个包含输入-输出对的大型数据集

这些数据集会向模型展示,它应该如何响应输入,无论是遵循英文说明,还是以JSON响应。

研究者刚刚发布了一个只有几行代码的repo,使用Lamini库,仅从100个数据点中,就能生成50k数据点。

而且因为使用Lamini库来启动Lamini引擎,所以这个过程根本不需要用到GPU。

在repo中,已经包含一个开源的70+k数据集。

d79bb55b4eb388f7368146c3d05128e7.png

项目地址:https://github.com/lamini-ai/lamini/

  1. 在大型数据集上微调基础模型

除了数据生成器,研究者还发布了一个LLM,它使用Lamini对生成的数据进行了微调。以编程方式执行此操作的功能也会很快发布。

也可以把OpenAI的微调API作为起步。

  1. 在微调模型上进行RLHF

使用Lamini,就不再需要大型ML和人工标记团队来运行RLHF。

  1. 部署到云端

只需点击产品或功能中的API端点即可。

专为LLM打造的数据生成器

简单来说,依照以下几个步骤,就可以训练自己的大语言模型了。

  • 用于优化prompt微调和类型化输出(typed outputs )的 Lamini库。

  • 用于微调和RLHF的高级Lamini库,只需几行代码。

  • 史上首个托管数据生成器,用于创建数据,来训练遵循指令的LLM。注意,已获得商业使用许可!

  • 开源的指令跟随(instruction-following)LLM,使用上述工具,只需几行代码即可完成。

数据生成器工作原理

65dc46a8bf9e78dd6e60059a01c672d5.png

Lamini数据生成器是一个LLM管线,它采用原始的100多条指令的小集合,与预期的响应配对,生成50k+新的配对,灵感来自Stanford的Alpaca 。这个生成管线使用Lamini库来定义和调用 LLM,以生成不同但相似的指令和响应对。

根据这些数据训练后,你的LLM会遵循这些指示,因而得到改进。对于使用开源LLM的生成管线,研究者提供了一个很好的默认值,Lamini Open和Lamini Instruct。

随着每天新的LLM发布,研究者都会将默认值更新为性能最佳的模型。在目前的版本中,Lamini Open用的是EleutherAI的Pythia,Lamini Instruct用的是Databricks的Dolly。

Lamini Open会生成更多指令,而Lamini Instruct会生成这些指令的成对响应。

最终生成的数据集可供免费商业使用,已经通过CC-BY许可。

仅用一行代码,就可以将Lamini库的默认值换成其他开源或OpenAI模型。

研究者发现,OpenAI模型的平均表现更好,但它们的许可限制了将生成数据用于训练类ChatGPT模型的商用。

对生成数据进行微调

在这个过程中,生成的数据会质量不一。

在微调之前,下一步就是将生成的数据过滤为高质量数据。

然后,Lamini会通过在这个过滤后生成的数据集上训练基础模型,来创建自定义LLM。

研究者已经发布了一个开源指令跟随LLM(CC-BY 许可),可以用Lamini来训练Pythia基础模型,生成的37k指令是从70k中筛选出来的。

显然,Lamini库的出现,让迭代周期变得更快、更有效,有更多的人能够构建模型,而不仅仅是试验各种prompt。

团队介绍

Sharon Zhou是Lamini的联合创始人兼首席执行官。

efe3cd2d45b1ba74035590d11d64ff00.png

个人主页:https://sharonzhou.me/

她在哈佛大学获得了计算机科学与古典文学联合学士学位,并以最高荣誉获得了硕士学位。

随后,她在斯坦福大学获得了计算机科学博士学位,师从吴恩达。

ec388ebdefcec6892adcf2147800ad23.png

2022年,29岁的Zhou入选《麻省理工科技评论》「35岁以下科技创新35人」。

8d0c0556412e6c880e5ca6601fc743e9.png

Gregory Diamos是MLPerf的联合创始人。

他曾是百度硅谷AI实验室的创始成员,对DeepSpeech和DeepVoice系统有贡献。

ce5e20c1a28882a33038b8d1ac21263d.png

参考资料:

https://lamini.ai/blog/introducing-lamini

点击进入—>【计算机视觉】微信技术交流群

最新CVPR 2023论文和代码下载

 

后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲扫码或加微信号: CVer333,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!▲扫码进星球
▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看d48b9d7562bed6d75521cc2f739c3fe1.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/60564.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

抖音小店无货源是怎么做的?开店需要我们准备什么?经验分享

大家好,我是电商糖果 无货源模式流行于14-15年,最早是在某宝、某东、多多这些平台 目前抖音小店无货源的情况: 抖音小店和其他传统电商平台不一样,抖音小店起店是很快的,基本上5-20天小店就可以稳定出单了。 现在直…

抖音小店开通后为什么不出单?新店一定要看看是不是这三个方面没做好

大家好,我是电商年年 想要做好抖音小店,找对方法很重要。很多人的抖音小店开通后迟迟不出单,其实主要有三个原因。 选品为王 做电商,产品才是第一位,其他都要往后靠。选品首先要确定类目,之前很多人都在…

关于抖音小店无货源,作为过来人,来给你推荐几个好做的类目

Hello这里是六一,一个在无货源模式下闯荡多年的电商人。 好的类目对于操作无货源来说也是一个关键点,类目选的没问题,那起点就比别人高,做起来容易得多。 上边在讲营业执照问题的时候建议新手把全类目都开通,但是在做…

抖音小店无货源怎么做?具体步骤讲解,经验分享

哈喽,大家好,我是布丁。 废话不多说,直接上干货。 抖音小店无货源是什么? 抖音小店就是在抖音上开一家小店,抖音小店是一个电商平台,无货源是一种操作模式。 无货源模式就是在网上采集其他店铺的商品&a…

抖音橱窗or抖音小店?这3点,新手开店必看!

不会吧不会吧,都2023了还有人分不清抖音橱窗和小店的区别?今天小编就带你了解一下,不再掉大坑。 1、性质不同 商品橱窗 它只是展示商品的一个窗口,是抖音的一个电商功能,主要通过短视频或者直播的形式推广商品&…

抖音小店商品卡访客七天新增1w+ 2023无货源起店方法,重点必看

2023年最新的起店玩法,不用动销就能起店,七天商品卡访客就能到1万: 我们新开的好几个店铺都是这样做起来的,其中有两个核心,一定要认真看完。 第一步:低价引流款拉流量 店铺开好以后,第一天上…

想做抖音小店无货源还在全网找教程?这里有你最需要的开店教程

大家好,我是电商糖果 最近随着互联网的快速发展,电商也在顺应时代的变化开始有了新的发展模式 抖音小店无货源,一家做短视频的平台却把电商做得风生水起,在双十一,双十二,年货节屡屡出圈。 抖音平台这个…

​分享|Tiktok小店入驻如何选择​

最近有很多小伙伴问“TikTok普通商家与定邀商家有什么不同?现在入驻应该如何选择?”想必各位还在观望的卖家都听到过TikTok小店有分定向邀约(简称“定邀”)和普通入驻(简称“普招”)的通道,那么…

抖音商城店铺分享链接自动化

一、制作背景 目前抖音商城店铺商品分享只能手动分享 如果分享的店铺数量较大就费时又费力, 二、解决问题 人工分享链接数量较大就费时费力不利于提升效率 完全可以让脚本自动滚动采集抖音店铺分享链接解放双手。 三、运行环境 手机和各种模拟器 步骤一 用户手动打…

必看,抖音小店无货源模式到底该怎么做?

大家好,我是电商年年 不得不说抖音小店现在是真的火,尤其是抖音小店无货源模式,这种模式风险低、投入低、不用进货、囤货、发货,只需要利用商品的信息差赚取差价。操作也很简单,只需要会简单的电脑操作就可以进行了。…

抖音小店运营全套系列课,系统掌握月销100w+小店的核心秘密

抖音小店运营全套系列课,系统掌握月销100w小店的核心秘密 从小店基础入门到进阶精通,全新升级 兴趣电商搜索电商 双剑合璧 1、目前抖音日活跃量用户已经突破6亿,平台用户规模庞大且拥有消费能力,管是个人、商家还是企业都可以…

ChatGPT付费创作系统V2.1.1独立版 +WEB端+ H5端 + 小程序端+文心一言+私有知识库

ChatGPT付费创作系统V2.1.1提供最❤的对应版本小程序端,相比上一版本增加了私有知识库功能,可绑定至角色,当回答无答案时会调用出私有知识库答案。本版新增了小程序端。绘画功能采用其他绘画接口-意间AI,后台一些小细节的优化及一…

iOS 跳转到系统的设置界面

在项目中,我们经常会碰到使用位置的需求。当用户设置app不允许使用位置的时候,最好的用户体验就是直接调转到系统的位置设置界面,进行设置。 本人已经测试,在5c iOS8.3系统 和 5s iOS7.1系统中可以正常跳转 跳转到自己的项目中 在…

iOS icon 的设置与启动页的设置

iOS icon 的设置与启动页的设置 1.icon的设置 步骤1.在Assets.xcassets中创建 AppIcon,并向其中添加图片 步骤2先看苹果的管网图,如果你的Xcode 出现了这样的问题 xCode会给出相应的警告,最近遇到一个问题就是A 76x76 app icon is required for iPad…

【iOS】跳转App权限设置页面

跳转App设置页的方法 [[UIApplication sharedApplication] openURL:[NSURL URLWithString:UIApplicationOpenSettingsURLString]];说明: UIKIT_EXTERN NSString *const UIApplicationOpenSettingsURLString API_AVAILABLE(ios(8.0));官方注释 Used to create a UR…

如何在iphone/ipad/itouch上设置新浪VIP邮箱

下面向大家介绍如何使用iPhone/iPad/itouch上的邮件应用程序Mail创建新浪免费邮箱帐户, 这里以iPhone为例(iPod touch/iPad中除了界面略有区别外,操作基本类似): 1、进入设置 首先进入iphone的“设置”,选择“邮件、通讯录、日历…

iOS导航栏切换界面时隐藏和显示

引 现如今很多App的一些模块,尤其是个人中心模块,界面设计已经习惯于不保留导航栏,而是直接将界面背景覆盖到状态栏,比如QQ的个人信息界面: 没有传统的导航栏之后会好看很多,但是回到或者去往别的页面时,往往又需要重新显示导航栏,关于这样一种设计苹果并没有给出专门…

GPT-5 短期内不会问世,AI的安全问题仍被放大

【CSDN 编者按】一封要求暂停AI的公开信引发热议, 随之而来的是GPT-5 被抵制。在麻省理工学院的活动中,OpenAI 的首席执行官兼联合创始人 Sam Altman 首次进行正面回应。 作者 | 陈静琳 责编 | 屠敏 出品 | CSDN(ID:CSDNnews…

软件开发越来越糟?

内存越来越大,空间却越来越小! 原文链接:https://stackoverflow.blog/2023/01/30/is-software-getting-worse/ 本文为 CSDN 编译整理,未经授权,禁止转载! 作者 | Isaac Lyman 译者 | 弯月 责编 | 梦依丹…

超详细且简单的Qt Designer设置界面背景图

---------------------------------------------------------- 这里介绍的主要是一种放置界面底层的背景图方式 首先,先新建一个框,并填充你所需要的一些元件,这里就用我近期的一个小项目吧; 本来, 界面如上所示。…