神奇LLM引擎上线!帮你把GPT-3直接调成ChatGPT

7a5d2c8af91eb6e7d8ace7402a0be661.gif

©作者 | 机器之心编辑部

来源 | 机器之心

OpenAI 花几个月完成的事,现在用它直接给你自动化了。

最近一段时间,不论大公司还是开发者都在造大语言模型(LLM),但有人认为,大模型应用的速度有点落后。

为了构建能实际使用的 AI 工具,我们需要基于基础模型构建定制化模型,中间的过程包含微调(Fine-tuning),这是一个复杂且耗时的过程,对于很多人来说,简便易行的调试是不存在的。

这个问题现在或许得到了解决:本周六,来自斯坦福的一群开发者发布了 Lamini,号称可以为每个开发人员提供从 GPT-3 带到 ChatGPT 的超能力。

f88037619308023f9e1bb45d129fa13e.jpeg

项目地址:

https://lamini.ai/

Lamini 是一个 LLM 引擎,供开发人员使用很多公司、机构的基础模型快速构建定制化模型:你可以用 OpenAI、EleutherAI、Cerebras、Databricks、HuggingFace、Meta 等公司的技术做自己的,只要他们开源就可以。

afcc61d51c7545ee3606d71bab6ca33a.png

将基础模型构建成强大的语言模型是一个极具挑战性的过程,需要花费大量的时间和成本。首先,在特定数据集上进行微调的迭代周期以月为单位,需要花费大量时间找出微调模型失败的原因。虽然使用 prompt 调整迭代以秒计时,但微调之后的模型性能只能稳定几个小时,而且能融入 prompt 的数据量非常有限。

OpenAI 的机器学习团队花了几个月的时间在其基本模型 GPT-3 上进行微调,并使用 RLHF(基于人类反馈的强化学习方法)才构建出强大的 ChatGPT。这个过程需要消耗大量的计算资源,还要求团队具备专业的技术知识。

在 ChatGPT 开放 API 之后,很多公司都尝试使用 OpenAI 提供的微调 API,但结果却不尽如人意,一些基础模型经过微调之后,性能变得更差,无法投入使用。还有一些公司表示不知道如何充分利用数据。

现在,名为「Lamini」的新工具解决了这些问题。Lamini 将微调封装成一种服务,使开发人员可以轻松将 GPT-3 微调成 ChatGPT。

3327792b6f7179b1aeb1edc19ee6b097.jpeg

简单来说,Lamini 提供了一种托管化的数据生成器,只需执行 Lamini 库中的几行代码,用户就能训练自己的大型语言模型(LLM)及其权重,而无需使用任何 GPU。

a0d4722aec29bc0eca82aa0c20a68dcd.png

速成强大的LLM

Lamini 是一个 LLM 引擎,它允许开发人员只使用 Lamini 库中的几行代码,就能在大型数据集上训练出高性能的 LLM。Lamini 库涵盖对机器学习模型的多种优化,包括简单的优化(例如消除模型「幻觉」)和更具挑战性的优化(例如 RLHF)。

46a4d8d6a9a749cb5eb988655e196ca8.jpeg

那么,Lamini 库在构建 ChatGPT 般强大的 LLM 时能起到哪些作用?按照 OpenAI 构建 ChatGPT 的流程,Lamini 的作用具体包括以下几点:

28f8e032eff1a5708d21c06f6866444d.png

1. 对 ChatGPT 或其他模型进行 prompt 调整。Lamini 库的 API 提供快速调优功能,只需一行代码即可在 OpenAI 的模型和其他开源模型之间切换。Lamini 库还提供了优化之后的正确 prompt,以便于用户根据模型设置不同格式的 prompt。

2. 构建一个输入输出对的大型数据集。该数据集将让模型理解它应如何响应其输入。使用 Lamini 引擎,用户可以仅用几行代码就快速从 100 个数据点生成 50k 数据点,而无需启动任何 GPU。Lamini 也提供了一个 50k 的开源数据集。

3. 在数据集上微调基础模型。Lamini 的研究团队在其 50k 的开源数据集上微调出一个 LLM,后续他们将发布执行此操作的功能和代码。

4. 在经过微调的模型上运行 RLHF。Lamini 库让用户不再需要大型 ML 和人工标记团队来运行 RLHF。

5. 方便用户将模型部署到云端。

6c953116cff28d03d53cdbffb3acf5b3.png

数据生成器

‍ChatGPT 风靡全球是因为它可以遵循用户的指令生成高质量内容,但其基础模型 GPT-3 却不总是能做到这一点。例如,向 GPT-3 提出一个问题,它可能会生成另一个问题而不是回答它。

ChatGPT 能做到这一点的原因是它使用了大量的「指令 - 执行」数据。但对于普通的开发人员来说,这些数据是难以获得的。

基于此,Lamini 提供了一个托管数据生成器,只需几行代码即可将 100 个样本变成超过 50k 个样本,而不需要启动任何 GPU,并且生成的数据是商业可用的。用户可以自定义最初的 100 多条指令,以便生成的 5 万条符合要求的指令,最终得到一个大型指令遵循数据集。

Lamini 的数据生成器是一个 LLM pipeline,其灵感来自斯坦福的开源模型 Alpaca。这个生成 pipeline 使用 Lamini 库来定义和调用 LLM,以生成不同但相似的指令 - 响应对。

6a75772782df73d94f7e98540a7854d3.png

托管数据生成器生成的数据质量参差不齐,有的数据很好,有的则很差。因此,Lamini 下一步将生成的数据过滤为高质量数据,这个过程只需要运行一个如下的简单脚本。

import jsonlinesdef main():dataset = list(load_dataset("data/lamini_dataset.jsonl"))questions = set()filtered_dataset = []for example in dataset:if example["question"] in questions:continuefiltered_dataset.append(example)questions.add(example["question"])print(f"Removed {len(dataset) - len(filtered_dataset)} duplicate questions")save_dataset("data/filtered_lamini_dataset.jsonl", filtered_dataset)def load_dataset(path):with open(path) as dataset_file:reader = jsonlines.Reader(dataset_file)for example in reader:yield exampledef save_dataset(path, dataset):with open(path, "w") as dataset_file:writer = jsonlines.Writer(dataset_file)for example in dataset:writer.write(example)main()

然后,Lamini 通过在过滤后的高质量数据集上训练基础模型为用户创建自定义 LLM。

总的来说,Lamini 把微调模型封装成一种服务,让开发者们只用非常简单的步骤就能把基础模型微调成性能良好的垂类模型,这大幅降低了构建 LLM 的技术门槛。

在社交网络上,Lamini 获得了不少人的欢迎。

8eff768154292454de528ff5e988e533.jpeg

不知在此类工具出现后,调大模型会不会变成一件容易的事。

参考链接:

https://lamini.ai/blog/introducing-lamini

更多阅读

75961e8d09cd03e7d9a4f305daae44e5.png

5440a13ed7cc46f2593c28958d2d2ce1.png

10cfd1a0348846447b3a07a6a94a2163.png

fd587a025390bd6f0e50865ed7a9f29a.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

094e1a20788ad2a98682b9aa573e54e1.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

·

·

93a1d78ce23e518481c137b5370e03ff.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12070.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT颠覆的第三个行业-教育领域

引言:随着人工智能技术的飞速发展,越来越多的行业受到了影响。ChatGPT作为一种领先的自然语言处理技术,在内容创作、在线客服等领域取得了显著的成果。如今,它正开始进入另一个领域——教育。本文将探讨ChatGPT如何改变教育行业&a…

代理服务器没有响应解决方案

有时候不知道为什么,电脑无缘无故设置了代理-,导致无法获取网络连接,怎么解决呢? 进入控制面板界面: 如果打钩了,去掉就好了… 为啥会代理,始终是个谜. 应该是在公司的时候是走的固定id端口上网,回到家后要去掉这个.

“代理服务器出现问题,或者地址有误”解决方案

网上查了很多方法,终于解决了,在此分享一下(前两个方法为通用方法,都不行的话,可以试试第三种方法) 方法一:(windows11版) 打开设置——网络和Internet——找到代理 进…

代理服务器可能有问题,或地址不正确(已解决)

解决代理服务器可能有问题,或地址不正确 1. 问题描述2. 解决方法 1. 问题描述 如果遇到电脑连上wifi,其他应用可以上网(例如可以登录QQ),但是浏览器不能浏览网页,出现代理服务器可能有问题,或地址不正确 这个错误&…

影响HTTP代理稳定的因素有哪些?IP为什么会不稳定?

我们在使用HTTP代理的时候,会遇到还存活时间内,就无法使用的时候,或者直接登录不上HTTP代理,导致我们无法很好完成项目,在挑选厂商的时候,也会经常会看到厂商的说自己的HTTP代理稳定,可见HTTP代…

代理服务器可能有问题,或地址不正确的解决方案

可能是设置了代理服务器的原因。 1.先打开代理服务器设置 2.关闭代理服务器。

解决代理服务器可能有问题,或地址不正确

解决代理服务器可能有问题,或地址不正确 1. 问题描述2. 解决方法 1. 问题描述 如果遇到电脑连上wifi,其他应用可以上网(例如可以登录QQ),但是浏览器不能浏览网页,出现代理服务器可能有问题,或地址不正确 这个错误&…

hgame2023 week1 writeup

#WEEK1 文章目录 RE1、re-test_your_IDA2、re-easyasm3、re-easyenc4、re-a_cup_of_tea5、re-encode pwn1、test_nc2、easy_overflow3、choose_the_seat4、orw5、simple_shellcode crypto1、兔兔的车票2、cr-RSA3、Be Stream4、神秘的电话 web1、Classic Childhood Game2、Gue…

并发,Java核心技术卷

多进程与多线程的区别: 每个进程拥有自己的一整套变量,线程共享数据。所以线程通信更高效,更轻量、创建册小开销小。 1. 什么是线程 1.1 一个单独线程中运行一个任务的简单过程: 1.将执行任务的代码,放在实现Runnab…

武职301-day02

这里写自定义目录标题 软件开发前端最基础的技术三剑客:HTMLCSSJavaScript二维码 搭建后端开发环境创建SpringBoot项目Jar怎么存储呢?创建第一个SpringBoot程序 使用谷歌工具包zxing产生二维码改造工具类,形成网址输入地址和图片路径&#xf…

序列标注/信息抽取任务(持续更新ing…)

诸神缄默不语-个人CSDN博文目录 本文介绍序列标注/信息抽取任务。 我写了个信息抽取经典论文的石墨文档,但是我发现现在公开发布需要会员了,请大家加我V给我赞助一笔会员费,让我能够公开文档: 最近更新时间:2023.7…

用uiautomator2实现微信发消息自动化

目录 介绍配置环境uiautomator2常用api 操作步骤adb连接手机启动uiautomator2,安装atx-agent启动weditor 微信发消息demo 介绍 Android UI自动化测试框架,提供了屏幕模拟点击的方法如点击、长按、输入、滑动等; uiautomator2与uiautomator&…

Android实现实时视频聊天功能|源码 Demo 分享

疫情期间,很多线下活动转为线上举行,实时音视频的需求剧增,在视频会议,在线教育,电商购物等众多场景成了“生活新常态”。 本文将教你如何通过即构ZEGO 音视频 SDK 在Android端搭建实时视频通话能力。即构音视频SDK提…

写一个 ChatGPT token 编解码 Node.js 服务【含源码】

背景介绍 最近做了一个 ChatGPT 相关的项目 - Ai 玩伴,这是一个微信小程序。Ai 玩伴是基于OpenAI 的 GPT-3.5 语言模型,搭建富有性格特色的「Ai 玩伴」智能聊天机器人。它可以陪你聊天、陪你玩、为你解答各种问题,具体功能可以微信中搜索【A…

解决captcha验证码无法显示的问题

新装的Linux服务器,安装好了JDK1.6,却未设置JAVA_HOME,想不到这为此问题埋下了诱因。 在旧服务器上captcha的验证码没有任何问题。 问题描述: 1.跟踪log,发现servlet调用已经进来了,而且生成验证码的代码也已经走到了…

TP5.1 captcha 验证码刷新不出来(图片显示不了)

captcha 验证码安装路径: 解决办法: 2.打开文件后,加入 ob_clean(); 再次刷新页面就好了

谷歌验证码无法显示问题

解决方案 Google 人机验证(reCaptcha)无法显示解决方案(可解决大多数 CSP 问题) – Azure Zeng Blog 对于Edge,获取Header Editer的方式如下 注意点,Header Editer下载规则时候,需要把解决方案中的网址敲到URL的输入框里

谷歌验证码收不到 / Kaggle注册时无法验证 - 解决方案

谷歌验证码收不到 / Kaggle注册时无法验证 - 解决方案 前言问题解决方案 前言 科研时,需要注册或登录很多(Foreign)网站,极有可能发生谷歌验证码收不到的情况,本文以Kaggle网站为例介绍解决方案。 问题 Kaggle网址&…

验证码验证失败的那些事

原因就是我做登录操作时一直返回验证码不正确 我想着这不就一个手机号一个验证码吗 怎么还能错 ..... 然后我就把锅甩给了后台 (php) 后台说使用了Session让我去搜一下... From 李诗雨—http://blog.csdn.net/cjm2484836553/article/details/77341779 发现问题了 就让后台在我…