LLaMA模型微调版本 Vicuna 和 Stable Vicuna 解读

image-20230627205553279

Vicuna和StableVicuna都是LLaMA的微调版本,均遵循CC BY-NC-SA-4.0协议,性能方面Stable版本更好些。

CC BY-NC-SA-4.0是一种知识共享许可协议,其全称为"署名-非商业性使用-相同方式共享 4.0 国际"。

即 用的时候要署名原作者,不能商用,下游使用也必须是相同的共享原则。

Vicuna

Vicuna(小羊驼、骆马)是LLaMA的指令微调版本模型,来自UC伯克利,代表模型为Vicuna-13B。

  • 博客:Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90% ChatGPT Quality
  • 项目代码:https://github.com/lm-sys/FastChat
  • 评估方法Paper:https://arxiv.org/pdf/2306.05685.pdf

训练过程

用ShareGPT网站的用户分享的ChatGPT对话记录,70k条对话数据对 LLaMA进行监督质量微调训练,性能超越了LLaMa和Stanford Alpaca,达到了与ChatGPT相似的水平。

image-20230627205646182

  1. 从ShareGPT上扒了70k对话语料,将HTML数据转化为markdown并对不合适、低质量的样本进行了过滤,同时对比较长的数据进行了切分,来适应模型的上下文长度;
  2. 用Alpaca的代码进行多轮对话训练,使用8-A100,基于Pytorch FSDP训练框架训一天;
    1. **多轮对话训练:**任务还是next token prediction,同时loss只计算文本中chatbot输出的部分;
    2. **显存优化:**将最大上下文长度从alpac的512调整为2048,然后用 [gradient checkpointing](https://lmsys.org/blog/2023-03-30-vicuna/#:~:text=gradient checkpointing) 和 flash attention 进行了显存节省。
    3. 省钱:作者使用SkyPilot的算力计算的,就使用了SkyPilot managed spot来降低成本,利用更便宜的spot实例来自动恢复抢占和自动区域切换。13B模型能从$1K节省到$300。
  3. 在评估模型方面,之前的评估方式对现在的对话模型不再适用了,作者用MT-Betch一个多轮对话数据集ChatBot Arena(聊天机器人竞技场)的众包平台进行评估。众包平台上是真实的用户来进行打分,另外因为GPT-4是基于强化学习与人类反馈(RLHF)训练出来的模型,具有较好的与人对齐的能力,所以作者用GPT-4也代替人对其他模型进行评判,从而节省成本。具体可作者论文 Judging LLM-as-a-judge with MT-Bench and Chatbot Arena。

现有不足

  1. 推理能力、数学能力不足;
  2. 自我感知能力不够、幻觉问题仍然存在;
  3. 模型本身可能存在潜在的偏见(比如某些言论不正确,毕竟数据集决定了模型的立场)

Stable Vicuna

Stable Vicuna: https://github.com/Stability-AI/StableLM

基于 Vicuna-13B v0 的RLHF微调版本,由StabilityAI发布。没有训练细节纰漏,但应该比 Vicuna 要更优一些。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18075.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是In-Context Learning(上下文学习)?

©作者 | 董冠霆 单位 | 北京邮电大学 研究方向 | 自然语言理解 前言 随着大模型(GPT3,Instruction GPT,ChatGPT)的横空出世,如何更高效地提示大模型也成了学术界与工业界的关注,因此 In-context learn…

ACL2023论文写作能否使用ChatGPT?

每天给你送来NLP技术干货! 来自:HFL实验室 随着以ChatGPT为代表的生成式AI的火热,近期人工智能领域的顶级会议相继推出相关政策以进一步规范这类工具在科学文献撰写中的使用。ACL 2023程序委员会主席在近期的一篇博客中披露了ACL 2023大会的相…

五年引用3.8万次,Transformer宇宙发展成了这样,ChatGPT只是其中之一

©作者 | 袁铭怿、陈萍 来源 | 机器之心 关于 Transformer ,这是一篇很好的学习指南,可以帮助你熟悉最流行的 Transformer 模型。 自 2017 年提出至今,Transformer 模型已经在自然语言处理、计算机视觉等其他领域展现了前所未有的实力&am…

很全面的提示工程指南(包含大量示例!)

提示工程指南 提示工程介绍基础提示配置参数的含义标准提示语提示语的要素提示设计的一般技巧从简单的提示开始指令(Instruction)具体(Specificity)避免不精确的描述(Preciseness)避免说不要做什么 基础提示…

PgSQL修改登录密码

(1)首先必须在安装postgerSql的服务器上进行操作。先找到postgerSql的安装目录,如下图所示。 (2)在postgerSql的安装目录下,找到data文件夹下的pg_hba.conf文件,用文本文档编辑工具打开该文件。…

admin是谁,以及如何修改admin密码

一、admin是谁? admin是多可文档管理系统默认的系统管理员。当你安装完多可文档管理系统后,立刻就能通过他来登陆多可系统。 admin是包含在用户数里的。如果你用的是10个用户的免费版,那么admin就会占用一个用户,也就是说你可以…

chatgpt赋能Python-python_ichat

Python iChat: 一款高效的通讯工具 如果你正在寻找一款既功能全面、又易于使用的通讯工具,那么Python iChat就是你所需要的。Python iChat是一款基于Python编程语言的开源通讯应用程序,它具有轻巧、快速、易扩展等特点,因此得到了众多开发者…

从零开始,通过 ChatGPT-4 十分钟开发了一个浏览器插件,并成功运行

点击上方“Java基基”,选择“设为星标” 做积极的人,而不是积极废人! 每天 14:00 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源项目RPC 框架 Dubbo 源码解析网络应…

chatgpt人工智能AI付费对话自适应源码openai写代码写论文付费问答3.5接口

ChatGPT为你服务: 1. 知乎百度答题、做作业题目 2. 写代码、写文案、写论文,写小说 3. 文案润色、翻译、写诗作词 4. 扮演面试官、扮演书籍电影角色 5. 陪聊倾诉、解忧、讲故事. 6. 项目判断,资源寻找,百度答题 运行环境&a…

搭建一个chatgpt的计费接口,让别人对接使用+api管理系统源码

前言: 要做一个对接chatgpt的接口,让别人对接使用的话,首先我们必须要有一个自己的api管理系统的代码,代码我放在了gitee上,大家感兴趣的可以下载,可以使用官方接口,也可以使用自己定义的接口&…

P、NP与NPC 的通俗理解

P、NP与NPC 的通俗理解 1.多项式时间复杂度 定义: 解决问题需要的时间与问题的规模之间是多项式关系。 多项式关系形如O(nk)” role”presentation” style”position: relative;”>O(nk)O(nk),k为某个常数,n是问题的输入规模。例如&am…

【计算理论】计算理论总结 ( P 、NP 、NPC 总结 ) ★★

文章目录 一、P 类二、NP 类三、NPC 类 ( NP 完全 )四、P 、NP 、NPC 三者关系 一、P 类 P \rm P P 类 : ★ 所有 能够被 确定性 单个带子图灵机 , 在 多项式时间 内 , 能够被 判定的计算问题 ( 语言类 ) , 将这些问题放在一起 ( 广义并集 ⋃ \bigcup ⋃ ) , 组成一个整体 ,…

奇迹私服服务器端npc修改,奇迹教程-奇迹EX802 NPC商店修改教程与NPC编号查询

摘 要 本教程适用于EX802的NPC商代为XML文件的,主要详细介绍手动修改NPC商店教程,我们记得在03H版本中NPC商店修改的是TXT文件,本次修改是XML文件,修改大致相同,就是格式不是太一样,为了 y8xrookie博客-Rk Blog 本教程适用于EX802的NPC商代为XML文件的,主要详细介绍…

我的世界服务器最新npc获得,我的世界1.8Citizens2——NPC插件

Citizens2(公民2)是一款非常有趣的NPC插件,他可以给服务器带来故事背景,风格,是纯净服务器必备的选择! 可以创建一个NPC,让它说话,让它走动,让他当守卫等等。 它也有很多扩展插件(扩展插件有时间…

我的世界服务器npc怎么修改,我的世界NPCmod教程如何设置任务NPC

我的世界中,玩家可通过npcmod来创建有任务的npc,那么有任务的npc该怎么创建呢,下面一起来看看吧。 一,创建新的NPC 请使用这个东西右键地面 这时就创建好了一个漂亮的NPC 这是你建立好的成品 如果你想改他的皮肤或者是名称请打开他基本属性栏我就不详说了 这时候我们创建好…

传奇服务器npc位置文件,传奇GEE引擎服务端自定义NPC示列工具

传奇GEE引擎服务端自定义NPC示列工具 测试自定义NPC 配置文件:D:\MirServer\Mir200\Envir\CustomNPC 先在 Merchant.txt 中,设置一个 appr 10000 的npc,然后重新加载npc,进入自定义npc设置 在 Merchant.txt 中配置一个npc appr …

018 打开NPC交接任务功能分析

文章目录 打开NPC交任务接任务 打开NPC 来到明文封包call头部,点击NPC,然后断下。这里最好新建一个1级的小号,去分析,这样周围没有其他玩家会少很多干扰项。 返回上层,这个call应该就是我们要的选择NPC的call 但是我们…

传奇私服服务器怎么增加npc,传奇添加NPC的方法以及形象代码计算

今天介绍一下如何在传奇私服里面增加NPC,以及自定义NPC的外观样子。 本文使用的GOM引擎,添加自定义NPC很简单只需要两步: 传奇添加NPC的方法步骤: 首先:在服务端目录Mir200中的Envir目录里面找到Merchant.txt&#xff…

群晖部署nps的客户端npc in docker

先下载一个npc的容器,注意是npc 启动 然后高级设置 (3)点击“高级设置” (4)点击“添加文件夹” (5)选择一个NAS本地文件夹。(要记住,待会用到) (6)装载路径为“/conf” 注意这个是配置文件所在地 网络选择本地hosts网络 然后创建后,到conf目录添加下配置文件…

服务器自定义npc音乐,Custom NPC 自定义NPC模组自定义音乐添加教程

教程 一、格式转换[也是很重要的一部,音乐格式必须为ogg不然放不出声音] MC所使用的音乐格式为ogg,所以你要把需要添加的音乐转换成合适的ogg格式。 二、添加文件 打开MC的.minecraft\customnpcs\assets\customnpcs\sounds文件夹然后你可以直接把ogg音乐放在那里,也可以新建一…