大型语言模型 (LLM) 的两条发展路线:Finetune v.s. Prompt

前言

如果你对这篇文章感兴趣,可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。

在大型语言模型的研究中,研究者对其有两种不同的期待,也可以理解为是两种不同的路线,具体来说:

  • 期待一:成为专才,解决某类特定任务(翻译、获取摘要)
  • 期待二:成为通才,给定指令(Prompt),即可完成对应任务
    • 最早的该方向研究,认为所有 NLP 任务都可以变成问答任务,由此统一所有任务

在下文中,我们将对这两种不同的期待进行介绍。


专才的期待

专才在单一任务上有机会赢过通才。例如在下述论文中,在各类任务上(数值越大越好),ChatGPT 表现都不错,但依然没办法赢过专才。

在这里插入图片描述
由此对应了「专才」的使用方式,即对最初的领域大模型进行微调,对结构进行一些修改,或微调一些参数:

  • 与 BERT 的训练过程也比较符合,其训练过程为句子填空,因此训出的模型无法生成完整的句子,还需针对具体场景进行微调

在这里插入图片描述
如下所示,四种 BERT 增加 Head 的结构修改方式,使其可以做特定的任务:

在这里插入图片描述
以及对模型的参数做微调(Finetune),即用少量数据对模型参数进行调整,可以调整 LLM 的参数,也可以仅调整新增加结构的参数。

Adapter (Efficient Finetuning) 即对大模型增加一些插件,针对下游任务进行微调时,只需调整 Adapter 上的参数即可。
在这里插入图片描述


通才的期待

符合人类对「人工智能」的想象,且开发新任务非常方便,只要重新设计 Prompt 就可以快速开发新功能,大大提升效率。

对于通才来说,也包含两类任务:

  • 【Instruction Learning】给出题目的叙述,让机器进行回答;
  • 【In-context Learning】给出范例,让机器回答其它问题。

In-context Learning

【核心任务】给一些例子,然后再让机器回答相似问题:

在这里插入图片描述

机器似乎没有对例子进行学习,如下述实验结果所示:

  • 蓝色:没有例子(很差)
  • 黄色:有例子,且例子标记正确(最好)
  • 红色:有例子,且例子标记随机(对比最好,微微下降)

在这里插入图片描述

但这些例子的领域似乎很重要,如下述所示:

  • 多个一个紫色的柱子,其用的例子为与后续问题无关的内容,且标记随机(性能继续下降)

在这里插入图片描述

因此一种猜测是:在 In-context Learning 中,模型并没有在范例中学习,范例的作用是激活模型,告诉它现在的任务是关于什么领域的,因此范例的数量也并没有很重要。

不过后续又出现了新的工作,他们认为对于很大的模型来说,模型可以从上下文的例子中进行学习,如下述实验结果所示:

  • 颜色越深,模型越大
  • 横轴为错误的标签比例,纵轴为指标
  • 可以看到错误的数据越多,对模型的性能影响越大

在这里插入图片描述

Instruction Learning

文字接龙训练得到的模型,还需要做一下 Instruction-tuning,才能根据问题的叙述,切换到相应的任务上。

Instruction-tuning 期望做的事,如下所示:

在这里插入图片描述
做 Instruction-tuning,需要收集各式各样的任务(包含标注),再将这些任务改写为指令,如下所示:

在这里插入图片描述

Chain of Thought (CoT)

之后又有人发现,在 In-context learning 时,给出推导过程,大模型上下文学习的能力会得到加强,进一步地,后来就有人直接在 prompt 里加入「Let’s think step by step」,而这简单一句话,也使模型性能得到了提升。

在这里插入图片描述

如果做 chain of thought,模型生成的答案就会比较 diverse,因此一种 self consistency 的方法也相应提出,即运行多次,对所有出现的答案做一个投票,输出最常出现的答案。

Prompt Engineering

还有让模型自己找 Prompt 的方法:

  • 给出例子,让机器自己来找 Prompt

在这里插入图片描述
完整的方法是,给出上述例子,让机器找,多找几次,对每一个 prompt 打分,然后把分数高的留下来,继续输入给 LLM,让它找相似的,如下所示:

在这里插入图片描述


参考资料

  • Hung-yi Lee:大型语言模型的两类使用方式(一)
  • Hung-yi Lee:大型语言模型的两类使用方式(二)
  • Hung-yi Lee:大型语言模型的两类使用方式(三)
  • Is ChatGPT A Good Translator? Yes With GPT-4 As The Engine
  • How Good Are GPT Models at Machine Translation? A Comprehensive Evaluation
  • Rethinking the Role of Demonstrations: What Makes In-Context Learning Work?
  • Why Can GPT Learn In-Context? Language Models Secretly Perform Gradient Descent as Meta-Optimizers
  • Larger Language Models Do In-context Learning Differently
  • Multitask Prompted Training Enables Zero-shot Task Generalization
  • Self-consistency Improves Chain of Thought Reasoning in Language Models
  • Large Language Models Are Human-level Prompt Engineers
  • 进击的 BERT:NLP 界的巨人之力与迁移学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/38221.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

违禁敏感词检测

很多站长和自媒体人都有这样的烦恼,因为不慎发布违禁、违规内容比如涉黄、恐怖暴力、赌博、低俗辱骂、政治敏感等,导致文章下架或者网站整改。 另外,自从新《广告法》出台后,作为广告、营销人等群体在写文案的过程中必须时时注意新…

ChatGPT神器Code Interpreter,用做数据分析如此丝滑!

前几天,OpenAI 宣布要在一周之内将官方插件 Code Interpreter 通过设置中的 Beta 面板向所有 ChatGPT Plus 用户提供。 这个消息让很多人激动了起来,毕竟此前 Code Interpreter 一直处于封闭测试阶段,只有一小部分用户真正使用过。这些内测用…

艾瑞巴蒂看过来!OSSChat 上线:融合 CVP,试用通道已开放

还在纠结于反复查找开源项目的技术文档? 团队常因频繁搜索开源项目主页导致效率低下? 每天都要问一遍【开源项目中那些“小白问题”究竟有没有更快的解决方法?】 对此,只想对你说:赶紧试试 OSSChat!赶紧试…

AI生产力工具平台AI100.ai今日正式上线,ChatGPT API和Prompt机器人免费试用

上个月,AI100.ai开放注册,我们发出1000份免费测试邀请,得到了开发者的积极参与和反馈,加速了AI00.ai的功能优化。AI00.ai今日正式上线,为感谢广大开发者的支持,现面向开发者启动ChatGPT API免费试用活动&am…

免费、不用部署SD:AI二维码制作教程

大家好,我是可夫小子,《小白玩转ChatGPT》专栏作者,关注AIGC、读书和自媒体。 最近,风格化的AI二维码,应该没少见吧。生成的原理大家大概也知道,主要通过stable diffusion和一些插件来完成,但对…

宠物店小程序功能有什么_分享宠物店小程序开发制作功能介绍

宠物店微信小程序主要功能有: 1、宠物寄养支持在线提交寄养预约,自主选择宠物寄养位。上门接送或自主接送。一键提交,摆脱繁琐流程。 2、线下买单线下店铺消费也可以使用会员余额。 3、宠物服务可以选择一键搜索或服务分类查询需要的宠物服务…

猫狗分类,猫狗大战

项目全部代码在文章末尾 1、任务描述 Cats vs. Dogs(猫狗大战)数据集下载地址为https://www.kaggle.com/c/dogs-vs-cats/data。这个数据集是Kaggle大数据竞赛某一年的一道赛题,利用给定的数据集,用算法实现猫和狗的识别。 其中包…

Cats vs. Dogs(猫狗大战)数据集处理

猫狗大战数据集 Cats vs. Dogs(猫狗大战)数据集下载地址为https://www.kaggle.com/c/dogs-vs-cats/data。这个数据集是Kaggle大数据竞赛某一年的一道赛题,利用给定的数据集,用算法实现猫和狗的识别。 其中包含了训练集和测试集&a…

宠物管理|养犬登记|宠物识别|智慧城市监控|城市犬类管理系统

关键词:宠物识别、宠物面部识别、宠物管理、宠物社交、宠物培训、宠物保险、鼻纹识别、宠物登记、宠物比赛、宠物走失、宠物用品、智慧宠物; “犬类管理”正日益成为城市治理的重要话题之一。 据最新数据,2020年全国犬数量为5222万只&#…

一文读懂物联网大数据产业链

原文地址 大数据开启了一个大规模生产、分享和应用数据的时代,它给技术和商业带来了巨大的变化。麦肯锡研究表明,在医疗、零售和制造业领域,大数据每年可以提高劳动生产率0.5-1个百分点。物联网时代,大数据在核心领域的渗透速度有…

专访智齿科技徐懿丨企服公司四要素:智能、融合、产品复杂度、客单价

关注52AI,做AI的行业领先者。QQ人工智能行业交流群:626784247. 01 徐懿认为:客服企业的两大核心要素是“融合”以及“智能”,围绕这两点,该领域所有公司将被划分为四个象限,而客服行业未来的趋势一定是向着…

大数据的产业链分析,大数据完整的产业链构成

大数据的产业链分析大数据完整的产业链构成,可分为标准与规范、数据安全、数据采集、数据存储与管理、数据分析与挖掘、数据运维以及数据应用几个环节,覆盖了数据从产生到应用的整个生命周期。 大数据的产业链分析 1数据标准与规范 大数据标准体系是开展…

Tableau 聚合计算 - 分组求和(sum、fixed、include的使用)

一、聚合计算例子 有以下数据: // 计算1 SUM(IF [shuxue]123 then [yingyu] END)// 计算2 IF [shuxue]123 then {fixed [shuxue]: SUM([yingyu])} END// 计算3 IF [shuxue]123 then {SUM([yingyu])} END// 计算4 {fixed [shuxue]: SUM([yingyu])}// 计算5 {include…

我的一些关于商业计划书的经验

一年了,我一直在写一个关于传媒的商业计划书,着急要写个商业计划书,才发现这个事情还真是经验活,加上时间紧,最后搞的也不太好。回头自己系统的学习了一下理论知识包括各式。我曾问我 之前的一个导师说这个东西怎么写&…

商业计划书简单了解

《商业计划书制作与演示》章节测试答案 笔记课程来源:学习通:北京科技大学《商业计划书制作与演示》 第一章、商业计划书基础知识 大学生创业能力结构模型 商业计划书定义 商业计划书,是创业公司、企业或项目单位为了达到招商融资和其它发展…

[创业之路-57] :商业计划书BP如何书写?总体框架!

引言: BP (Buiness Plan) ,即商业计划书,本质上还是一份计划,是一份商业计划,即一种关于如何赚钱的计划,是一份通过组建公司,运营项目,进而赚钱的项目计划。 什么是商业?…

如何写一篇给天使投资人看的《商业计划书》?

转自:https://www.sohu.com/a/164233213_259030 笔者遇到过形形色色的创业者。总体来说,创业者要么把写商业计划书想的太简单,要么就是想得太难,很少有创业者去实实在在地了解商业计划书的写法和内在逻辑。 1.商业计划书本质是什…

Github api 请求速率说明和请求限制说明,使用认证token增加请求次数

有能力的可以看官方文档:Resources in the REST API - GitHub Docs GitHub 对每小时可以发送的请求数量有限制。通常,GitHub API的标准限制为: 未经身份验证 - 每个原始 IP 地址每小时60个请求;已验证 – 每个用户每小时可发送 5…

浏览器同域名请求的最大并发数限制

当我们在浏览网页的时候,对浏览速度有一个重要的影响因素,就是浏览器的并发数量。并发数量简单通俗的讲就是,当浏览器网页的时候同时工作的线程数量。 如果同时只有2个并发连接数数量,那网页打开的时候只能依赖于这2条线程&#…

postman点击一次连续发送多个请求

使用场景:postman有两个请求,每次调其他业务接口时都需要先执行这两个,我嫌太麻烦了得一个个点,怎么整? 这是准备操作的两个请求: 点击这个按钮,打开界面如下两个图 点击左下角的RUN即可看到你…