【NLP 48、大语言模型的神秘力量 —— ICL:in context learning】

目录

一、ICL的优势

1.传统做法

2.ICL做法

二、ICL的发展 

三、ICL成因的两种看法

1.meta learning

2.Bayesian Inference

四、ICL要点

① 语言模型的规模

② 提示词prompt中提供的examples数量和顺序

③ 提示词prompt的形式(format)

五、fine-tune VS ICL


不要抓着枯叶哭泣,你要等待初春的芽

                                                —— 25.3.26

一、ICL的优势

1.传统做法

任务定义 ——> 建立标注规范 ——> 标注人员学习标注规范 ——> 标注人员进行标注 ——> 对标注结果进行审核 ——> 使用标注数据训练模型 ——> 模型验证效果 ——> 模型实际预测

2.ICL做法

任务定义 ——> 模型实际预测

ICL方法如果完全成熟,意味着fine-tune范式的终结


二、ICL的发展 

关于ICL的成因,目前学术界没有被广泛认可的解释,只有若干假说和一些表现分析。

在GPT3的论文中,z-s【zero-shot】,o-s【one-shot】,f-s【few-shot】都属于ICL 


chain-of-thought思维链属于ICL


GPT3给出参考:在输入中加入至少一个样本,能大幅提升ICL效果

对于一个较大的模型而言,给出一个例子就可以显著的提升ICL的效果,给出Few-shot,准确性还会有所提升

对于一个较弱的模型而言,给出多少例子都不会显著提升ICL的效果


fine-tune会伤害ICL能力


精巧的提示词prompt设计有可能超过os、fs,可以通过提示词的改写进一步提高ICL的能力 


Magical word

不给出思维链,而是在输入时多加入一句提示词,需要模型一步步思考:Let's think step by step

模型就可以像思维链一样主动发出思考,最终输出正确的结果


ICL时输入错误样本,不一定影响准确率

我们发现,用随机标签替换正确标签只会略微影响性能,这一趋势在几乎整个过程中是一致的


ICL可以压倒先验知识


三、ICL成因的两种看法

1.meta learning

大模型能在内部训练小型网络

2.Bayesian Inference

模型任务可以看作一个贝叶斯一样的多条件概率的组合,pretrain、prompt、example三者条件概率的组合,三者皆对于最终概率有影响


四、ICL要点

① 语言模型的规模

语言模型需要达到一定的规模

② 提示词prompt中提供的examples数量和顺序

给出的示例样本的数量和顺序也会影响模型效果的好坏

③ 提示词prompt的形式(format)

提示词的格式也十分重要,好的模型会根据你给出的格式回答你的问题


五、fine-tune VS ICL

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/42434.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于Spring AI开发本地Jenkins MCP Server服务

前言 首先介绍下MCP是什么? MCP是由开发了 Claude 模型的 Anthropic 公司2024年12月提出并开源的一项开放标准,全称:Model Context Protocol,它是一个开放协议,它使 LLM 应用与外部数据源和工具之间的无缝集成成为可能…

94二叉树中序遍历解题记录

怎么说呢,以为这道题不用记录了,菜得吓到了自己。起因是这个遍历的递归一般是写两个函数完成,如下: func inorder(root *TreeNode, res *[]int) {if root nil {return}inorder(root.Left, res)*res append(*res, root.Val) // …

重磅推出稳联技术Profinet转CANopen网关智能工厂解决方案!

重磅推出稳联技术Profinet转CANopen网关智能工厂解决方案! 稳联技术Profinet转CANopen网关应运而生——它如同一座智能桥梁☺,打通两大主流工业协议,让异构网络无缝互联,助您释放设备潜力,实现真正的“万物互联”&…

Python正则表达式(一)

目录 一、正则表达式的基本概念 1、基本概念 2、正则表达式的特殊字符 二、范围符号和量词 1、范围符号 2、匹配汉字 3、量词 三、正则表达式函数 1、使用正则表达式: 2、re.match()函数 3、re.search()函数 4、findall()函数 5、re.finditer()函数 6…

ArayTS:一个功能强大的 TypeScript 工具库

目录 ArayTS:一个功能强大的 TypeScript 工具库🚀 主要特性1. 数据结构与算法2. 实用工具函数3. 类型工具4. 数据验证5. 字符串处理6. 数组处理7. 对象处理8. 样式处理9. 随机数生成10. 文件处理 💡💡💡除此之外&#…

【质量管理】防错(POKA-YOKE)的概念、特点和作用解析

什么是防错法? 防错法(日语发音为PO-ka yo-KAY)是指运用某种机制或设备,帮助设备操作员(或任何人)避免犯错。在日语中,“poka-yoke” 意为 “防错” 或 “预防疏忽性错误”,最初被称…

【Sql Server】在SQL Server中生成雪花ID(Snowflake ID)

大家好,我是全栈小5,欢迎来到《小5讲堂》。 这是《Sql Server》系列文章,每篇文章将以博主理解的角度展开讲解。 温馨提示:博主能力有限,理解水平有限,若有不对之处望指正! 目录 前言认识雪花ID…

HarmonyOS NEXT——【鸿蒙原生应用加载Web页面】

鸿蒙客户端加载Web页面: 在鸿蒙原生应用中,我们需要使用前端页面做混合开发,方法之一是使用Web组件直接加载前端页面,其中WebView提供了一系列相关的方法适配鸿蒙原生与web之间的使用。 效果 web页面展示: Column()…

Spring Data审计利器:@LastModifiedDate详解!!!

🕒 Spring Data审计利器:LastModifiedDate详解🔥 🌟 简介 在数据驱动的应用中,记录数据的最后修改时间是常见需求。Spring Data的LastModifiedDate注解让这一过程自动化成为可能!本篇带你掌握它的核心用法…

循环神经网络(RNN)

循环神经网络(RNN) 循环神经网络(Recurrent Neural Network,简称 RNN)是一类用于处理序列数据的神经网络模型。与传统的前馈神经网络(如多层感知机)不同,RNN 具有反馈结构&#xff…

iOS rootless无根越狱检测方案

不同于安卓的开源生态,iOS一直秉承着安全性更高的闭源生态,系统中的硬件、软件和服务会经过严格审核和测试,来保障安全性与稳定性。 据FairGurd观察,虽然iOS系统具备一定的安全性,但并非没有漏洞,如市面上…

【React】基于 React+Tailwind 的 EmojiPicker 选择器组件

1.背景 React 写一个 EmojiPicker 组件,基于 emoji-mart 组件二次封装。支持添加自定义背景 、Emoji 图标选择!并在页面上展示! 2.技术栈 emoji-mart/data 、emoji-mart : emoji 图标库、元数据 tailwindcss: 原子化 CSS 样式库 antd : 组…

skynet.socket.limit 使用详解

目录 核心作用方法定义使用场景场景 1:限制接收缓冲区(防御大包攻击)场景 2:动态调整限制(应对不同负载) 底层机制注意事项完整示例:带流量控制的 Echo 服务总结 在 Skynet 框架中,s…

electron打包vue2项目流程

1,安装一个node vue2 的项目 2,安装electron: npm install electron -g//如果安装还是 特比慢 或 不想安装cnpn 淘宝镜像查看是否安装成功:electron -v 3,进入到项目目录:cd electron-demo 进入项目目录…

【面试八股】:常见的锁策略

常见的锁策略 synchronized (标准库的锁不够你用了)锁策略和 Java 不强相关,其他语言涉及到锁,也有这样的锁策略。 1. 悲观锁,乐观锁(描述的加锁时遇到的场景) 悲观锁:预测接下来…

【数据分享】基于联合国城市化程度框架的全球城市边界数据集(免费获取/Shp格式)

在全球城市化进程不断加快的今天,如何精准定义和测量“城市”成为关键问题。不同国家和机构采用不同的标准,导致全球城市化水平的统计结果存在较大差异。同时,由于数据来源分散、标准不统一,获取一套完整、可比的全球城市边界数据…

acwing 每日一题4888. 领导者

目录 题目简述: 思路梳理: 总代码: https://www.acwing.com/problem/content/description/4891/ 题目简述: 有两个品种的奶牛,分别为G和H,我们要在每个品种中各找一头牛当领导者,最后输出全…

在Windows下VSCodeSSH远程登录到Ubuntu

Window用VSCode通过SSH远程登录Ubuntu SSH 服务开启Windows远程登录 SSH 服务开启 首先要确保 Ubuntu 的 SSH 服务开启了,开启 Ubuntu 的 SSH 服务以后我们就可以在 Windwos 下使用终端软件登陆到 Ubuntu 开启 SSH sudo apt-get install openssh-serverWindows远…

软件性能测试中的“假阳性”陷阱

软件性能测试中的“假阳性”陷阱主要表现为错误警报频繁、资源浪费严重、测试可信度降低。其中,错误警报频繁是最常见且最严重的问题之一,“假阳性”现象会导致开发团队在解决不存在的问题上花费大量时间。据行业调查显示,超过30%的性能优化成…

AwesomeQt分享3(含源码)

AwesomeQt 这个项目包含了多个Qt组件的使用示例,旨在展示Qt各种强大功能的实现方式。 源码分享 github: awesome_Qtgitee: 后续同步 项目进度 QCustomPlot曲线控件示例 支持排序和筛选的列表控件示例 支持排序和筛选的表格控件示例 属性表示例 Dock窗口示例 自绘…