上下文学习思维链COTPrompt工程

一、上下文学习

上下文学习强调在学习过程中考虑问题所处的上下文环境。

1.1 上下文学习的分类

  • 零样本(Zero-Shot)上下文学习
  • 单样本(One-Shot)上下文学习
  • 少样本(Few-Shot)上下文学习

1.2 示例选择方法

两个主要依据是相似性和多样性

  • 直接检索:然后选取排名靠前的K个示例。
  • 聚类检索:把所有示例划分为K个簇,从每个簇中选取最为相似的示例,获取K个示例。
  • 迭代检索:下一个示例的选择依赖于当前的问题和已选择的示例。

1.3 性能影响因素

  • 预训练数据:领域丰富度、任务多样性、训练数据的分布
  • 预训练规模:模型参数规模
  • 演示示例:示例的数量和顺序

二、思维链

2.1 两种任务类型

(1)System-1任务

  • 依靠直觉和经验进行瞬间判断。
  • 随着规模(参数量、训练数据、算力)变大,模型性能显著提升。

(2)System-2任务

  • 运用逻辑分析、计算和有意识的思考来解决。
  • 模型会出现“Flat Scaling Curves”现象——即模型规模增长未带来预期性能提升。

2.2 思维链的定义

在提示中嵌入一系列中间推理步骤,引导大模型模拟人类解决问题时的思考过程,以提升模型处理System-2任务的能力

2.3 思维链的分类

在标准COT方法上,出现了许多扩展方法,这些方法按照其推理方式的不同,可以归纳为三种模式:按部就班、三思而行、集思广益

按部就班模式

强调逻辑的连贯性和步骤的顺序性

代表方法:

  • COT:手工构造(费时费力例子,作为示例放入Prompt,引导模型一步一步推理。
  • Zero-Shot COT:无需手工标注,只需提供简单的提示,如“Let's think step by step”,引导模型自行生成一条推理链。

魔法咒语:Let's think step by step.

  • Auto COT:聚类算法自动筛选相关样本,Zero-Shot生成思维链内容作为示例,引导大语言模型生成针对用户问题的推理链和答案。

不足:

  • 局部:在思维过程中不会探索不同的后续内容,即树的分支。
  • 全局:顺序链式输出,不存在回溯的过程。

三思后行模式

强调审慎和灵活

代表方法:

  • Tree of Thoughts(TOT):将推理过程构造为一棵思维树,允许模型在不确定时进行回溯重新选择。TOT从拆解、衍生、评估、搜索四个角度构造思维树。

  • Graph of Thoughts(GOT)

集思广益模式

强调观点和方法的多样性。

代表方法:

  • Self-Consistency:引入多样性的推理路径,从中提取并选择最一致的答案。

  • Universal Self-Consistency:利用LLMs自身选择最一致答案,支持更多种任务,无需答案提取过程。


三、Prompt工程

3.1 Prompt规范

编写规范的Prompt是与大语言模型进行有效沟通的基础。一个标准规范的Prompt通常由任务说明、上下文、问题、输出格式这几个部分中的一个或几个来组成。

3.2 Prompt技巧

  • 复杂问题拆解
  • 追问
  • 适时使用COT
  • 善用心理暗示:角色扮演or情景代入

3.3 Prompt工程应用

可以通过精心设计的Prompt激活大语言模型的内在潜力,而不需要对模型进行微调。Prompt已经在垂域任务、数据增强、智能代理等多个领域发挥出卓越性能。

(1)自然语言接口

  • Text to SQL
  • 代码生成

(2)大模型支撑的数据合成

  • Self-Instruct

(3)大模型增强的搜索引擎

(4)大模型赋能智能体

经典的智能体通常由大语言模型和四大模块组成,分别是:配置模块(Profile)、记忆模块(Memory)、计划模块(Planning)、行动模块(Action)。

单智能体仅包含一个智能体,交互相对简单,适用于简单任务。Prompt设计主要用于引导模型执行特定任务,且围绕单个上下文。

多智能体包含多个智能体,每个智能体都设定有角色和任务,交互复杂度高。他们协调、合作、竞争,以实现共同或各自目标。

(5)大模型驱动的具身智能

大语言模型是AGI的智慧引擎,机器人是大语言模型走向真实世界的物理载体。


四、参考

bilibili:浙江大学-大模型原理与技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/33258.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

嵌入式裸机设计--MCU常用裸机架构有哪些?

为什么是裸机设计 792125321入群学习更高效! 在MCU(微控制器单元)裸机开发中,我们常见的架构设计主要围绕如何高效管理资源和任务调度。认识这些开发方式,对我们开发一个小型项目来说及有好处! 下面介绍…

C语言基础知识04

指针 指针概念 指针保存地址,地址是字节的编号 指针类型和保存的地址类型要一直 使用时注意,把地址转换为&变量的格式来看 int a[3]; a转为&a[0] 指针的大小 64bit 固定8字节, 32bit 固定4字节 指针…

IDEA 一键完成:打包 + 推送 + 部署docker镜像

1、本方案要解决场景? 想直接通过本地 IDEA 将最新的代码部署到远程服务器上。 2、本方案适用于什么样的项目? 项目是一个 Spring Boot 的 Java 项目。项目用 maven 进行管理。项目的运行基于 docker 容器(即项目将被打成 docker image&am…

浏览器崩溃的第一性原理:内存管理的艺术

作者:京东科技 屠永涛 登录后复制 你是否曾经遇到过浏览器突然卡顿,甚至崩溃的情况?尤其是在打开多个标签页或运行复杂的网页应用时,浏览器似乎变得异常脆弱。这种崩溃的背后,往往与内存管理息息相关。 1. 浏览器的内存…

Redis的缓存雪崩、缓存击穿、缓存穿透与缓存预热、缓存降级

一、缓存雪崩: 1、什么是缓存雪崩: 如果缓在某一个时刻出现大规模的key失效,那么就会导致大量的请求打在了数据库上面,导致数据库压力巨大,如果在高并发的情况下,可能瞬间就会导致数据库宕机。这时候如果…

算法刷题整理合集(一)

本篇博客旨在记录自已的算法刷题练习成长,里面注有详细的代码注释以及和个人的思路想法,希望可以给同道之人些许帮助。本人也是算法小白,水平有限,如果文章中有什么错误或遗漏之处,望各位可以在评论区指正出来&#xf…

ubuntu ollama+dify实践

安装ollama 官网的指令太慢了,使用以下指令加速: export OLLAMA_MIRROR"https://ghproxy.cn/https://github.com/ollama/ollama/releases/latest/download" curl -fsSL https://ollama.com/install.sh | sed "s|https://ollama.com/dow…

Cookie与Session详解

Cookie简介 Cookie 是浏览器提供的持久化存储数据的一种机制。是指某些网站为了辨别用户身份、进行会话跟踪而储存在用户本地终端上的数据(通常经过加密)。以下是关于 Cookie 的详细介绍: Cookie工作原理 当你访问一个网站时,该网…

Python Openpyxl给Excel增加条件规则

使用openpyxl添加条件格式是一个简单而直接的过程。在使用Excel文件时,条件格式对于数据趋势的可视化、突出显示关键数据点以及使数据更有意义和可理解非常有用。在本文中,我们将详细介绍如何使用openpyxl添加条件格式。 OpenPyxl中的条件格式简介 在进…

离线服务器ollama新增qwen2:0.5b模型

离线服务器ollama新增qwen2:0.5b模型 Dify集成ollama前面已经介绍过离线服务器CentOS使用的docker安装的ollama,其中在ollama中已经安装了deepseek-r1:1.5b。目前的需求是需要再安装一个qwen2:0.5b的模型,那么如何安装呢? 1.首先在有网的服…

零成本本地化搭建开源AI神器LocalAI支持CPU推理运行部署方案

文章目录 前言1. Docker部署2. 简单使用演示3. 安装cpolar内网穿透4. 配置公网地址5. 配置固定公网地址 前言 嘿,小伙伴们!今天给大家带来一个超酷的黑科技——LocalAI。没错,你没听错,就是那个能在你的个人电脑上运行大型语言模…

数据类设计_图片类设计之4_规则类图形混合算法(前端架构)

前言 学的东西多了,要想办法用出来.C和C是偏向底层的语言,直接与数据打交道.尝试做一些和数据方面相关的内容 引入 接续上一篇,讨论图片类型设计出来后在场景中如何表达,以及图片的混合算法.前面的内容属于铺垫和基础,这篇内容和实际联系起来了. 背景图和前景图 这里笔者想先…

Burpsuite使用笔记

Burpsuite使用笔记 抓包设置代理open Browserintercept on输入要抓包的网站回车ForwardHTTP history查看抓包数据其他浏览器配置burpsuite代理浏览器代理器插件配置打开代理同样步骤访问 原理三级目录 抓包 设置代理 open Browser 打开内置浏览器 intercept on 输入要抓包…

使用Dockerfile打包java项目生成镜像部署到Linux_java项目打docker镜像的dockerfile

比起容器、镜像来说,Dockerfile 非常普通,它就是一个纯文本,里面记录了一系列的构建指令,比如选择基础镜像、拷贝文件、运行脚本等等,每个指令都会生成一个 Layer,而 Docker 顺序执行这个文件里的所有步骤&…

移远通信联合德壹发布全球首款搭载端侧大模型的AI具身理疗机器人

在汹涌澎湃的人工智能浪潮中,具身智能正从实验室构想迈向现实应用。移远通信凭借突破性的端侧AI整体解决方案,为AI机器人强势赋能,助力其实现跨行业拓展,从工业制造到服务接待,再到医疗康养,不断改写各行业…

技术视界|构建理想仿真平台,加速机器人智能化落地

在近期的 OpenLoong 线下技术分享会 上,松应科技联合创始人张小波进行了精彩的演讲,深入探讨了仿真技术在机器人智能化发展中的关键作用。他结合行业趋势,剖析了现有仿真平台的挑战,并描绘了未来理想仿真系统的设计理念与实现路径…

JConsole 在 Linux 上的使用

JConsole 在 Linux 上的使用指南 1. 启动 JConsole 远程监控 Linux 服务器上的 JVM 进程 1.1 修改 JMX 配置&#xff0c;允许远程访问 在 Linux 服务器 启动 Java 应用时&#xff0c;需要加上 -Djava.rmi.server.hostname<服务器IP>&#xff0c;完整的启动参数如下&am…

【C#学习】协程等待

来源GPT&#xff0c;仅记录学习 yield return WaitForEndOfFrame() 适用于 渲染结束后再执行代码&#xff0c;但 WebGL 可能不适合这个操作&#xff0c;会拖慢帧率。(渲染得太慢&#xff09; yield return null; 让代码在下一帧的 Update() 里继续运行&#xff0c;更加流畅。 …

店匠科技携手 PayPal 升级支付体验,助力独立站商家实现全球增长

在全球化电商竞争加剧的背景下,独立站为无数商户插上了通向事业成功的翅膀。然而,搭建店铺框架容易,真正实现有效运营却充满挑战。只有当各个环节如齿轮般严丝合缝,独立站运营才能更好地助推行进,实现稳健增长。如今,独立站商家面临着全链路运营的多重挑战。从品牌塑造、营销推…

【算法】数组、链表、栈、队列、树

⭐️个人主页&#xff1a;小羊 ⭐️所属专栏&#xff1a;Linux 很荣幸您能阅读我的文章&#xff0c;诚请评论指点&#xff0c;欢迎欢迎 ~ 目录 持续更新中...数组、链表点击消除环形链表环形链表 II 栈、队列树 持续更新中… 数组、链表 点击消除 AB5 点击消除 这个题很容…