【大模型基础_毛玉仁】3.3 思维链

【大模型基础_毛玉仁】3.3 思维链

news/2025/3/22 16:29:39/文章来源:https://blog.csdn.net/weixin_48267104/article/details/146380476

目录

- 3.3 思维链
- - 3.3.1 思维链提示的定义
  - 3.3.2 按部就班
  - - 1）Zero-Shot CoT
    - 2）Auto-CoT
  - 3.3.3 三思后行
  - - 1）思维树（Tree of Thoughts, ToT）
    - 2）思维图（Graph of Thoughts, GoT）
  - 3.3.4 集思广益

3.3 思维链

语言模型参数规模扩大，在自然语言处理任务中表现增强，但在算术求解等复杂推理任务中出现“Flat Scaling Curves”现象。

受人类逐步推理的启发，一种创新的 Prompt 范式——思维链提示 （Chain-of-Thought，CoT），被用于引导模型逐步推理，提升其处理复杂任务的能力，突破限制，激发潜能。

.

3.3.1 思维链提示的定义

思维链提示 （Chain-of-Thought，CoT）：

模拟人类思考，引导大语言模型在生成答案时引入中间推理步骤；
这提升推理任务表现，同时揭示模型处理复杂问题时的内部逻辑和推理路径。

CoT 的核心：构造合适的 Prompt 以触发大语言模型一步一步生成推理路径，并生成最终答案。

下图展示了求解数学问题的 CoT 形式的 Prompt 的例子。

图 3.10: 包含少量样本示例的 CoT 提示示例
在这里插入图片描述

在 CoT 核心思想指引下，衍生出按部就班、三思后行和集思广益三种推理模式：

按部就班：模型按预设逻辑路径一步步推理，如 CoT、Zero-Shot CoT、Auto-CoT 等方法。
三思后行：模型每一步评估后从多个方向选下一步，如 ToT、GoT 等方法。
集思广益：模型生成多条推理路径并整合结果，如 Self-Consistency 等方法。

.

3.3.2 按部就班

按部就班模式强调推理的逻辑连贯性和步骤顺序性，通过一步步推理得到结论，使决策透明可预测。

原始少样本思维链（CoT）方法采用此模式，通过手工构造示例引导模型生成推理步骤和答案，但存在编写耗时费力、依赖编写质量的问题。

为此，研究者提出了 Zero-Shot CoT 和 Auto-CoT 两种变体以改进。

1）Zero-Shot CoT

Zero-Shot CoT 通过“让我们一步一步思考”等提示词引导模型自行生成推理链，无需手工标注示例，降低了人工依赖，在多个推理任务上性能媲美甚至优于原始少样本 CoT。

其流程分两阶段：

第一阶段，在问题后添加提示词，让模型生成中间推理步骤；
第二阶段，将问题和推理步骤拼接后加上“因此，最终答案为”等语句，输入模型生成最终答案。

2）Auto-CoT

Auto-CoT 在 Zero-Shot CoT 基础上，通过聚类技术从问题库中筛选出与用户提问相关的问题，借助 Zero-Shot CoT 生成这些问题的推理链作为示例，为模型提供不同解题思路。

具体步骤：

聚类筛选：利用聚类技术从问题库中筛选出与用户提问相关的问题。
生成示例：借助 Zero-Shot CoT 为筛选出的问题生成推理链，形成包含不同问题及其对应推理内容的示例，为模型提供多种解题思路。
引导推理：在这些示例基础上，以“让我们一步一步思考”引导大语言模型生成针对用户问题的推理链和答案。

整个过程无需手工标注，提升了 CoT 效果。

.

3.3.3 三思后行

三思后行模式强调决策过程中的审慎和灵活性。模型每一步都会评估当前情况，判断是否调整推理方向，允许在遇到困难或不确定性时回溯和重新选择，确保决策的稳健性和适应性。

这种模式模仿了人类解决问题时反复选择回溯的过程。基于此，研究者提出了思维树（Tree of Thoughts, ToT）、思维图（Graph of Thoughts, GoT）等 CoT 变体。

1）思维树（Tree of Thoughts, ToT）

ToT 将推理过程构造为一棵思维树，其从以下四个角度对思维树进行构造：

拆解：将复杂问题拆分为多个简单子问题，每个子问题的解答对应一个思维过程，拆解形式依任务而定。
衍生：模型根据当前子问题生成下一步推理方向，衍生有样本启发和命令提示两种模式。
评估：利用模型评估推理节点合理性，根据任务特点选择投票或打分模式决定节点保留。
搜索：从当前状态出发，依据任务特点选择不同搜索算法寻找解决方案。可以使用深度优先搜索、广度优先搜索等经典搜索算法，也可以使用 A* 搜索、蒙特卡洛树搜索等启发式搜索算法。

2）思维图（Graph of Thoughts, GoT）

ToT与GoT结构差异：

ToT：每一步思考是单向分支，像一棵不断分叉的树，不同路径独立发展，无法回头或整合。
GoT：思考节点可以自由连接，形成网络。节点之间可以交叉、合并、循环修正。

GoT 在 ToT 基础上将树扩展为有向图，顶点代表问题解决方案，有向边代表构造过程。其核心优势在于思维自我反思和聚合，能集成不同路径的知识和信息，形成综合解决方案。

.

3.3.4 集思广益

集思广益模式强调的是通过汇集多种不同的观点和方法来优化决策过程。

集思广益模式借鉴集体智慧，通过探索多种解决方案选优，优化决策。基于此，Self-Consistency （自我一致性）方法在 CoT 基础上提出，通过引入多样推理路径并选最一致答案，提升模型推理准确性，且不依赖特定 CoT 形式，可与其他方法兼容。

Self-Consistency（自我一致性）实现步骤如下：

生成多样化推理路径：使用 CoT 或 Zero-Shot CoT 引导大语言模型生成一组多样化的推理路径。
收集并统计答案：针对每个推理内容，收集最终答案，并统计其在所有路径中的出现频率。
选择最一致答案：出现频率最高的答案作为最终答案。

.

其他参考：【大模型基础_毛玉仁】系列文章

声明：资源可能存在第三方来源，若有侵权请联系删除！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/36439.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

虚拟电商-延迟任务系统的微服务改造（二）

虚拟电商-延迟任务系统的微服务改造（二）

一、微服务注册中心Consul 编写完延迟任务系统的web层接口，也就是说可以基于http协议来访问延迟系统，接下来要将延迟任务改造成一个服务。首要考虑的问题就是服务的注册与发现，服务的注册与发现都离不开服务的注册中心，本项目选取…

阅读更多...

场景题：如何设计一个抢红包随机算法

场景题：如何设计一个抢红包随机算法

面试官：咱来写个算法题吧设计一个抢红包的随机算法，比如一个人在群里发了100块钱的红包，群里有10个人一起来抢红包，每人抢到的金额随机分配。 1.所有人抢到的金额之和要等于红包金额，不能多也不能少。 2.每个人至少抢…

阅读更多...

Java开发经验——Throwable/Exception异常处理方式

Java开发经验——Throwable/Exception异常处理方式

摘要文章主要探讨了 Java 开发中 Throwable 和 Exception 的异常处理方式。阿里巴巴 Java 开发手册规定，RPC 调用、二方包、动态代理类等场景推荐使用 Throwable，因为这些场景可能会出现类似 NoClassDefFoundError 这样的严重错误，使用 Thr…

阅读更多...

[Mysql]创建数据库基础

[Mysql]创建数据库基础

数据库意义更加利于管理的东西-数据库，他能有效的管理数据举例一个生活化的案例说明如果说，图书馆是保存书籍的，那么数据库技术保存数据的数据库的简单原理图 Mysql数据库三层结构与本质数据库管理系统与 mysqld：MySQL 数…

阅读更多...

AMBA-CHI协议详解（二十五）

AMBA-CHI协议详解（二十五）

AMBA-CHI协议详解（一）- Introduction AMBA-CHI协议详解（二）- Channel fields / Read transactions AMBA-CHI协议详解（三）- Write transactions AMBA-CHI协议详解（四）- Other transac…

阅读更多...

【RabbitMQ】RabbitMQ的基本架构是什么？包括哪些核心组件？

【RabbitMQ】RabbitMQ的基本架构是什么？包括哪些核心组件？

RabbitMQ基于AMQP协议实现，由多个核心组件组成，确保消息的可靠传递。 Rabbit的架构图： 1.RabbitMQ的基本架构： 1.核心组件： 1.Producer(生产者)： 发送消息到RabbitMQ。 2.Exchange(交换机)：接…

阅读更多...

【PCB工艺】基础：电子元器件

【PCB工艺】基础：电子元器件

电子原理图（Schematic Diagram）是电路设计的基础，理解电子元器件和集成电路（IC）的作用，是画好原理图的关键。本专栏将系统讲解电子元器件分类、常见 IC、电路设计技巧，帮助你快速掌握电子电路…

阅读更多...

Html label标签中的for属性（关联表单控件：将标签与特定的表单元素（如输入框、复选框等）关联起来；提高可用性；无障碍性）

Html label标签中的for属性（关联表单控件：将标签与特定的表单元素（如输入框、复选框等）关联起来；提高可用性；无障碍性）

文章目录示例代码for属性含义完整代码示例示例代码 <div class"form-group"> <label for"province">省份名称：</label> <input…

阅读更多...

S32K144外设实验（二）：ADC单通道单次采样（软件触发）

S32K144外设实验（二）：ADC单通道单次采样（软件触发）

文章目录 1. 概述1.1 理论回顾1.1.1 时钟系统1.1.2 采样通道1.2 实验目的2. 配置与代码编写1. 概述 1.1 理论回顾 S32K144的ADC应该说是特别灵活，笔者采用循序渐进的方式来学习使用这个很重要的外设。在《入门笔记系列》专栏中对用户手册进行了翻译和解读，这里在回顾一下A…

阅读更多...

进程控制~

进程控制~

一.进程控制 1.进程创建我们可以通过./cmd来运行我们的程序，而我们运行的程序就是bash进程常见的子进程。当然我们也可以通过fork()系统调用来创建进程。 NAME fork - create a child process SYNOPSIS #include <unistd.h> pid_t fork(void…

阅读更多...

经历过的IDEA+Maven+JDK一些困惑

经历过的IDEA+Maven+JDK一些困惑

注意事项：由于使用过程中是IDEA绑定好另外2个工具，所以报错统一都显示在控制台，但要思考和分辨到底是IDEA本身问题导致的报错，还是maven导致的标准配置 maven Java Compiler Structure 编辑期定义：指的是从open pr…

阅读更多...

将bin文件烧录到STM32

将bin文件烧录到STM32

将bin文件烧录到STM32 CoFlash下载生成hex文件hex2bin使用下载bin到单片机 CoFlash下载选择需要安装的目录在Config中可以选择目标芯片的类型我演示的是 stm32f103c8t6 最小系统板 Adapter：烧录器类型 Max Clock：下载速度 Por：接口类型&am…

阅读更多...

硬件基础（5）：（2）二极管分类

硬件基础（5）：（2）二极管分类

文章目录 📌 二极管的分类与详细介绍1. **整流二极管（Rectifier Diode）**特点：选型依据：补充说明： 2. **快恢复二极管（Fast Recovery Diode）**特点：选型依据：…

阅读更多...

【MySQL】MySQL如何存储元数据？

【MySQL】MySQL如何存储元数据？

目录 1.数据字典的作用 2. MySQL 8.0 之前的数据字典 3. MySQL 8.0 及之后的数据字典 4.MySQL 8 中的事务数据字典的特征 5.数据字典的序列化 6. .sdi文件的作用： 7..sdi的存储方式在 MySQL 中，元数据（Metadata） 是描述数…

阅读更多...

瑞萨RA系列使用JLink RTT Viewer输出调试信息

瑞萨RA系列使用JLink RTT Viewer输出调试信息

引言还在用UART调试程序么？试试JLINK的RTT Viewer吧！不需占用UART端口、低资源暂用、实时性高延时微秒级，这么好的工具还有什么理由不用了！目录一、JLink RTT Viewer 简介二、软件安装三、工程应用 3.1 SEGGER_RTT驱动包 3.2 手搓宏定义APP_PRINT 3.3 使用APP_…

阅读更多...

Ranger 鉴权

Ranger 鉴权

Apache Ranger 是一个用来在 Hadoop 平台上进行监控，启用服务，以及全方位数据安全访问管理的安全框架。使用 ranger 后，会通过在 Ranger 侧配置权限代替在 Doris 中执行 Grant 语句授权。 Ranger 的安装和配置见下文：安装和配置 …

阅读更多...

LabVIEW烟气速度场实时监测

LabVIEW烟气速度场实时监测

本项目针对燃煤电站烟气流速实时监测需求，探讨了静电传感器结构与速度场超分辨率重建方法，结合LabVIEW多板卡同步采集与实时处理技术，开发出一个高效的烟气速度场实时监测系统。该系统能够在高温、高尘的复杂工况下稳定运行，提供高…

阅读更多...

【系统架构设计师】操作系统 - 特殊操作系统 ③ ( 微内核操作系统 | 单体内核操作系统 | 内核态 | 用户态 | 单体内核与微内核对比 )

【系统架构设计师】操作系统 - 特殊操作系统 ③ ( 微内核操作系统 | 单体内核操作系统 | 内核态 | 用户态 | 单体内核与微内核对比 )

文章目录一、微内核操作系统1、单体内核操作系统2、微内核操作系统引入3、微内核操作系统概念4、微内核操作系统案例二、单体内核与微内核对比1、功能对比2、单体内核优缺点3、微内核优缺点一、微内核操作系统 1、单体内核操作系统单体内核操作系统工作状态 : …

阅读更多...

人工智能之数学基础：线性方程组

人工智能之数学基础：线性方程组

本文重点线性方程组是由两个或两个以上的线性方程组成的方程组，其中每个方程都是关于两个或两个以上未知数的线性方程。记忆恢复我们先从小学学习的线性方程组找到感觉解答过程：将第二个方程乘以2，得到： 2x−2y=2 将第一个方程减去新得到的方程，消去x： (2x+y)−…

阅读更多...

第十一届传感云和边缘计算系统国际会议

第十一届传感云和边缘计算系统国际会议

重要信息时间地点：2025年4月18-20日中国-珠海会议官网：www.scecs.org 简介第十一届传感云和边缘计算系统 (SCECS 2025）将于2025年4月18-20日在中国珠海召开。将围绕“传感云”、“边缘计算系统”的最新研究领域，为来自国…

阅读更多...

最新文章

推荐文章