图解LLM智能体(LLM Agents)：构建与运作机制的全面解析

图解LLM智能体(LLM Agents)：构建与运作机制的全面解析

news/2025/4/2 13:56:28/文章来源:https://blog.csdn.net/qq_36603091/article/details/146339390

LLM智能体：构建与运作机制

LLM智能体（LLM Agents）正在迅速普及，似乎逐渐取代了我们熟悉的传统对话式LLM。这些令人惊叹的能力并非凭空而来，而是需要多个组件协同工作。 LLM Agents架构
本文包含超过60张定制插图，将深入探讨LLM智能体的领域、其核心组件以及多智能体框架的工作原理。

文章目录

LLM智能体：构建与运作机制
- 什么是LLM智能体？
- - 智能体的定义
- 记忆
- - 短期记忆
  - 长期记忆
- 工具
- - Toolformer
  - 模型上下文协议（MCP）
- 规划
- - 推理
  - 推理与行动
  - 反思
  - 多智能体协作（Multi-Agent Collaboration）
  - 模拟人类行为的交互式代理
  - 模块化框架

什么是LLM智能体？

要理解LLM智能体是什么，首先我们需要了解LLM的基本能力。传统上，LLM的核心功能不过是“下一个词预测”。
Next-Token预测

通过连续采样多个词，我们可以模拟对话并让LLM生成更长的回答。

对话生成

然而，当我们继续“对话”时，任何LLM都会暴露出其主要缺点之一：它无法记住之前的对话！记忆缺失
此外，LLM在许多任务上表现不佳，例如基本的数学运算（乘法和除法）：数学运算失败
这是否意味着LLM很糟糕？绝对不是！LLM不需要全能，因为我们可以借助外部工具、记忆系统和检索机制来弥补其不足。

通过外部系统，LLM的能力可以得到增强。Anthropic将其称为“增强型LLM”。

例如，当面对数学问题时，LLM可以选择使用适当的工具（如计算器）。
使用计算器
那么，这种“增强型LLM”就是智能体吗？不完全是，但某种程度上是……

智能体的定义

智能体是可以被视为通过传感器感知环境并通过执行器作用于环境的任何事物。
——Russell & Norvig，《人工智能：现代方法》（2016）

智能体与环境交互，通常由以下几个重要组件组成：

环境——智能体交互的世界
传感器——用于观察环境
执行器——用于与环境交互的工具
效应器——决定如何从观察到行动的“大脑”或规则

智能体框架
该框架适用于各种与不同环境交互的智能体，例如与物理环境交互的机器人或与软件交互的AI智能体。

我们可以对该框架进行一些泛化，使其适合“增强型LLM”。
增强型LLM框架

通过“增强型LLM”，智能体可以通过文本输入（因为LLM通常是文本模型）观察环境，并通过工具（如网络搜索）执行某些操作。

为了选择采取哪些行动，LLM智能体有一个关键组件：规划能力。为此，LLM需要能够通过链式思维等方法进行“推理”和“思考”。

链式思维

通过这种推理行为，LLM智能体可以规划出必要的行动步骤。
规划行为

这种规划行为使智能体能够理解当前情境（LLM）、规划下一步（规划）、采取行动（工具）并跟踪已采取的行动（记忆）。

智能体循环

根据系统的不同，LLM智能体可以具备不同程度的自主性。
自主性等级

可以说，一个系统越“智能”，LLM就越能决定系统的行为方式。

在接下来的部分中，我们将通过LLM智能体的三个主要组件——记忆、工具和规划——探索各种自主行为的方法。

记忆

LLM是一种健忘的系统，或者更准确地说，在交互过程中不会进行任何记忆。

例如，当你向LLM提问后紧接着再问另一个问题时，它不会记住前者。短时记忆问题

我们通常将这种记忆称为短期记忆，也叫工作记忆，它充当即时上下文的缓冲区。这包括LLM智能体最近采取的行动。

然而，LLM智能体还需要记录可能数十个步骤，而不仅仅是最近的行动。长期记忆需求

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/35798.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

自动驾驶背后的数学：特征提取中的线性变换与非线性激活

自动驾驶背后的数学：特征提取中的线性变换与非线性激活

在上一篇博客「自动驾驶背后的数学：从传感器数据到控制指令的函数嵌套」—— 揭秘人工智能中的线性函数、ReLU 与复合函数中，我们初步探讨了自动驾驶技术中从传感器数据到控制指令的函数嵌套流程，其中提到了特征提取模块对传感器数据进行线性…

阅读更多...

W80x使用WM IoT SDK 2.X 开发（二）驱动tft屏幕

W80x使用WM IoT SDK 2.X 开发（二）驱动tft屏幕

一、硬件准备开发板依然是官方送的w803，屏幕我的是2.4寸的ST7789 二、查看sdk 1、例程 tft的有这4个程序，我这里直接看最简单的polling吧首先就是创建一个任务，这跟上一篇点亮led创建任务的步骤一样继续点进去 2、spi初始化先看初始…

阅读更多...

Linux系统编程(四)--进程概念

Linux系统编程(四)--进程概念

文章目录 1.基本概念与基本操作1.1 描述进程-PCB1.2 task_struct-PCB的一种1.3 task_struct内容分类1.4 查看进程1.5 通过系统调用获取进程的PID和PPID1.6 PPID（Parent Process ID）1.7 通过系统调⽤创建进程-fork初识fork创建子进程使用if进行分流 2.进程…

阅读更多...

从 0 到 1 掌握鸿蒙 AudioRenderer 音频渲染：我的自学笔记与踩坑实录（API 14）

从 0 到 1 掌握鸿蒙 AudioRenderer 音频渲染：我的自学笔记与踩坑实录（API 14）

最近我在研究 HarmonyOS 音频开发。在音视频领域，鸿蒙的 AudioKit 框架提供了 AVPlayer 和 AudioRenderer 两种方案。AVPlayer 适合快速实现播放功能，而 AudioRenderer 允许更底层的音频处理，适合定制化需求。本文将以一个开发者的自学视角&a…

阅读更多...

linux 命令 cd

linux 命令 cd

以下是 Linux 中 cd 命令的详细用法总结，涵盖基础操作、快捷方式和常见场景： 1. 命令功能 cd（Change Directory）用于切换当前工作目录，是 Linux 文件系统操作中最常用的命令之一。 2. 基本语法 cd [选项] [目录路径…

阅读更多...

安卓开发调用本地接口以及设置base_url思路

安卓开发调用本地接口以及设置base_url思路

去年接手pad端开发时曾问过其它组的老安卓一个问题，我们的安卓项目本地开发时能否调用本地接口，回答是否定的。也许是由于通用底座加入的限制，也许是因为太忙了，不想给我解释繁琐的解决方案。那么在个人PC上玩耍总是能够调用本地…

阅读更多...

中小型企业大数据平台全栈搭建：Hive+HDFS+YARN+Hue+ZooKeeper+MySQL+Sqoop+Azkaban 保姆级配置指南

中小型企业大数据平台全栈搭建：Hive+HDFS+YARN+Hue+ZooKeeper+MySQL+Sqoop+Azkaban 保姆级配置指南

目录背景‌一、环境规划与依赖准备‌1. 服务器规划（3节点集群）2. 系统与依赖‌3. Hadoop生态组件版本与下载路径4. 架构图二、Hadoop（HDFS+YARN）安装与配置‌1. 下载与解压（所有节点）2. HDFS高可用配置3. YARN资源配置‌4. 启动Hadoop集群三、MySQL安装与Hive元数据配置…

阅读更多...

003 SpringCloud整合-LogStash安装及ELK日志收集

003 SpringCloud整合-LogStash安装及ELK日志收集

SpringCloud整合-LogStash安装及ELK日志收集文章目录 SpringCloud整合-LogStash安装及ELK日志收集1.安装ElasticSearch和kibana2.Docker安装logstash1.拉取docker镜像2.创建外部挂载目录3.拷贝容器内部文件到宿主机4.修改外部挂载文件5.运行docker容器 3.整合kibana1.进入kiba…

阅读更多...

《TCP/IP网络编程》学习笔记 | Chapter 19：Windows 平台下线程的使用

《TCP/IP网络编程》学习笔记 | Chapter 19：Windows 平台下线程的使用

《TCP/IP网络编程》学习笔记 | Chapter 19：Windows 平台下线程的使用《TCP/IP网络编程》学习笔记 | Chapter 19：Windows 平台下线程的使用内核对象内核对象的定义内核对象归操作系统所有基于 Windows 的线程创建进程与线程的关系Windows 中线程的创建方…

阅读更多...

【Git学习笔记】Git分支管理策略及其结构原理分析

【Git学习笔记】Git分支管理策略及其结构原理分析

【Git学习笔记】Git分支管理策略及其结构原理分析 🔥个人主页：大白的编程日记 🔥专栏：Git学习笔记文章目录【Git学习笔记】Git分支管理策略及其结构原理分析前言一.合并冲突二. 分支管理策略2.1 分支策略2.2 bug分支2.3 删除临…

阅读更多...

STAR Decomposition 一种针对极端事件的信号分解方法论文精读加复现

STAR Decomposition 一种针对极端事件的信号分解方法论文精读加复现

STAR 分解🚀 在时序预测任务中，为了情绪化信号的各种成分，例如趋势信息季节信息等往往都需要对信号进行分解。目前熟知的分解方式有很多种，经验模态分解 EMD 变分模态分解 VMD ，还有集合经验模态分解 EEMD&#xff0c…

阅读更多...

大一新生备战蓝桥杯c/c++B组——2024年省赛真题解题+心得分享

大一新生备战蓝桥杯c/c++B组——2024年省赛真题解题+心得分享

一，握手问题这个题用点像小学奥数，直接手算就行答案：1204 二，小球反弹这个题思路简单，但是运行会显示超时。在思考思考，后续补代码。三，好数思路一： #include <iostream&…

阅读更多...

【最新版】智慧小区物业管理小程序源码+uniapp全开源

【最新版】智慧小区物业管理小程序源码+uniapp全开源

一.系统介绍智慧小区物业管理小程序，包含小区物业缴费、房产管理、在线报修、业主活动报名、在线商城等功能。为物业量身打造的智慧小区运营管理系统，贴合物业工作场景，轻松提高物业费用收缴率，更有功能模块个性化组合，助力物业节约成本高效运营。二.搭建环境系统环…

阅读更多...

OLE注册是什么？

OLE注册是什么？

在Windows操作系统的生态中，‌OLE（Object Linking and Embedding，对象链接与嵌入）‌ 是一项核心技术，它使得不同应用程序之间能够共享数据和功能。例如，用户可以在Word文档中嵌入一个Excel表格，…

阅读更多...

深入理解Linux文件系统：从磁盘结构到inode与挂载

深入理解Linux文件系统：从磁盘结构到inode与挂载

博客总结核心内容磁盘物理结构机械硬盘（HDD）与固态硬盘（SSD）的区别，磁盘的组成（盘片、磁头、磁道、扇区）及工作原理（磁头悬浮、高速旋转）。企业级磁盘与桌面级磁盘的…

阅读更多...

Spring Data JPA 参数陷阱：从 500 错误到完美解决的奇妙之旅 ✨

Spring Data JPA 参数陷阱：从 500 错误到完美解决的奇妙之旅 ✨

🚀 Spring Data JPA 参数陷阱：从 500 错误到完美解决的奇妙之旅 🌟 嘿，各位技术冒险家！👋 今天我要带你们走进一场 Spring Data JPA 的“参数迷雾”救援行动——从一个让人抓狂的 500 错误，到最…

阅读更多...

YOLO obb全流程

YOLO obb全流程

内容：xanylabeling 数据标注工具；pytorch（python）；yolo-obb 模型一、数据集 1、数据集工具xanylabeling的安装 （详细配置与使用方法参考：X-Anylabeling自动标注软件安装使用教程含conda环境…

阅读更多...

基于大语言模型与知识图谱的智能论文生成工具开发构想

基于大语言模型与知识图谱的智能论文生成工具开发构想

基于大语言模型与知识图谱的智能论文生成工具开发构想一、研究背景与意义 1.1 学术写作现状分析 #mermaid-svg-FNVHG5EiEgVSCpHK {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-FNVHG5EiEgVSCpHK .error-icon{fil…

阅读更多...

学c++的人可以几天速通python?

学c++的人可以几天速通python?

学了俩天啊，文章写纸上了还是蛮有趣的

阅读更多...

【计算机网络】一二章

【计算机网络】一二章

一二非常棒的例子相同的传播时延，带宽越大，该链路上所能容纳的比特数越多相同的传播时延，带宽越大，该链路上所能容纳的比特数越多往返时间（Round-Trip Time，RTT）s是指从发送端发送数据分组…

阅读更多...

最新文章

推荐文章