吴恩达:AI 智能体工作流

热门文章推荐

  • (1)《为什么很多人工作 3 年 却只有 1 年经验?》
  • (2)《一文掌握大模型提示词技巧:从战略到战术巧》
  • (3)《AI 时代,程序员的出路在何方?》
  • (4)《如何写出高质量的文章:从战略到战术》
  • (5)《我的技术学习方法论》
  • (6)《我的性能方法论》
  • (7)《AI 时代的学习方式: 和文档对话》

省流版:
在这里插入图片描述

一、背景

吴恩达近日做了题为《What’s next for AI agentic workflows ft》的非常有价值的分享。

1.1 Agent 工作流

分享中指出不用 Agent 工作流时通过一次对话得到答案,效果往往不是很好。通过智能体工作流进行步骤拆分不断迭代,效果会更好。

在这里插入图片描述

代码基准测试中 GPT 3.5 准确率为 48% ,而 GPT-4 的准确率是 67%。但是加入智能体工作流的方式,GPT 3.5 甚至可以比单纯使用 GPT-4 的表现更好。
在这里插入图片描述

1.2 四种设计模式

在分享中他提出 AI 智能体的四种设计模式。
在这里插入图片描述

反思(Reflection): LLM 检查自己的工作,以提出改进方法。

使用工具(Tool use):LLM 拥有网络搜索、代码执行或任何其他功能来帮助其收集信息、采取行动或处理数据。

规划(Planning):LLM 提出并执行一个多步骤计划来实现目标。

多智能体协作(Multi-agent collaboration):多个 AI 智能体一起工作,分配任务并讨论和辩论想法,提出比单个智能体更好的解决方案。

在这里插入图片描述

1. 反射(Reflection)

  • 定义:反射模式允许 AI 代理自我审视其产出,评估正确性、效率和构造质量。通过这种方式,AI 能够识别并修正自身产出中的错误,从而提高最终产物的质量。
    在这里插入图片描述

在这里插入图片描述

  • 相关论文

    • 《Self-Refine: Iterative Refinement with Self-Feedback》
    • 《Reflexion: Language Agents with Verbal Reinforcement Learning》
  • 应用实例:一个典型的应用是代码编写。AI 首先生成代码,然后再次审视这段代码,检查是否有逻辑错误或可以优化的地方,并据此进行修改。这种自我修正的过程可能循环进行多次,直到代码达到预期的标准。

2. 多工具使用(Tool Use)

  • 定义:这种模式指的是AI代理能够利用多种工具和资源来完成任务,例如进行网络搜索、调用其他软件接口等。这扩展了AI的能力,使其不仅限于单一任务或领域。
    在这里插入图片描述

  • 相关论文

    • 《Gorilla: Large Language Model Connected with Massive APIs》
    • 《MM-REACT: Prompting ChatGPT for Multimodal Reasoning and Action》
  • 应用实例:在处理需要外部信息或特定领域工具的任务时,AI 代理可以先识别出所需的工具或信息源,然后获取并应用这些资源来完成任务。比如,生成一段代码前,先通过网络搜索相关的算法或逻辑。

3. 计划算法(Planning)

  • 定义:计划算法使AI代理能够设计一系列有序的步骤来解决复杂问题,这通常涉及到前瞻性思维和策略规划。
    在这里插入图片描述

  • 相关论文

    • 《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》
    • 《HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face》
  • 应用实例:AI 代理可以根据给定的目标自动规划出实现路径,比如在开发一个新项目时,AI能够规划出研究、设计、编码、测试等一系列步骤,并自动执行这一计划,甚至在遇到问题时重新规划以绕过障碍。

4. 多 Agent 合作(Multi-agent Collaboration)

  • 定义:这种模式涉及到多个 AI 代理相互协作,每个代理可能负责不同的任务或扮演不同的角色,通过协作来解决问题或完成任务。
    在这里插入图片描述

图中引用的是 :ChatDev 的例子。

  • 相关论文

    • 《Communicative Agents for Software Development》
    • 《AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation》
  • 应用实例:在软件开发的场景中,一个 AI 代理可能扮演项目经理的角色,负责规划项目和分配任务,另一个 AI 代理扮演开发者角色,负责编写代码,还有的 AI 代理可能专注于测试和代码审查。这些代理通过相互协作,能够自动完成一个软件开发项目。

每种设计模式都体现了AI代理工作流在提高任务处理效率、增强问题解决能力方面的潜力,预示着AI技术在复杂任务处理和自动化方面的未来发展方向。

二、对未来的预测与挑战

吴教授预测,智能体工作流将在未来几年内极大扩展 AI 的能力边界。

在这里插入图片描述

他强调了快速的 token 生成的重要性,认为这将支持更有效的迭代和改进过程。同时,他提到了对于即时反馈期望的调整,指出在使用AI智能体工作流时,我们需要学会耐心等待。

三、我的一些思考

3.1 关于计划模式

对于计划模式虽然 Agent 能够比较容易识别“错误”,但有些并不是错误而是和目标偏离的情况不容易被发现,导致最终执行的结果不符合预期。对于这种任务,应该在执行之前进行详细的规划和确认,就像软件工程师在写代码之前就需要先做技术方案并评审一样。在执行过程中也要在关键的环节进行检查和确认,避免到最后环节才发现问题返工重做。

在这里插入图片描述

就像在执行过程中关键环节的检查和确认一样,你在旅途中可能设立几个检查点来确认是否还在正确的路线上,装备是否齐全,和队伍是否完好。如果你等到到达露营地后才发现忘记带帐篷或食物,那么整个露营计划可能都要泡汤,就像在项目的最后阶段才发现问题,需要返工重做一样,不仅耽误时间还可能增加成本。

3.2 关于多 Agent 合作模式

对于多 Agent 合作模式:理论上分工明确各司其职,就可以做好。但应该有一个 Agent 能够把控全局或者后续 Agent 不仅要干好自己的活还应该了解做事的背景和价值,以便更好地做事情。对于多代 Agent 合作模式,一个非常重要的点是在开始前最好需求的对齐,避免产出不符合预期的软件浪费很多计算资源。

在这里插入图片描述

3.3 关于产品形态

现在的 AI 平台还没有跟上这些设计模式,如让同一个平台的多个 Agent 之间,甚至不同平台的 Agent 之间可以非常好地交流协作。现在的很多 AI 平台并没有解决这些设计模式中的一些问题,如自动计划算法,如何在任务执行中间进行检查,避免有一个步骤走偏后面越来越离谱。

四、总结

Agent 工作流让大语言模型发挥出更大价值。文中提出的四种设计模式对 Agent 发展提供了非常重要的指导,值得继续探索。当然,四种设计模式落地过程中还存在诸多问题,需要警惕和克服。当前的产品形态还不能非常好地支撑这些模式,还还很长的路要走。

实战技巧参见:《用扣子/Coze 揭秘吴恩达的4种 AI Agent 设计模式》


参考资料:

  • 《What’s next for AI agentic workflows ft》
  • https://www.deeplearning.ai/the-batch/issue-242/
  • 《【人工智能】AI智能体工作流 | Agentic Reasoning | 吴恩达Andrew Ng | 红杉AI Ascent 2024分享 | Agent 4大设计模式》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/299684.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue2(完结):replace属性、编程式路由导航、缓存路由组件、两个新钩子、路由守卫、history与hash

一、router-link的replace属性 1、作用:控制路由跳转时操作浏览器历史记录的模式 2、浏览器的历史记录有两种写入方式:分别为push和replace,push是追加历史记录,replace是替换当前记录。路由跳转时候默认为push 3、如何开启repla…

EXCEL地理数据处理工具(地图任务)

版本号 作者 修订内容 发布日期 1.0 小O 更新至0705版 2022-4-28 1.1 小O 更新至0772版 2024年4月3日 一、概述 小O地图EXCEL插件版提供基于EXCEL表格进行地理数据处理、地图可视化、地图绘图等功能,地理工具是用户使用频率很高的功能模块。地理工具能…

C语言交换两个变量值的方法,详细讲解

不管在学习哪门语言,都会遇到交换两个变量的这种问题,而且在面试测试题中也经常提到。既然出现的频率这么高,那我们今天就来讲讲交换两个变量常用的几种方法。 今天主要是基于C语言写的代码,不管哪种语言写的,应该核心…

Linux下Qt生成程序崩溃文件

文章目录 1.背景2.Qt编译生成程序2.1.profile模式的本质 3.执行程序,得到core文件4.代码定位4.1.直接使用gdb4.2.使用QtCreator 5.总结6.题外话6.1.profile模式和debug模式的区别 1.背景 在使用Qt时,假如在windows,当软件崩溃时,…

石油化工控制台定制厂家具备的专业条件一览

石油化工行业,作为国家的支柱产业之一,对设备与控制台的要求尤为严格。石油化工控制台是石油化工行业必不可少的办公设备之一。因此,选择一家专业的石油化工控制台定制厂家,对于提升企业的生产效率与安全水平具有不可估量的价值&a…

CTF之矛盾

这一题就是php的弱比较“” 这里要求输入的不是数字,并且输入要为1才打印flag 那我们就输入一个1后面接随便什么字符,因为php的弱比较将字符与数字进行比较的时候,会把字符转换成数字再比较,当转换到字符时后面便都为空了 flag{…

ChatGLM-6B实战微调(P-tuning-v2、LORA)

硬件准备 GPU: NVIDIA Tesla A30 24GB python 3.10 pytorch 1.11 transformers 4.27.1 实验环境 Change your pip source pip config set global.extra-index-url https://pypi.tuna.tsinghua.edu.cn/simple # Writing to /opt/conda/pip.conf pip config set global.inde…

C/C++预处理过程

目录 前言: 1. 预定义符号 2. #define定义常量 3. #define定义宏 4. 带有副作用的宏参数 5. 宏替换的规则 6. 宏和函数的对比 7. #和## 8. 命名约定 9. #undef 10. 命令行定义 11. 条件编译 12. 头文件的包含 13. 其他预处理指令 总结&#x…

【御控物联】JavaScript JSON结构转换(15):对象To数组——转换映射方式

文章目录 一、JSON结构转换是什么?二、术语解释三、案例之《JSON对象 To JSON数组》四、代码实现五、在线转换工具六、技术资料 一、JSON结构转换是什么? JSON结构转换指的是将一个JSON对象或JSON数组按照一定规则进行重组、筛选、映射或转换&#xff0…

2024年03月CCF-GESP编程能力等级认证Scratch图形化编程二级真题解析

本文收录于专栏《Scratch等级认证CCF-GESP真题解析》,专栏总目录・点这里. 一、单选题(共 10 题,每题 3 分,共 30 分) 第1题 小杨的父母最近刚刚给他买了一块华为手表,他说手表上跑的是鸿蒙,这个鸿蒙是?( )。 A、小程序 B、计时器 C、操作系统 D、神话人物 答案:…

【vite】-【vite介绍】-【vite的基础应用】-【vite的高级应用】-【

目录 vite介绍vite的基础应用vite创建项目vite创建vue3项目vite创建vue2项目vite创建react项目 vite中使用css的各种功能vite中使用tsvite中处理静态资源的方法vite集成eslint和prettiervite中的env环境变量 vite的高级应用 vite介绍 一、特点: 开发时效率极高开箱…

Excel常用技巧

个人笔记(整理不易,有帮助点个赞) 笔记目录:学习笔记目录_pytest和unittest、airtest_weixin_42717928的博客-CSDN博客 个人随笔:工作总结随笔_8、以前工作中都接触过哪些类型的测试文档-CSDN博客 目录 一&#xff1a…

UE4几个常用节点链接

UE4几个常用节点链接 2017-12-02 12:54 1. 流光材质(及uv平铺次数) 2. 跑九宫格 3.闪光3。1 粒子闪烁效果 4.图案重复5.平移扭曲 6.溶解 刀光的uv滚动图片源或采样节点属性里改成clamp无后期发光光晕anistropic 各向异性高光法线图 法线图叠加 blendangle orrectedNo…

ThingsBoard通过MQTT发送属性数据

MQTT基础 客户端 MQTT连接 属性上传API 案例 MQTT基础 MQTT是一种轻量级的发布-订阅消息传递协议,它可能最适合各种物联网设备。 你可以在此处找到有关MQTT的更多信息,ThingsBoard服务器支持QoS级别0(最多一次)和QoS级别1&…

Python爬取公众号封面图(零基础也能看懂)

📚博客主页:knighthood2001 ✨公众号:认知up吧 (目前正在带领大家一起提升认知,感兴趣可以来围观一下) 🎃知识星球:【认知up吧|成长|副业】介绍 ❤️感谢大家点赞👍&…

【Web应用技术基础】JavaScript(4)——案例:全选/取消全选按钮

视频已发。截图如下&#xff1a; 1.点击全选按钮&#xff0c;则选中所有选项 2.只要某个选项取消&#xff0c;则自动取消全选按钮的勾选状态 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"vie…

Pytorch数据结构:GPU加速

文章目录 一、GPU加速1. 检查GPU可用性&#xff1a;2. GPU不可用需要具体查看问题3. 指定设备4.将张量和模型转移到GPU5.执行计算&#xff1a;6.将结果转移回CPU 二、转移原理1. 数据和模型的存储2. 数据传输3. 计算执行4. 设备管理5.小结 三、to方法的参数类型 一、GPU加速 .…

华为CCE部署RabbitMQ中间件操作文档

1、创建有状态&#xff08;StatefulSet&#xff09;部署 中间件一般为有状态部署&#xff0c;有状态部署与无状态部署区别参考文档&#xff1a;K8S有无状态部署-CSDN博客 1.1、基本信息 注意&#xff1a; 应用名称命名规则&#xff1a;&#xff08;命名规则最好统一&#xff…

C++高频面试知识总结 part2

C高频面试 1.sizeof是什么&#xff1f;sizeof一个class大小怎么确定&#xff1f;是在编译期还是在运行期确定?2.函数重载的机制&#xff0c;重载是在编译期还是在运行期确定&#xff0c;重载有额外开销吗3.函数重写在编译还是运行时确定&#xff1f;4.如何找到虚函数表&#x…

图解大型网站多级缓存的分层架构

前言 缓存技术存在于应用场景的方方面面。从浏览器请求&#xff0c;到反向代理服务器&#xff0c;从进程内缓存到分布式缓存&#xff0c;其中缓存策略算法也是层出不穷。 假设一个网站&#xff0c;需要提高性能&#xff0c;缓存可以放在浏览器&#xff0c;可以放在反向代理服…