第8章 CoT及ReAct解密与实战
8.5 ReAct及计划和执行案例实战
我们来看一下LangChain的官方文档,首先它很简单的说了一下,计划和执行代理(Plan and execute agents)首先计划要做什么,然后执行子任务来实现目标,言外之意ReAct不是这样的,我们在ReAct中看见的内容是,有一步具体的步骤,然后执行一个行动,然后再有一步具体的步骤,然后再执行一个具体的行动。在计划和执行代理中,计划和执行这两者确实配合在一起,但它把计划和执行解耦合了,先给一个链条,然后基于这个链条,再执行具体的子任务,读者可以看一下论文:“Plan-and-Solve Prompting: Improving Zero-Shot Chain-of-Thought Reasoning by Large Language Models”。
如图8-6所示,是一个具体的例子,这是最直接的方式。
图8- 6计划和执行代理示例
上图对零样本思维链(Zero-shot-CoT)方式和计划和解决(Plan and Solve)方式进行了对比。零样本思维链方式,使用大模型以“让我们一步一步地思考”的方式进行多步推理,但当问题比较复杂时,仍然可能产生错误的推理步骤。与零样本思维链方式不同,计划和解决方式首先要求大模型设计一个解决问题的计划,通过生成一个循序渐进的步骤计划,并执行该计划来找到答案。
零样本思维链(Zero-shot-CoT)方式的示例