《Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents?
描述、解释、计划和选择:使用大型语言模型进行交互式规划,实现开放世界的多任务代理
问题背景:
此论文研究了在开放世界环境中,
为多任务具身智能体进行任务规划的挑战。
两个困难:
- 长时任务的多步推理:在开放世界环境(如Minecraft)中执行计划需要准确的多步推理。
- 计划效率和可行性:传统的规划器在复杂计划中对并行子目标进行排序时,没有考虑到智能体当前完成特定子任务的难易程度,导致计划可能效率低下或不可行。
可行方案:
为了解决上述问题,作者提出了一种基于大型语言模型(LLMs)的交互式规划方法,名为**"Describe, Explain, Plan and Select"(DEPS)**。
DEPS 方法拆解:
- 描述(Describe):在执行计划的过程中提供描述,帮助智能体更好地理解和纠正初始的LLM生成的计划。
- 解释(Explain):在遇到失败时提供自我解释的反馈,以支持在扩展规划阶段进行更好的错误纠正。
- 规划(Plan):利用LLMs生成初始计划,并根据反馈和描述进行迭代改进。
- 选择(Select):引入一个可训练的目标选择器模块,根据估计的完成步骤对并行候选子目标进行排序,从而优化初始计划。
实验效果
- Minecraft 环境:DEPS 方法实现了第一个零样本多任务智能体,能够可靠地完成70多项Minecraft任务,并将整体性能提高了近一倍。
- 其他领域:在非开放域(如ALFWorld和桌面操作)中也表现出了普遍的有效性。
- 消融研究和探索性研究:详细说明了设计如何优于其他方法,并使用该方法对ObtainDiamond 大挑战提供了有希望的更新。
结论
DEPS 方法通过结合大型语言模型的强大生成能力和交互式规划的灵活性,为多任务具身智能体在开放世界环境中的任务规划提供了一种有效的解决方案。
---
原文链接:[2302.01560] Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents
Github开源链接:https://github.com/CraftJarvis/MC-Planner
---
Gloria:
2025年初已通过反思和复盘机制,实现基于LLM的chatBot有长思考能力,通过反馈机制进行纠正自己,而不仅是因为“文字接龙”机制而将错就错。