在多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)领域,价值分解(Value Decomposition)方法通过将全局价值函数分解为各个智能体的局部价值函数,从而有效地解决了多智能体协作问题。下面简要地讲解四种典型的价值分解算法:VDN(Value Decomposition Networks)、QMIX、FACMAC(Factorized Multi-Agent Centralized Critic)和VDA2C(Value Decomposition Advantage Actor-Critic)。
目录
- 价值分解方法概述
- VDN(Value Decomposition Networks)
- 2.1