【强化学习 137】PCGrad - 知乎
多任务学习(multi task):任务权重、loss均衡、梯度下降那点事 - 知乎
ICLR 2020 rejected submission:Yu T, Kumar S, Gupta A, et al. Gradient surgery for multi-task learning[J]. arXiv preprint arXiv:2001.06782, 2020.
multi-task RL 里面面临比较麻烦的优化问题,因为各个任务之间是很不相似的,会相互影响。本文从梯度冲突的角度,解决 multi-task 中的优化问题。