发布人:Google 机器人团队高级研究员 Karol Hausman 和研究员 Yevgen Chebotar
通用机器人要想发挥最大的作用,就需要能够完成一系列的任务,如清洁、维护和运送。但是,使用离线强化学习 (RL)(智能体使用以前收集的数据开展训练,在试验和错误中学习的一种方法)来训练,即使是一个单一任务(例如抓取),也可能需要花费成千上万个机器人小时,此外还需要大量的工程来大规模实现机器人系统的自主操作。因此,随着任务数量的增加,使用目前的机器人学习方法来构建通用的日常机器人的计算费用高得变得令人望而却步。
-
离线强化学习
https://ai.googleblog.com/2020/08/tackling-open-challenges-in-offline.html
在多个机器人间收集多任务数据,不同的机器人会收集不同的任务数据
在其他大规模机器学习领域,如自然语言处理和计算机视觉,已经应用了一系列策略来分摊学习多种技能所需付出的努力。例如,对大型