CoRL 2023 获奖论文公布,manipulation、强化学习等主题成热门

今年大模型及具身智能领域有了非常多的突破性进展,作为机器人学与机器学习交叉领域的全球顶级学术会议之一,CoRL也得到了更多的关注。

CoRL 是面向机器人学习的顶会,涵盖机器人学、机器学习和控制等多个主题,包括理论与应用。今年的CoRL 2023共有199 篇论文入选,热门主题包括控制、强化学习等。大会已经于上周11 月 6 日- 9 日在美国亚特兰大举行,在本次大会上,公布了最佳论文奖、最佳学生论文奖、最佳系统论文奖等奖项。

下面我们一起起来看看CoRL 2023的获奖论文详情:

PS:除了今年的获奖论文,我也整理了去年CoRL 2022的获奖论文,有想法发顶会的同学建议都看看哦。

需要的全部论文及源码同学看文末

CoRL 2023

最佳论文奖

Distilled Feature Fields Enable Few-Shot Language-Guided Manipulation

标题:蒸馏特征场实现少样本语言引导操作

作者:William Shen, Ge Yang, Alan Yu, Jensen Wong, Leslie Pack Kaelbling, Phillip Isola

内容:本研究通过利用蒸馏特征场,将准确的3D几何与2D基础模型中的丰富语义相结合,填补了机器人操作中2D到3D的空白。作者提出了一种用于6自由度抓取和放置的少样本学习方法,利用这些强大的空间和语义先验知识实现对未见过物体的野外泛化。通过从视觉语言模型CLIP中提取的特征,作者展示了一种通过自由文本自然语言指定新对象进行操作的方法,并证明了其能够泛化到未见过的表达和新类别的物体上。

最佳学生论文奖

Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners

标题:大型语言模型规划器的不确定性对齐

作者:Allen Z. Ren, Anushri Dixit, Alexandra Bodrova, Sumeet Singh, Stephen Tu, Noah Brown, Peng Xu, Leila Takayama, Fei Xia, Jake Varley, Zhenjia Xu, Dorsa Sadigh, Andy Zeng, Anirudha Majumdar

内容:本研究提出了一种名为KNOWNO的框架,用于测量和对齐基于大型语言模型(LLM)的规划器的不确定性。该框架可以帮助规划器在不知道时知道并请求帮助。KNOWNO建立在共形预测理论的基础上,提供任务完成的统计保证,同时最小化复杂多步规划设置中需要人类帮助的情况。实验结果表明,在涉及不同模态的模糊性的任务中,KNOWNO在提高效率和自主性方面优于现代基线方法(可能涉及集成或广泛的提示调整),并提供正式保证。

Predicting Object Interactions with Behavior Primitives: An Application in Stowing Tasks

标题:使用行为原语预测物体交互

作者:Haonan Chen, Yilong Niu, Kaiwen Hong, Shuijing Liu, Yixuan Wang, Yunzhu Li, Katherine Rose Driggs-Campbell

内容:本研究提出了一种使用行为原语从预测物体交互的预测模型和单个演示中学习泛化机器人装载策略的方法。作者提出了一种新的框架,利用图神经网络在行为原语参数空间内预测物体交互。进一步地,作者使用增强的原语轨迹优化来搜索预定义的异构行为原语库的参数以实例化控制动作。该框架使机器人能够通过几个关键帧(3-4)从单个演示中熟练地执行长期装载任务。

Language Embedded Radiance Fields for Zero-Shot Task-Oriented Grasping

标题:用于零样本面向任务抓取的语言嵌入辐射场

作者:Satvik Sharma, Adam Rashid, Chung Min Kim, Justin Kerr, Lawrence Yunliang Chen, Angjoo Kanazawa, Ken Goldberg

内容:本研究提出了一种新的语言嵌入辐射场用于面向任务的物体抓取的方法LERF-TOGO。该方法使用视觉语言模型,在给定自然语言查询的情况下,零样本输出一个物体的抓取分布。为了实现这一点,作者首先构建了一个场景的LERF,将CLIP嵌入到多尺度3D语言字段中,可使用文本进行查询。然而,LERF没有物体边界的感觉,因此其相关性输出通常返回对象上的不完整激活,这对于抓取是不够的。LERF-TOGO通过提取DINO特征的3D物体掩码来弥补这种缺乏空间分组的问题,然后在此掩码上条件性地查询LERF以获得物体上的一个语义分布,从而从现成的抓取规划器中对抓取进行排序。

最佳系统论文奖

RoboCook: Long-Horizon Elasto-Plastic Object Manipulation with Diverse Tools

标题:使用多种工具进行长期弹性-塑性物体操纵

作者:Haochen Shi, Huazhe Xu, Samuel Clarke, Yunzhu Li, Jiajun Wu

内容:本研究开发了一种名为RoboCook的智能机器人系统,能够感知、建模和操纵各种工具的弹塑性物体。RoboCook使用点云场景表示法,利用图神经网络(GNN)对工具-物体交互进行建模,并将工具分类与自监督策略学习相结合,制定操纵计划。作者展示了一个通用的机器人手臂可以从每个工具仅需20分钟的实际交互数据中学习复杂的长期软体物体操纵任务,如制作饺子和字母饼干。

MimicPlay: Long-Horizon Imitation Learning by Watching Human Play

标题:通过观察人类玩耍进行长期模仿学习

作者:Chen Wang, Linxi Fan, Jiankai Sun, Ruohan Zhang, Li Fei-Fei, Danfei Xu, Yuke Zhu, Anima Anandkumar

内容:本研究提出了一种分层学习框架MimicPlay,通过观察人类玩耍的视频序列来学习机器人的长期模仿技能。作者认为,即使形态不同,人类玩耍数据仍然包含丰富的物理交互信息,可以促进机器人策略学习。受此启发,MimicPlay从人类玩耍数据中学习潜在计划,以指导在少量远程操作演示上训练的低层次视觉运动控制。通过对14个现实世界中的长期操纵任务进行系统评估,作者发现MimicPlay在任务成功率、泛化能力和对干扰的鲁棒性方面优于最先进的模仿学习方法。

Robot Parkour Learning

标题:机器人跑酷学习

作者:Ziwen Zhuang, Zipeng Fu, Jianren Wang, Christopher G Atkeson, Sören Schwertfeger, Chelsea Finn, Hang Zhao

内容:本研究提出了一种用于学习多样化跑酷技能的端到端视觉跑酷策略的系统,该系统使用简单的奖励,而无需任何参考运动数据。作者开发了一种受直接定位启发的强化学习方法来生成跑酷技能,包括攀爬高障碍物、跃过大间隙、爬行低障碍物、挤过窄缝和奔跑等。作者将这些技能提炼为单一的视觉跑酷策略,并使用其自我中心的深度相机将其转移到四足机器人上。

CoRL 2022

最佳论文奖

Training Robots to Evaluate Robots: Example-Based Interactive Reward Functions for Policy Learning

用于策略学习的基于示例的交互式奖励函数

简述:本研究提出了一种名为“交互式奖励函数”(IRFs)的方法,用于训练机器人自动获取物理互动行为,以评估尝试执行的机器人技能的结果,从而提高任务执行的性能。

最佳论文入围名单

Learning Agile Skills via Adversarial Imitation of Rough Partial Demonstrations

通过对手的粗略部分演示进行对抗性模仿来学习敏捷技能

简述:本研究提出了一种生成对抗网络方法,用于从部分和可能物理不兼容的演示中推断奖励函数,以成功获取技能。

Supercharging Imitation with Regularized Optimal Transport

用正则化最优传输加强模仿

简述:本研究提出了一种新的模仿学习算法——正则化最优传输(ROT),该算法结合了轨迹匹配奖励和行为克隆,可以显著加速模仿学习,并在多个视觉控制任务上表现出色。

最佳系统论文奖

Legged Locomotion in Challenging Terrains using Egocentric Vision

基于自我中心视觉的挑战性地形中的腿部运动

简述:本研究提出了一种全新的端到端移动系统,能够跨越多种地形,并在小型四足机器人上实现实时运行。该系统使用单个前置深度相机进行自我中心视觉,并通过强化学习和有监督学习训练了策略。

特别创新奖

Do As I Can, Not As I Say: Grounding Language in Robotic Affordances

基于机器人可供性的语言

简述:本研究提出了一种通过预训练技能提供真实世界基础的方法,以约束语言模型提出既可行又适合上下文的自然语言行动。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“CoRL”领取获奖论文+代码合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/190133.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

USB拦截工具

USB 闪存驱动器对组织的安全和数据构成了独特的威胁。它们的便携性和充足的存储容量使它们成为数据盗窃的便捷媒介。 什么是 USB 拦截器 USB(通用串行总线)阻止程序用于禁用插入可移动存储设备的端口,便携性和充足的存储容量使 USB 成为可能…

一文了解芯片测试项目和检测方法 -纳米软件

芯片检测是芯片设计、生产、制造成过程中的关键环节,检测芯片的质量、性能、功能等,以满足设计要求和市场需求,确保芯片可以长期稳定运行。芯片测试内容众多,检测方法多样,今天纳米软件将为您介绍芯片的检测项目都有哪…

电脑小Tip---外接键盘F1-F12快捷键与笔记本不同步

当笔记本外接一款非常好用的静音键盘后,会出现一些问题。例如:外接键盘F1-F12与笔记本不同步。具体一个例子就是,在运行matlab程序时,需要点编辑器—运行,这样就很麻烦,直接运行的快捷键是笔记本键盘上的F5…

macOS文本编辑器 BBEdit 最新 for mac

BBEdit是一款功能强大的文本编辑器,适用于Mac操作系统。它由Bare Bones Software开发,旨在为开发者和写作人员提供专业级的文本编辑工具。 以下是BBEdit的一些主要特点和功能: 多语言支持:BBEdit支持多种编程语言和标记语言&…

[WSL] 安装hive3.1.2成功后, 使用datagrip连接失败

org.apache.hadoop.ipc.RemoteException:User: xxx is not allowed to impersonate anonymous 下载driver-hive-jdbc-3.1.2-standalone 解决 修改hadoop 配置文件 etc/hadoop/core-site.xml,加入如下配置项 <property><name>hadoop.proxyuser.你的用户名.hosts…

机器学习算法实战实战案例代码详解

文章目录 1.问题建模数据预处理 结果分析数据探索特征工程特征选择模型融合 1.问题建模 导入库 import numpy as np import pandas as pd from sklearn.model_selection import KFold from sklearn.metrics import mean_squared_error from sklearn.preprocessing import One…

【Linux】八、进程通信

进程通信的介绍 目的 数据传输&#xff1a;一个进程将它的数据发送给另一个进程&#xff1b; 资源共享&#xff1a;多个进程间共享资源&#xff1b; 通知事件&#xff1a;一个进程向另一个或一组进程发送消息&#xff0c;同时事件如&#xff0c;进程终止时要通知父进程&#xf…

Django框架FAQ

文章目录 问题1:Django数据库恢复问题2:null和blank的区别3.报错 django.db.utils.IntegrityError: (1062, “Duplicate entry ‘‘ for key ‘mobile‘“)4.报错 Refused to display ‘url‘ in a frame because it set ‘X-Frame-Options‘ to deny5.报错 RuntimeError: cryp…

开放领域问答机器人1

开放领域问答机器人是一种智能机器人&#xff0c;它不受限制&#xff0c;可以回答任何问题。这种机器人主要通过自然语言处理技术来理解用户的问题&#xff0c;并从大量的数据中获取相关信息&#xff0c;以提供准确的答案。它的应用领域广泛&#xff0c;包括客户服务、教育、医…

如何使用软路由R4S+iStoreOS实现远程访问内网电脑桌面

软路由R4SiStoreOS实现公网远程桌面局域网内电脑 文章目录 软路由R4SiStoreOS实现公网远程桌面局域网内电脑简介一、配置远程桌面公网地址二、家中使用永久固定地址 访问公司电脑**具体操作方法是&#xff1a;** 简介 上篇教程我们介绍了如何在iStoreOS中安装Cpolar&#xff0…

《QT从基础到进阶·二十》QThreadPool线程池的使用

什么情况下比较适合用线程池&#xff1f; 比如我有上百个任务要同时处理&#xff0c;难道开上百个线程&#xff1f;NO&#xff01;&#xff01;&#xff01; 有了线程池的加持&#xff0c;自动给任务分配线程处理&#xff0c; 多线程不再是真爱~ 线程池创建&#xff1a; 1、自…

面试被问答3-5年职业规划,该怎么回答

面试官问这些问题的目的是什么&#xff1f;他想得到什么满意的答案。只要清楚这些&#xff0c;就不难回答这个问题。 1、你有没有上进心&#xff1f;公司是否值得培养呢&#xff1f; 你需要对专业能力充满向往&#xff0c;希望自己在3~5年内&#xff0c;把专业能力做好&#…

Ansible命令使用

ansible ansible的命令 ansible命令模块Pingcommand 模块shell 模块copy 模块file 模块fetch 模块cron 模块yum 模块service 模块user 模块group 模块script 模块setup 模块get_url模块stat模块unarchive模块unarchive模块 ansible的命令 /usr/bin/ansible  Ansibe AD-Hoc 临…

ultrascale+mpsoc系列的ZYNQ中DDR4参数设置说明

ultrascalempsoc系列的ZYNQ中DDR4参数设置说明 标题1 概述标题2 讲述平台标题3 ZYNQ的DDR设置界面参数标题4 DDR参数界面说明如下 标题1 概述 本文用于讲诉ultrascalempsoc系列中的ZYNQ的DDR4的参数设置与实际硬件中的DDR选型之间的关系&#xff0c;为FPGA设计人员探明道路。 …

移植LVGL到单片机的一个demo简单介绍

简介 背景&#xff1a; 本文使用的是主控IC为stm32f103zet6, 显示IC为ST7735s&#xff0c;它是128*160的像素&#xff0c;色深为RGB565颜色。 官方虽然说LVGL移植平台只需 64kB 闪存和 8kB RAM 就足以满足简单的用户界面。但我移植到stm32f103c8t6&#xff0c;不管怎么修改配…

Postman:如何对WebService接口进行测试

前言 由于工作所需,需要使用Postman测试工具&#xff0c;对基于ws规范的WebService接口进行测试。在经过多种尝试后&#xff0c;终于找到了正确的测试方法&#xff0c;下面我便详细记录测试步骤&#xff0c;以便以后再次测试时可以拿来主义。 第一步&#xff1a;确保WebServi…

使用matlab实现图像信号的色彩空间转换

利用matlab对图像信号进行读取&#xff0c;并对RGB空间进行转换&#xff0c;如转换到HSI空间等。 下面的这个代码是在使用了rgb2hsi()方法失败后&#xff0c;进行修改的。 rgb2hsi(img)这个方法可以将RGB图像转换为HIS图像&#xff1b;但是爆出了 Untitled5(line 5)hsi rgb2h…

SpringBoot 自动配置原理

SpringBoot 自动配置原理 注: 本文使用的springboot版本为 2.7.11 1、SpringBootApplication 字面分析&#xff0c;这个注解是标注一个Spring Boot应用。 Target({ElementType.TYPE}) Retention(RetentionPolicy.RUNTIME) Documented Inherited SpringBootConfiguration En…