【具身智能评估1】具身视觉语言规划(EVLP)仿真环境汇总

参考论文:Core Challenges in Embodied Vision-Language Planning
论文作者:Jonathan Francis, Nariaki Kitamura, Felix Labelle, Xiaopeng Lu, Ingrid Navarro, Jean Oh
论文原文:https://arxiv.org/abs/2106.13948
论文出处:Journal of Artificial Intelligence Research 74 (2022) 459-515
论文被引:27(11/18/2023)

论文中的工作截止到2021年,在此基础上补充了近几年具身智能领域相关的仿真环境。
在这里插入图片描述

术语对齐

Embodied Vision Language Planning (EVLP):具身视觉语言规划
在这里插入图片描述

具身智能仿真环境

解决 EVLP 任务通常需要使用仿真环境和数据集。仿真平台和数据集有助于复现和评估具身智能系统。模拟器旨在复制现实世界的方方面面,并模拟能够解决复杂任务的智能体(agent),同时抽象出设计和监督现实世界智能体的所面临的挑战。相比之下,数据集在阐明每项任务的框架方面起着至关重要的作用。数据集提供了智能体在应对特定多模态刺激时的行为示例。

早期的具身研究模拟平台通常利用视频游戏环境来创建和训练神经控制器。由于简化的环境通常缺乏真实世界环境的多样性和复杂性,人类的表现很快就在其中一些平台上实现了。最近的研究通过使用逼真的照片和使用交互式情境(智能体能够修改环境中物体的状态)来解决这种缺乏真实感的问题。为此,人们也在开发从模拟到现实的迁移和评估为重点的框架,以便研究真实环境与模拟环境之间的差异。
在这里插入图片描述
在这里插入图片描述

VLN Simulators

Matterport3DSim

Matterport3D Dataset:

论文标题:Matterport3D: Learning from RGB-D Data in Indoor Environments
论文作者:Angel Chang, Angela Dai, Thomas Funkhouser, Maciej Halber, Matthias Nießner, Manolis Savva, Shuran Song, Andy Zeng, Yinda Zhang
论文原文:https://arxiv.org/abs/1709.06158
论文出处:3DV 2017
论文被引:1449(11/18/2023)
论文代码:https://github.com/niessner/Matterport,834 star
项目主页:https://niessner.github.io/Matterport/

Matterport3D Simulator:

论文标题:Vision-and-Language Navigation: Interpreting visually-grounded navigation instructions in real environments
论文作者:Peter Anderson, Qi Wu, Damien Teney, Jake Bruce, Mark Johnson, Niko Sünderhauf, Ian Reid, Stephen Gould, Anton van den Hengel
论文原文:https://arxiv.org/abs/1711.07280
论文出处:CVPR 2018
论文被引:1089(11/18/2023)
论文代码:https://github.com/peteanderson80/Matterport3DSimulator
项目主页:–

Habitat

Habitat 1.0

论文标题:Habitat: A Platform for Embodied AI Research
论文作者:Manolis Savva, Abhishek Kadian, Oleksandr Maksymets, Yili Zhao, Erik Wijmans, Bhavana Jain, Julian Straub, Jia Liu, Vladlen Koltun, Jitendra Malik, Devi Parikh, Dhruv Batra
论文原文:https://arxiv.org/abs/1904.01201
论文出处:ICCV 2019
论文被引:1043(11/18/2023)
论文代码:https://github.com/facebookresearch/habitat-sim,2k star
项目主页:https://aihabitat.org/

Habitat 2.0

论文标题:Habitat 2.0: Training Home Assistants to Rearrange their Habitat
论文作者:Andrew Szot, Alex Clegg, Eric Undersander, Erik Wijmans, Yili Zhao, John Turner, Noah Maestre, Mustafa Mukadam, Devendra Chaplot, Oleksandr Maksymets, Aaron Gokaslan, Vladimir Vondrus, Sameer Dharur, Franziska Meier, Wojciech Galuba, Angel Chang, Zsolt Kira, Vladlen Koltun, Jitendra Malik, Manolis Savva, Dhruv Batra
论文原文:https://arxiv.org/abs/2106.14405
论文出处:NeurIPS 2021 Spotlight
论文被引:279(11/18/2023)
论文代码:https://github.com/facebookresearch/habitat-lab,1.5k star
项目主页:https://aihabitat.org/

Habitat 3.0

论文标题:Habitat 3.0: A Co-Habitat for Humans, Avatars and Robots
论文作者:Xavier Puig, Eric Undersander, Andrew Szot, Mikael Dallaire Cote, Tsung-Yen Yang, Ruslan Partsey, Ruta Desai, Alexander William Clegg, Michal Hlavac, So Yeon Min, Vladimír Vondruš, Theophile Gervet, Vincent-Pierre Berges, John M. Turner, Oleksandr Maksymets, Zsolt Kira, Mrinal Kalakrishnan, Jitendra Malik, Devendra Singh Chaplot, Unnat Jain, Dhruv Batra, Akshara Rai, Roozbeh Mottaghi
论文原文:https://arxiv.org/abs/2310.13724
论文出处:arXiv
论文被引:2(11/18/2023)
论文代码:https://github.com/facebookresearch/habitat-lab/tree/v0.3.0,1.5 k
项目主页:https://aihabitat.org/habitat3/

StreetLearn

论文标题:Learning to Navigate in Cities Without a Map
论文作者:Piotr Mirowski, Matthew Koichi Grimes, Mateusz Malinowski, Karl Moritz Hermann, Keith Anderson, Denis Teplyashin, Karen Simonyan, Koray Kavukcuoglu, Andrew Zisserman, Raia Hadsell
论文原文:https://arxiv.org/abs/1804.00168
论文出处:NeurIPS 2018
论文被引:293(11/18/2023)
论文代码:https://github.com/google-deepmind/streetlearn,271 star
项目主页:https://sites.google.com/view/streetlearn/

VDN Simulator

Matterport3DSim

EQA Simulators

House3D

论文标题:Building Generalizable Agents with a Realistic and Rich 3D Environment
论文作者:Yi Wu, Yuxin Wu, Georgia Gkioxari, Yuandong Tian
论文原文:https://arxiv.org/abs/1801.02209
论文出处:ICLR 2018
论文被引:232(11/18/2023)
论文代码:https://github.com/facebookresearch/House3D
项目主页:–

AI2-THOR

论文标题:AI2-THOR: An Interactive 3D Environment for Visual AI
论文作者:Eric Kolve, Roozbeh Mottaghi, Winson Han, Eli VanderBilt, Luca Weihs, Alvaro Herrasti, Matt Deitke, Kiana Ehsani, Daniel Gordon, Yuke Zhu, Aniruddha Kembhavi, Abhinav Gupta, Ali Farhadi
论文原文:https://arxiv.org/abs/1712.05474
论文出处:arXiv 1712
论文被引:662(11/18/2023)
论文代码:https://github.com/allenai/ai2thor,914 star
项目主页:https://ai2thor.allenai.org/

MINOS

论文标题:MINOS: Multimodal Indoor Simulator for Navigation in Complex Environments
论文作者:Manolis Savva, Angel X. Chang, Alexey Dosovitskiy, Thomas Funkhouser, Vladlen Koltun
论文原文:https://arxiv.org/abs/1712.03931
论文出处:arXiv 1712
论文被引:128(11/18/2023)
论文代码:https://github.com/minosworld/minos,199 star
项目主页:https://minosworld.github.io/

EOR Simulators

REVERIE

论文标题:REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments
论文作者:Yuankai Qi, Qi Wu, Peter Anderson, Xin Wang, William Yang Wang, Chunhua Shen, Anton van den Hengel
论文原文:https://arxiv.org/abs/1904.10151
论文出处:CVPR 2020
论文被引:204(11/18/2023)
论文代码:https://github.com/YuankaiQi/REVERIE,94 star
项目主页:–

EGM Simulators

ALFRED

论文标题:ALFRED: A Benchmark for Interpreting Grounded Instructions for Everyday Tasks
论文作者:Mohit Shridhar, Jesse Thomason, Daniel Gordon, Yonatan Bisk, Winson Han, Roozbeh Mottaghi, Luke Zettlemoyer, Dieter Fox
论文原文:https://arxiv.org/abs/1912.01734
论文出处:CVPR 2020
论文被引:489(11/18/2023)
论文代码:https://github.com/askforalfred/alfred,288 star
项目主页:https://askforalfred.com/

ArraMon

论文标题:ArraMon: A Joint Navigation-Assembly Instruction Interpretation Task in Dynamic Environments
论文作者:Hyounghun Kim, Abhay Zala, Graham Burri, Hao Tan, Mohit Bansal
论文原文:https://arxiv.org/abs/2011.07660
论文出处:EMNLP Findings 2020
论文被引:13(11/18/2023)
论文代码:https://github.com/hyounghk/ArraMon,4 star
项目主页:https://arramonunc.github.io/

CerealBar

论文标题:Executing Instructions in Situated Collaborative Interactions
论文作者:Alane Suhr, Claudia Yan, Charlotte Schluger, Stanley Yu, Hadi Khader, Marwa Mouallem, Iris Zhang, Yoav Artzi
论文原文:https://arxiv.org/abs/1910.03655
论文出处:EMNLP 2019 long paper
论文被引:68(11/18/2023)
论文代码:https://github.com/lil-lab/cerealbar,26 star
项目主页:https://lil.nlp.cornell.edu/cerealbar/

Other Simulator

iGibson

论文标题:Interactive Gibson Benchmark (iGibson 0.5): A Benchmark for Interactive Navigation in Cluttered Environments
论文作者:Fei Xia, William B. Shen, Chengshu Li, Priya Kasimbeg, Micael Tchapmi, Alexander Toshev, Li Fei-Fei, Roberto Martín-Martín, Silvio Savarese
论文原文:https://arxiv.org/abs/1910.14442
论文出处:RAL 2020
论文被引:181(11/18/2023)
论文代码:https://github.com/StanfordVL/iGibson,581 star
项目主页:https://sites.google.com/view/interactivegibsonenv

iGibson 1.0

论文标题:iGibson 1.0: a Simulation Environment for Interactive Tasks in Large Realistic Scenes
论文作者:Bokui Shen, Fei Xia, Chengshu Li, Roberto Martín-Martín, Linxi Fan, Guanzhi Wang, Claudia Pérez-D’Arpino, Shyamal Buch, Sanjana Srivastava, Lyne P. Tchapmi, Micael E. Tchapmi, Kent Vainio, Josiah Wong, Li Fei-Fei, Silvio Savarese
论文原文:https://arxiv.org/abs/2012.02924
论文出处:IROS 2021
论文被引:100(11/18/2023)
论文代码:https://github.com/StanfordVL/iGibson,581 star
项目主页:https://svl.stanford.edu/igibson/

iGibson 2.0

论文标题:iGibson 2.0: Object-Centric Simulation for Robot Learning of Everyday Household Tasks
论文作者:Chengshu Li, Fei Xia, Roberto Martín-Martín, Michael Lingelbach, Sanjana Srivastava, Bokui Shen, Kent Vainio, Cem Gokmen, Gokul Dharan, Tanish Jain, Andrey Kurenkov, C. Karen Liu, Hyowon Gweon, Jiajun Wu, Li Fei-Fei, Silvio Savarese
论文原文:https://arxiv.org/abs/2108.03272
论文出处:CoRL 2021
论文被引:105(11/18/2023)
论文代码:https://github.com/StanfordVL/iGibson,581 star
项目主页:https://svl.stanford.edu/igibson/

SoundSpaces

论文标题:SoundSpaces: Audio-Visual Navigation in 3D Environments
论文作者:Changan Chen, Unnat Jain, Carl Schissler, Sebastia Vicenc Amengual Gari, Ziad Al-Halah, Vamsi Krishna Ithapu, Philip Robinson, Kristen Grauman
论文原文:https://arxiv.org/abs/1912.11474
论文出处: ECCV 2020
论文被引:203(11/18/2023)
论文代码:https://github.com/facebookresearch/sound-spaces,281 star
项目主页:https://vision.cs.utexas.edu/projects/audio_visual_navigation/

VirtualHome

论文标题:VirtualHome: Simulating Household Activities via Programs
论文作者:Xavier Puig, Kevin Ra, Marko Boben, Jiaman Li, Tingwu Wang, Sanja Fidler, Antonio Torralba
论文原文:https://arxiv.org/abs/1806.07011
论文出处:CVPR 2018 Oral
论文被引:314(11/18/2023)
论文代码:https://github.com/xavierpuigf/virtualhome,323 star
项目主页:http://virtual-home.org/

SAPIEN

论文标题:SAPIEN: A SimulAted Part-based Interactive ENvironment
论文作者:Fanbo Xiang, Yuzhe Qin, Kaichun Mo, Yikuan Xia, Hao Zhu, Fangchen Liu, Minghua Liu, Hanxiao Jiang, Yifu Yuan, He Wang, Li Yi, Angel X. Chang, Leonidas J. Guibas, Hao Su
论文原文:https://arxiv.org/abs/2003.08515
论文出处:CVPR 2020
论文被引:286(11/18/2023)
论文代码:https://github.com/haosulab/SAPIEN,266 star
项目主页:–

ThreeDWorld ※

论文标题:ThreeDWorld: A Platform for Interactive Multi-Modal Physical Simulation
论文作者:Chuang Gan, Jeremy Schwartz, Seth Alter, Damian Mrowca, Martin Schrimpf, James Traer, Julian De Freitas, Jonas Kubilius, Abhishek Bhandwaldar, Nick Haber, Megumi Sano, Kuno Kim, Elias Wang, Michael Lingelbach, Aidan Curtis, Kevin Feigelis, Daniel M. Bear, Dan Gutfreund, David Cox, Antonio Torralba, James J. DiCarlo, Joshua B. Tenenbaum, Josh H. McDermott, Daniel L.K. Yamins
论文原文:https://arxiv.org/abs/2007.04954
论文出处:NeurIPS 2021
论文被引:186(11/18/2023)
论文代码:https://github.com/threedworld-mit/tdw,426 star
项目主页:https://www.threedworld.org/

PyBullet

项目主页:https://pybullet.org/wordpress/

Github:https://github.com/bulletphysics/bullet3,11.3k star

MuJoCo

论文标题:MuJoCo: A physics engine for model-based control
论文作者:Emanuel Todorov; Tom Erez; Yuval Tassa
论文原文:https://ieeexplore.ieee.org/document/6386109
论文出处:2012 IEEE/RSJ International Conference on Intelligent Robots and Systems
论文被引:4752(11/18/2023)
论文代码:https://github.com/google-deepmind/mujoco,6.5k star
项目主页:https://mujoco.org/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/196181.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#学习相关系列之Linq常用方法---排序(一)

一、构建数据 public class Student_1{public int ID { get; set; }public string Name { get; set; }public int Chinese { get; set; }public int Math { get; set; }public int English { get; set; }public override string ToString(){return string.Format("ID:{0},…

企业视频数字人有哪些应用场景

来做个数字人吧,帮我干点活吧。 国内的一些数字人: 腾讯智影 腾讯智影数字人是一种基于人工智能技术的数字人物形象,具有逼真的外观、语音和行为表现,可以应用于各种场景,如新闻播报、文娱推介、营销、教育等。 幻…

医院数字化LIS(检验信息系统)源码

临床检验信息管理系统(LIS)是利用计算机连接医疗设备,通过计算机信息处理技术,将医院检验科或实验室的临床检验数据进行自动收集、存储、处理、提取、传输和交换,满足所有授权用户的功能需求。 一、系统概述 1.LIS&am…

性能测试【第三篇】Jmeter的使用

线程数:10 ,设置10个并发 Ramp-Up时间(秒):所有线程在多少时间内启动,如果设置5,那么每秒启动2个线程 循环次数:请求的重复次数,如果勾选"永远"将一直发送请求 持续时间时间:设置场景运行的时间 启动延迟:设置场景延迟启动时间 响应断言 响应断言模式匹配规则 包括…

Qt QLable 字符过长省略

前言: 项目中常用到字符过长问题,Qt默认的省略并不好用,不是自己想要的; QFontMetri 可使用 QFontMetri 当text的像素宽度超过width,将返回字符串的一个省略版本取决于mode。否则将返回原字符串; mode…

解决STM32F429烧录程序后还需复位才能植入程序的bug

1.打开魔术棒,打开debug 2.打开setting 3.打开Flas Download 4.开启Reset and Run 5.点进去Pack选项页面,去掉enable

postgresql:记录表膨胀引起的io问题的处理

文章目录 1. io异常2.查看profile报告2.1 生成事发时间段的pgprofile2.2 查看报告 3.检查table是否膨胀4.执行vacuum full5.总结 1. io异常 iostat -x 1 20 Device r/s w/s rkB/s wkB/s rrqm/s wrqm/s %rrqm %wrqm r_await w_await aqu-sz rareq…

【数据结构】直接插入排序

👦个人主页:Weraphael ✍🏻作者简介:目前正在学习c和算法 ✈️专栏:数据结构 🐋 希望大家多多支持,咱一起进步!😁 如果文章有啥瑕疵 希望大佬指点一二 如果文章对你有帮助…

基于人工电场算法优化概率神经网络PNN的分类预测 - 附代码

基于人工电场算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于人工电场算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于人工电场优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要:针对PNN神…

Stable Diffusion进阶玩法说明

之前章节介绍了Stable Diffusion的入门,介绍了文生图的魅力,可以生成很多漂亮的照片,非常棒 传送门: Stable Diffusion新手村-我们一起完成AI绘画-CSDN博客 那我们今天就进一步讲讲这个Stable Diffusion还能做些什么, …

C语言青蛙爬井(ZZULIOJ1072:青蛙爬井)

题目描述 有一口深度为high米的水井,井底有一只青蛙,它每天白天能够沿井壁向上爬up米,夜里则顺井壁向下滑down米,若青蛙从某个早晨开始向外爬,对于任意指定的high、up和down值(均为自然数)&…

电脑软件:推荐一款非常实用的固态硬盘优化工具

目录 一、软件简介 二、工作原理 三、功能介绍 3.1、优化SSD设置 3.2、查看驱动器信息 3.3、查看SMART数据 3.4、停用Windows事件日志记录 3.5、禁用Windows碎片整理 3.6、时间戳停用 3.7、禁用引导文件的碎片整理 3.8、关闭短名称 四、使用教程 4.1 安装说明 4.…

滚雪球学Java(09-3):Java中的逻辑运算符,你真的掌握了吗?

咦咦咦,各位小可爱,我是你们的好伙伴——bug菌,今天又来给大家普及Java SE相关知识点了,别躲起来啊,听我讲干货还不快点赞,赞多了我就有动力讲得更嗨啦!所以呀,养成先点赞后阅读的好…

【算法训练营】参数解析+跳石板

🌈欢迎来到Python专栏 🙋🏾‍♀️作者介绍:前PLA队员 目前是一名普通本科大三的软件工程专业学生 🌏IP坐标:湖北武汉 🍉 目前技术栈:C/C、Linux系统编程、计算机网络、数据结构、Mys…

机器学习的逻辑回归

Sigmoid函数 逻辑回归的预测函数 梯度下降法-逻辑回归 import matplotlib.pyplot as plt import numpy as np # 生成一个关于分类器性能的详细报告。 # 这个报告包含了每个类别的精度、召回率、F1分数,以及所有类别的平均精度、召回率和F1分数 from sklearn.metri…

Python爬虫动态ip代理防止被封的方法

目录 前言 一、什么是动态IP代理? 二、如何获取代理IP? 1. 付费代理IP 2. 免费代理IP 3. 自建代理IP池 三、如何使用代理IP爬取数据? 1. 使用requests库设置代理IP 2. 使用urllib库设置代理IP 3. 使用selenium库设置代理IP 四、常…

【AI视野·今日Robot 机器人论文速览 第六十二期】Wed, 25 Oct 2023

AI视野今日CS.Robotics 机器人学论文速览 Wed, 25 Oct 2023 Totally 25 papers 👉上期速览✈更多精彩请移步主页 Daily Robotics Papers EquivAct: SIM(3)-Equivariant Visuomotor Policies beyond Rigid Object Manipulation Authors Jingyun Yang, Congyue Deng,…

stable diffusion到底是如何工作的

stable diffusion简单入门 stable diffusion是一个文生图模型,主要由CompVis、Stability AI和LAION的研究者们创建。这个模型主要是在512X512分辨率的图像上训练的,训练数据集是LAION-5B,该数据集是目前可访问的最大的多模态数据集。 在这篇…

LoRa模块空中唤醒功能原理和物联网应用

LoRa模块是一种广泛应用于物联网领域的无线通信模块,支持低功耗、远距离和低成本的无线通信。 其空中唤醒功能是一项重要的应用,可以实现设备的自动唤醒,从而在没有人工干预的情况下实现设备的远程监控和控制。 LoRa模块空中唤醒功能的原理…

Win10关机设置里没有睡眠选项的解决方法

用户想给自己的Win10电脑设置睡眠模式,但是在关机设置里面找不到睡眠选项,导致自己不能顺利完成睡眠模式的设置。接下来小编给大家带来解决Win10关机设置里没有睡眠选项的简单方法,解决后用户就可以看到Win10电脑关机设置中有睡眠选项了。 Wi…