【AI视野·今日Robot 机器人论文速览 第六十九期】Wed, 3 Jan 2024

AI视野·今日CS.Robotics 机器人学论文速览
Wed, 3 Jan 2024
Totally 5 papers
👉上期速览✈更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

NID-SLAM: Neural Implicit Representation-based RGB-D SLAM in dynamic environments
Authors Ziheng Xu, Jianwei Niu, Qingfeng Li, Tao Ren, Chen Chen
人们已经探索了神经隐式表示来增强视觉 SLAM 算法,特别是在提供高保真度密集地图方面。现有方法在静态场景中运行稳健,但难以应对移动物体造成的干扰。在本文中,我们提出了 NID SLAM,它显着提高了神经 SLAM 在动态环境中的性能。我们提出了一种新方法来增强语义掩模中的不准确区域,特别是在边缘区域。利用深度图像中存在的几何信息,该方法能够准确去除动态物体,从而降低相机漂移的可能性。此外,我们引入了动态场景的关键帧选择策略,该策略增强了摄像机对大型物体的跟踪鲁棒性,并提高了建图效率。

Symbolic Manipulation Planning with Discovered Object and Relational Predicates
Authors Alper Ahmetoglu, Erhan Oztop, Emre Ugur
从机器人对其环境的无监督探索和持续的感觉运动经验中发现可用于长期规划的符号和规则是一项具有挑战性的任务。先前的研究提出从单个或成对的对象交互中学习符号并利用这些符号进行规划。在这项工作中,我们提出了一个系统,该系统使用发现的对象和关系符号来学习规则,这些符号对任意数量的对象及其之间的关系进行编码,将这些规则转换为规划领域描述语言 PDDL ,并生成涉及任意数量的可供性的计划实现任务的对象。我们使用不同尺寸的盒状物体验证了我们的系统,并表明该系统可以开发拾取、携带和放置操作的符号知识,同时考虑到不同配置的对象组合,例如盒子将与更大的盒子一起携带放置它们的盒子。

PLE-SLAM: A Visual-Inertial SLAM Based on Point-Line Features and Efficient IMU Initialization
Authors Jiaming He, Mingrui Li, Yangyang Wang, Hongyu Wang
视觉惯性SLAM在AR VR、无人机、工业机器人、自动驾驶等各个领域都至关重要。相机和惯性测量单元IMU的融合可以弥补信号传感器的缺点,从而显着提高在挑战性环境下定位的准确性和鲁棒性。鲁棒的跟踪和准确的惯性参数估计是系统稳定运行的基础。本文介绍了 PLE SLAM,一种基于点线特征和高效 IMU 初始化的完全精确、实时的视觉惯性 SLAM 算法。首先,我们介绍基于点的视觉惯性 SLAM 系统中的线特征。我们使用并行计算方法来提取特征并计算描述符以确保实时性能。其次,所提出的系统通过旋转预积分和点线观测来估计陀螺仪偏差。加速度计偏差和重力方向通过解析方法求解。初始化后,所有惯性参数通过最大后验 MAP 估计进行细化。此外,我们开放了动态特征消除线程来提高对动态环境的适应性,并使用CNN、词袋和GNN来检测循环和匹配特征。基于 DNN 的匹配方法具有出色的宽基线匹配能力和光照鲁棒性,显着提高了循环检测召回率和循环帧间姿态估计。前端和后端都是为硬件加速而设计的。

GenH2R: Learning Generalizable Human-to-Robot Handover via Scalable Simulation, Demonstration, and Imitation
Authors Zifan Wang, Junyu Chen, Ziqing Chen, Pengwei Xie, Rui Chen, Li Yi
本文提出了 GenH2R,一个用于学习基于通用视觉的人机 H2R 切换技能的框架。目标是让机器人能够可靠地接收人类在各种复杂轨迹中移交的具有看不见的几何形状的物体。我们通过使用包括程序模拟资产创建、自动演示生成和有效模仿学习的综合解决方案大规模学习 H2R 切换来获得这种通用性。我们利用大规模 3D 模型库、灵巧的抓取生成方法和基于曲线的 3D 动画创建了名为 simabbns 的 H2R 切换仿真环境,比现有模拟器中的场景数量超出了三个数量级。我们进一步介绍了一种蒸馏友好的演示生成方法,可以自动生成一百万个适合学习的高质量演示。最后,我们提出了一种通过未来预测目标增强的 4D 模仿学习方法,将演示提炼为视觉运动切换策略。模拟器和现实世界中的实验评估表明,在所有情况下,成功率比基线至少提高了 10 倍。

Fast and Continual Learning for Hybrid Control Policies using Generalized Benders Decomposition
Authors Xuan Lin
具有连续变量和离散变量的混合模型预测控制广泛适用于机器人控制任务,特别是涉及与环境接触的任务。由于组合复杂性,混合 MPC 的求解速度对于实时应用来说可能不够。在本文中,我们提出了一种基于广义 Benders 分解 GBD 的混合 MPC 求解器。该算法在线枚举并存储有限缓冲区内的切割平面。经过短暂的冷启动阶段后,存储的切割为新问题实例提供热启动,以提高解决速度。尽管存在干扰和随机变化的环境,求解速度仍保持不变。利用可行性割断的稀疏性,我们还提出了一种解决 Benders 主问题的快速算法。我们的求解器通过控制具有随机移动的软接触壁的车杆系统和绕障碍物导航的自由飞行机器人进行了验证。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/236496.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGLM3:打造更智能、更安全的代码解释器和工具使用体验

ChatGLM3 是由智谱AI训练的第三代大型语言模型,它不仅能理解和生成人类语言,还能执行代码、调用工具,并以 markdown 格式进行响应。为了提高用户体验,同时避免用户输入的注入攻击,ChatGLM3 采用了全新的对话格式。下载…

Unity 踩坑记录 AnyState 切换动画执行两次

AnySate 切换动画 Can Transition To Self 将这个勾选去掉!!!

rime中州韵小狼毫 生字注音滤镜 汉字注音滤镜

在中文环境下,多音字是比较常见的现象。对于一些不常见的生僻字,或者一些用于地名,人名中的常见字的冷门读音,如果不能正确的阅读,例如把 荥阳 读成了 miāo yng,则会怡笑大方。 今天我们在rime中州韵小狼…

【复现】DiffTalk

code:GitHub - sstzal/DiffTalk: [CVPR2023] The implementation for "DiffTalk: Crafting Diffusion Models for Generalized Audio-Driven Portraits Animation" 问题1. ERROR: Failed building wheel for pysptk Cython.Compiler.Errors.CompileError:…

Prompt提示工程上手指南:基础原理及实践(一)

想象一下,你在装饰房间。你可以选择一套标准的家具,这是快捷且方便的方式,但可能无法完全符合你的个人风格或需求。另一方面,你也可以选择定制家具,选择特定的颜色、材料和设计,以确保每件家具都符合你的喜…

J3-DenseNet实战

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 | 接辅导、项目定制 目录 环境步骤环境设置数据准备图像信息查看 模型构建模型训练模型效果展示 总结与心得体会 环境 系统: Linux语言: Python3.8.10深度学习…

API设计:从基础到优秀实践

在这次深入探讨中,我们将深入了解API设计,从基础知识开始,逐步进阶到定义出色API的最佳实践。 作为开发者,你可能对许多这些概念很熟悉,但我将提供详细的解释,以加深你的理解。 API设计:电子商…

tp5+微信公众号服务器配置时使用官方sdk还是token验证失败

tp5微信公众号服务器配置时使用官方sdk还是token验证失败,使用之前项目的源码也是校验token不存在 检查常见问题 1、php文件编码问题 使用IDEA查看是否为UTF-8编码 2、检查微信后台Token(令牌)前后是否有空格 3、检查微信后台Token与服务器后台Token是否一致 …

web3d-three.js场景设计器-sprite广告牌

three.js使用Sprite精灵实现文字或者图片广告牌1.将文字绘制到Canvas,调整对应宽高。2.作为Cavans材质绑定到Sprite3.加载到场景调整适当的scale function createLabel({ text, fontSize, textColor, color, imageUrl }) { return new Promise((resolve, reject) &…

Hive 数据同步

一、需求 同步集团的数据到断直连环境。 二、思路 三、同步数据(方案) 1、环境:断直连模拟环境 2、操作机器:ETL 机器 XX.14.36.216 3、工作路径:cd /usr/local/fqlhadoop/hadoop/bin 4、执行命令: 命令…

Javaweb之SpringBootWeb案例查询部门以及前后端联调的详细解析

2.1 查询部门 2.1.1 原型和需求 查询的部门的信息:部门ID、部门名称、修改时间 通过页面原型以及需求描述,我们可以看到,部门查询,是不需要考虑分页操作的。 2.1.2 接口文档 部门列表查询 基本信息 请求路径:/depts …

Poi实现根据word模板导出-图表篇

往期系列传送门: Poi实现根据word模板导出-文本段落篇 (需要完整代码的直接看最后位置!!!) 前言: 补充Word中图表的知识: 每个图表在word中都有一个内置的Excel,用于…

网络通信过程的一些基础问题

客户端A在和服务器进行TCP/IP通信时,发送和接收数据使用的是同一个端口吗? 这个问题可以这样来思考:在客户端A与服务器B建立连接时,A需要指定一个端口a向服务器发送数据。当服务器接收到A的报文时,从报文头部解析出A的…

报错curl: (6) Could not resolve host: raw.githubusercontent...的解决办法

我起初想要在macOS系统安装pip包,首先在终端安装homebrew,敲了命令:/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent...)" 之后触发的报错,报错内容:curl: (6) Could not resolve host: raw.…

Asp .Net Core 系列: 集成 CORS跨域配置

文章目录 什么是CORS?Asp .Net Core 中如何配置CORS?CorsPolicyBuilder类详解注册以及使用策略三种方式EnableCors 和 DisableCors 特性关于带证书与不带证书代码的实现跨源(cross-origin)不带请求证书(Credentials)跨源(cross-origin&…

【论文阅读】Self-supervised Learning: Generative or Contrastive

Abstract 研究了在计算机视觉、自然语言处理和图形学习中用于表示的新的自监督学习方法。全面回顾了现有的实证方法,并根据其目的将其归纳为三大类:生成性、对比性和生成性对比(对抗性)。进一步收集了关于自我监督学习的相关理论…

Mac 安装Nginx教程

Nginx官网 Nginx官网英文 1.在终端输入brew search nginx 命令检查nginx是否安装了 2. 安装命令:brew install nginx 3. 查看Nginx信息命令brew info nginx 4. 启动 nginx方式:在终端里输入 nginx 5.查看 nginx 是否启动成功 在浏览器中访问http://l…

经典算法-模拟退火算法求解旅行商问题TSP

经典算法-模拟退火算法求解旅行商问题TSP 旅行商问题(Traveling Salesman Problem, TSP)是组合优化中的经典问题。简单地说,一个旅行商需要访问N个城市,并返回到出发城市,问题是找到最短的可能路线,使得每…

PPT插件-布局参考-增加便携尺寸功能

PPT自带的尺寸为很久的尺寸,很多尺寸不常用,这里增加一些画册尺寸,用于PPT排版设计。 软件介绍 PPT大珩助手是一款全新设计的Office PPT插件,它是一款功能强大且实用的PPT辅助工具,支持Wps Word和Office Word&#x…

B059-权限管理系统01

目录 知识点介绍项目演示项目搭建动态菜单查询分析(权限表分析)权限系统表分析角色模块pageInfopageHelper实现前端动态分页高级查询新增与修改删除角色 分配权限-表分析角色授权数据-一级和二级权限查询 知识点介绍 项目演示 准备数据库 准备工程auth_new tips:…