【AI视野·今日Robot 机器人论文速览 第七十一期】Fri, 5 Jan 2024

AI视野·今日CS.Robotics 机器人学论文速览
Fri, 5 Jan 2024
Totally 11 papers
👉上期速览✈更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

Machine Learning in Robotic Ultrasound Imaging: Challenges and Perspectives
Authors Yuan Bi, Zhongliang Jiang, Felix Duelmer, Dianye Huang, Nassir Navab
本文回顾了智能机器人超声超声成像系统的最新进展。我们首先介绍机器人超声成像中常用的机器人机制和控制技术及其临床应用。随后,我们重点关注机器学习技术在机器人超声检查师开发中的部署,强调旨在增强这些系统智能的关键发展。实现自主行动推理的方法分为两类:依赖隐式环境数据解释的方法和使用显式解释的方法。在整个探索过程中,我们还讨论了实际挑战,包括与医疗数据稀缺性、深入了解所涉及的物理方面的需要以及有效的数据表示方法相关的挑战。

AERIAL-CORE: AI-Powered Aerial Robots for Inspection and Maintenance of Electrical Power Infrastructures
Authors Anibal Ollero, Alejandro Suarez, Christos Papaioannidis, Ioannis Pitas, Juan M. Marredo, Viet Duong, Emad Ebeid, Vit Kratky, Martin Saska, Chloe Hanoune, Amr Afifi, Antonio Franchi, Charalampos Vourtsis, Dario Floreano, Goran Vasiljevic, Stjepan Bogdan, Alvaro Caballero, Fabio Ruggiero, Vincenzo Lippiello, Carlos Matilla, Giovanni Cioffi, Davide Scaramuzza, Jose R. Martinez de Dios, Begona C. Arrue, Carlos Martin, Krzysztof Zurad, Carlos Gaitan, Jacob Rodriguez, Antonio Munoz, Antidio Viguria
大型基础设施很容易因老化、环境影响和大量使用而老化。通过定期检查和维护确保其安全对于防止严重影响公共安全和环境的事件至关重要。这在电力网络的背景下尤其重要,电力网络虽然对于能源供应至关重要,但也可能是森林火灾的根源。智能无人机有可能彻底改变检查和维护,消除人类操作员的风险,提高生产力,减少检查时间并提高数据收集质量。然而,目前空中机器人技术的大多数方法和技术主要是在室内试验台或严格控制条件下的室外环境中进行试验的,并且始终在人类操作员的视线范围内。此外,这些方法和技术通常是孤立评估的,缺乏全面的集成。本文介绍了第一个结合了各种创新空中机器人的自主系统。该系统专为超出视线范围的大范围检查而设计,具有用于维护任务的空中机械手,并包括用于在高处工作的操作员的支撑机制。

How Do Pedestrians' Perception Change toward Autonomous Vehicles during Unmarked Midblock Multilane Crossings: Role of AV Operation and Signal Indication
Authors Fengjiao Zou, Jennifer Harper Ogle, Patrick Gerard, Weimin Jin
阻碍行人广泛接受自动驾驶汽车的主要障碍之一是他们对自动驾驶汽车的理解有限。本研究采用虚拟现实 VR 为行人提供一个身临其境的环境,以便在无标记的中路多车道交叉口期间与自动驾驶汽车互动并理解自动驾驶汽车。对各种自动驾驶汽车驾驶行为进行建模,以显示带有黄色信号指示的谈判行为或带有蓝色信号指示的不让行行为。本文旨在研究自动驾驶汽车行为和信号、行人过去行为等各种因素对行人对自动驾驶汽车感知变化的影响。 VR 实验前后,参与者完成了评估他们对自动驾驶汽车看法的调查,重点关注态度和系统有效性两个主要方面。 Wilcoxon 签名排名测试结果表明,在 VR 实验之后,行人对自动驾驶汽车的整体态度评分和对自动驾驶系统有效性的信任度均显着提高。值得注意的是,对黄色信号表现出更大信任的个人更倾向于对自动驾驶汽车表现出更高的态度分数,并增强他们对自动驾驶系统有效性的信任。这表明黄色信号灯的设计让行人对与自动驾驶汽车的互动更有信心。此外,与那些具有更积极的过路行为的行人相比,表现出更积极的过路行为的行人不太可能改变对自动驾驶汽车的看法。

Enabling Digitalization in Modular Robotic Systems Integration
Authors Daniella Tola
将机器人系统集成到生产线中是一个耗时的过程。在数字化时代,新技术的研发对于改进集成流程至关重要。众多挑战,包括缺乏标准化以及复杂的利益相关者关系,使机器人系统集成的过程变得复杂。该过程通常包括机器人系统的获取、集成和部署。本论文重点关注有助于自动化和简化机器人系统集成的三个领域。在与采集相关的第一个领域,演示了基于约束的配置器,它解决了机器人设备之间的兼容性挑战,并使配置过程自动化。这降低了集成不兼容设备的风险,并减少了配置阶段对专家的需求。在与集成相关的第二个领域中,研究了可互操作的建模格式(统一机器人描述格式 URDF),并进行了详细分析,揭示了显着的不一致和关键的改进。这种格式广泛用于机器人的运动学建模和 3D 可视化,并且其模型可以跨仿真工具重复使用。改进这种格式使广泛的用户受益,包括机器人工程师、研究人员和学生。在与部署相关的第三个领域,探索了机器人系统的数字孪生DT,因为它们可以提高效率并减少停机时间。对 DT 进行了全面的文献综述,并开发了模块化机器人系统的案例研究。这项研究可以加速 DT 在机器人行业的采用。

Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation
Authors Zipeng Fu, Tony Z. Zhao, Chelsea Finn
从人类演示中进行的模仿学习在机器人技术中表现出了令人印象深刻的表现。然而,大多数结果都集中在桌面操作上,缺乏一般有用任务所需的移动性和灵活性。在这项工作中,我们开发了一种用于模仿需要全身控制的双手移动操作任务的系统。我们首先推出 Mobile ALOHA,这是一种用于数据收集的低成本全身远程操作系统。它通过移动底座和全身远程操作界面增强了 ALOHA 系统。然后,我们使用 Mobile ALOHA 收集的数据执行监督行为克隆,并发现与现有静态 ALOHA 数据集的协同训练可以提高移动操作任务的性能。每项任务进行 50 次演示,协同训练可将成功率提高多达 90 倍,使 Mobile ALOHA 能够自主完成复杂的移动操作任务,例如炒虾和上菜、打开两门壁柜存放沉重的烹饪锅、呼叫并进入电梯,并使用厨房水龙头轻轻冲洗用过的锅。

On Time-Indexing as Inductive Bias in Deep RL for Sequential Manipulation Tasks
Authors M. Nomaan Qureshi, Ben Eisner, David Held
在解决复杂的操纵任务时,操纵策略通常需要学习一组不同的技能来完成这些任务。这组技能通常是多模态的,每个技能可能具有截然不同的动作和状态分布。标准深度策略学习算法通常将策略建模为具有单个输出头确定性或随机性的深度神经网络。这种结构需要网络学习在内部模式之间切换,这可能导致样本效率较低和性能较差。在本文中,我们探索了一种简单的结构,有利于许多操作任务所需的技能学习。具体来说,我们提出了一种策略架构,可以在固定的时间内顺序执行不同的动作头,从而能够学习基本技能,例如伸手和抓握。

ODIN: A Single Model for 2D and 3D Perception
Authors Ayush Jain, Pushkal Katara, Nikolaos Gkanatsios, Adam W. Harley, Gabriel Sarch, Kriti Aggarwal, Vishrav Chaudhary, Katerina Fragkiadaki
ScanNet 等当代 3D 感知基准的最先进模型使用和标签数据集提供了 3D 点云,这些点云是通过感测的多视图 RGB D 图像的后处理获得的。它们通常在域中进行训练,放弃大规模 2D 预训练,并优于以 RGB D 多视图图像为特征的替代方案。使用姿势图像的方法与后处理的 3D 点云的方法之间的性能差距让人更加相信 2D 和 3D 感知需要不同的模型架构。在本文中,我们挑战了这一观点,并提出了 ODIN Omni Dimensional INstance 分割,这是一种可以分割和标记 2D RGB 图像和 3D 点云的模型,使用在 2D 视图内和 3D 跨视图信息融合之间交替的转换器架构。我们的模型通过所涉及标记的位置编码来区分 2D 和 3D 特征操作,该编码捕获 2D 补丁标记的像素坐标和 3D 特征标记的 3D 坐标。 ODIN 在 ScanNet200、Matterport3D 和 AI2THOR 3D 实例分割基准上实现了最先进的性能,在 ScanNet、S3DIS 和 COCO 上实现了具有竞争力的性能。当使用感测到的 3D 点云代替从 3D 网格采样的点云时,它的性能大大优于以前的所有工作。当在可指导的具体代理架构中用作 3D 感知引擎时,它为对话基准的 TEACh 动作设定了新的技术水平。

Direction of Arrival Estimation Using Microphone Array Processing for Moving Humanoid Robots
Authors Vladimir Tourbabin, Boaz Rafaely
近年来,人形机器人的听觉系统受到越来越多的关注。该系统通常通过麦克风阵列来获取周围的声场。然后使用各种方法处理阵列采集的信号。广泛应用的方法之一是到达方向估计。传统的到达方向估计方法假设在估计期间阵列固定在给定位置。然而,对于安装在移动人形机器人上的阵列来说,情况不一定如此。如果没有适当考虑阵列运动,可能会在估计的到达方向上引入显着的误差。当前的论文提出了一种考虑运动的信号模型。基于该模型,提出了两种处理方法。第一个补偿机器人的运动。第二种方法适用于周期性信号,并利用运动来将性能提高到超出固定阵列的水平。提供了数值模拟和实验研究,证明运动补偿方法几乎消除了与运动相关的误差。

Inherently robust suboptimal MPC for autonomous racing with anytime feasible SQP
Authors Logan Numerow, Andrea Zanelli, Andrea Carron, Melanie N. Zeilinger
近年来,自动驾驶等应用对高性能控制器的需求不断增长,推动了针对特定控制问题的优化例程的开发。在本文中,我们提出了一种高效的不精确模型预测控制 MPC 策略,用于具有固有鲁棒性的自主微型赛车。我们依赖于一种可行的顺序二次规划 SQP 算法,该算法能够生成可行的中间迭代,以便求解器可以在任意次数的迭代后停止,而不会危及递归的可行性。通过这种方式,我们提供了一种计算次优但可行的解决方案的策略,其计算足迹远低于基于局部最优解决方案计算的最先进方法。在对终端集和系统可控性属性的适当假设下,我们可以说,对于影响系统动态的任何足够小的扰动,可以保证递归可行性。我们在模拟中验证了所提出策略的有效性,并将其部署到自动微型赛车的物理实验中。仿真和实验结果都表明,与采用提前终止而不提供可行解的策略相比,使用可行的 SQP 方法,可以通过适度的额外计算工作来获得可行解。

Estimating continuous data of wrist joint angles using ultrasound images
Authors Yo Kobayashi, Yoshihiro Katagi
超声波成像最近被引入作为联合运动估计的传感接口。使用超声图像作为估计方法有望提高辅助设备和人机界面的控制性能。本研究旨在使用超声图像估计连续的腕关节角度。具体来说,在实验中,在伸展屈曲运动期间获得关节角度信息,并获取相关肌肉的超声图像。利用从超声图像获得的特征,使用多元线性回归模型来估计关节角度。使用来自超声图像的光流获得的特征点的坐标被用作多元线性回归模型的解释变量。每个参与者都对模型进行了每次试验的训练和测试,以验证估计的准确性。结果显示,所有试验的估计精度的平均值和标准差为均方根误差 RMSE 1.82 pm 0.54 deg,决定系数 R2 0.985 pm 0.009。

Perceptions of Humanoid Robots in Caregiving: A Study of Skilled Nursing Home and Long Term Care Administrators
Authors Rana Imtiaz, Arshia Khan
随着人口老龄化的加剧和医护人员短缺的加剧,研究其他照顾老龄化人口的方法的必要性也随之增加。其中一种方法是使用人形机器人来照顾 65 岁以上人群的社交、情感和身体健康。了解熟练的长期护理院管理员对人形机器人在护理方面的看法至关重要,因为他们的见解影响着机器人的实施及其对居民福祉和生活质量的潜在影响。作者对 269 名疗养院管理人员进行了调查,以了解他们对在疗养院设施中使用人形机器人的看法。数据经过编码,结果显示,高管们热衷于探索其他护理途径,例如机器人技术,以增强疗养院照顾居民的能力。定性分析揭示了在疗养院中集成人形机器人的不同观点。虽然承认提高参与度和员工支持等好处,但对成本、对人类互动的影响以及对机器人有效性的怀疑仍然存在。这凸显了复杂的财务、技术和人力障碍,并强调了战略实施的必要性。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/233057.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

gradle安装

从gradle下载安装包。 安装环境变量以及仓库存储地址。 在path中添加bin路径 打开cmd命令, 输入 gradle -v 查看版本信息。

JVM工作原理与实战(九):类加载器-启动类加载器

专栏导航 JVM工作原理与实战 RabbitMQ入门指南 从零开始了解大数据 目录 专栏导航 前言 一、启动类加载器 二、通过启动类加载器去加载用户jar包 1.放入jre/lib目录进行扩展 2.使用参数进行扩展 总结 前言 JVM作为Java程序的运行环境,其负责解释和执行字节码…

优化器(一)torch.optim.SGD-随机梯度下降法

torch.optim.SGD-随机梯度下降法 import torch import torchvision.datasets from torch import nn from torch.utils.data import DataLoaderdataset torchvision.datasets.CIFAR10(root./data, trainFalse, downloadTrue,transformtorchvision.transforms.ToTensor()) data…

RK3399平台入门到精通系列讲解(实验篇)自定义工作队列的使用

🚀返回总目录 文章目录 一、自定义工作队列介绍1.1、工作队列相关结构体1.2、工作队列相关接口函数二、自定义共享队列案例2.1、Makefile2.2、驱动案例共享队列是由内核管理的全局工作队列,自定义工作队列是由内核或驱动程序创建的特定工作队列,用于处理特定的任务。 一、…

华为mstp、vrrp、ospf、isis、bgp等综合一起排错

最终实现左边私网和右边私网全部ping通 SW1 vlan batch 12 34 stp region-configuration //mstp配置 region-name test instance 12 vlan 12 instance 34 vlan 34 active region-configuration interface GigabitEthernet0/0/3 port link-type trunk port trunk allow-pass …

求更新后的路由表

假定网络中的路由器B的路由表有如下的项目 (这三列分别表示“目的网络“距离”和“下一跳路由器”): 现在B收到从C发来的路由信息(这两列分别表示“目的网络”和“距离”): 试求出路由器B更新后的路由表(详细说明每一个步骤)。 (1)首先把收到的路由信息的"距离"1: …

[论文阅读] Revisiting Feature Propagation and Aggregation in Polyp Segmentation

[论文地址] [代码] [MICCAI 23] Abstract 息肉的准确分割是筛查过程中有效诊断结直肠癌的关键步骤。 由于能够有效捕获多尺度上下文信息,普遍采用类似UNet 的编码器-解码器框架。 然而,两个主要限制阻碍了网络实现有效的特征传播和聚合。 首先&#xff…

我的创作纪念日——redis的历史纪录

机缘 最开始只想存留点Redis的操作信息,后来写着写着也就写多了,虽然后面很长时间由于忙就没继续写,但是还是偶尔登录看一下,有好几篇文章的浏览量还是很多的呢。 收获 收获不多,粉丝也才三十多个,浏览量感…

Nacos 持久化及集群的搭建【微服务】

文章目录 一、统一配置管理二、微服务配置拉取三、配置热更新四、多环境共享配置五、Nacos 集群搭建1. 集群结构2. 初始化数据库3. 搭建集群 六、Nginx 反向代理七、启动项目测试 一、统一配置管理 案例练习的时候我们只有两个微服务,管理起来非常简单,但…

【100个Cocos实例】通过重写源码实现循环PageView

引言 Cocos中通过重写源码实现循环PageView 大家好,有小伙伴私信我: 有没有办法实现循环的PageView列表的方法呢 本文将介绍一下Cocos中通过重写源码实现循环PageView。 本文源工程可在文末阅读原文获取,小伙伴们自行前往。 1.什么是Page…

【Spring实战】25 Spring Boot Admin 应用

文章目录 1. 查看健康信息2. 使用 Micrometer 和 "/metrics"3. 管理包和类的日志级别4. 其他功能总结 Spring Boot Admin 是一个功能强大的工具,用于监控和管理多个 Spring Boot 应用程序。通过上一篇文章 【Spring实战】24 使用 Spring Boot Admin 管理…

景联文科技GPT教育题库:AI教育大模型的强大数据引擎

GPT-4发布后,美国奥数队总教练、卡耐基梅隆大学数学系教授罗博认为,这个几乎是用“刷题”方式喂大的AI教育大模型的到来,意味着人类的刷题时代即将退出历史舞台。 未来教育将更加注重学生的个性化需求和多元化发展,借助GPT和AI教育…

工厂方法模式(Factory Method)

文章目录 定义与类型适用场景优点缺点工厂方法代码示例 定义与类型 定义:定义一个创建对象的接口,但让实现这个接口的类来决定实例化哪个类。工厂方法让类的实例化推迟到子类中进行。 类型:创建型。 适用场景 创建对象需要大量重复的代码…

mysql视图和sql语句

mysql视图和sql语句 一.mysql视图1.数据的虚拟表示:2.简化复杂查询:3.安全性和权限控制:4.逻辑数据组织:5.更新限制:6.视图的创建: 二.mysq语句使用案列 MySQL的视图(View)是一个虚拟…

如何向嵌入式设备中添加tcpdump工具

说明:tcpdump是一个在网络设备调试中一个非常重要的工具,它并不像hexdump等工具集成在busybox里面,也不像其他的软件一样只需要依赖linux标准的库就可以实现,它需要pcap相关的库和加密的相关库。 本文主要是基于realtek 83系列的…

[VUE]5-TypeScript

目录 1 TypeScript 介绍2、安装3、快速上手4、TypeScript 常用类型4.1 类型标注的位置4.2 字符串、数字、布尔类型4.3 字面量类型4.4 ⭐interface 类型4.5 class 类型 ​🍃作者介绍:双非本科大三网络工程专业在读,阿里云专家博主,…

三、Qt核心与Qt类库

一、Qt核心:元对象系统 1、Qt核心特点 Qt对标准C进行了扩展,引入了一些新的概念和功能元对象编译器(MOC)是一个预处理器,先将Qt的特性程序转为标准C程序,再由标准C编译器进行编译Qt为C语言增加的特性在Qt…

LeetCode第32题 : 最长有效括号

题目介绍 给你一个只包含 ( 和 ) 的字符串,找出最长有效(格式正确且连续)括号子串的长度。 示例 1: 输入:s "(()" 输出:2 解释:最长有效括号子串是 "()" 示例 2&#xf…

【Python机器学习】线性模型——用于多分类的线性模型

很多线性分类模型只使用与二分类问题,将二分类算法推广到多分类算法的一种常见方法是“一对其余”方法。在“一对其余”方法中,对每个类别都学习一个二分类模型,将这个类别和其他类别尽量区分,这样就生成了与类别数相同的二分类模…

设计模式——最全梳理,最好理解

新年献礼! 设计模式呕心梳理 创建型模式 单例模式(Singleton Pattern)https://blog.csdn.net/qq_34869143/article/details/134874044 整理中... 结构型模式 代理模式(Proxy Pattern)https://blog.csdn.net/qq_34…