【AI视野·今日Robot 机器人论文速览第六十八期】Tue, 2 Jan 2024

AI视野·今日CS.Robotics 机器人学论文速览
Tue, 2 Jan 2024
Totally 12 papers
👉上期速览✈更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

Edge Computing based Human-Robot Cognitive Fusion: A Medical Case Study in the Autism Spectrum Disorder Therapy
Authors Qin Yang
近年来，边缘计算已成为一种范式，通过将云计算设施和服务连接到最终用户，实现人工智能、机器人、物联网等许多未来技术以及 5G 等高速无线传感器网络。特别是在医疗和保健应用中，它提供远程患者监控并增加大量多媒体。从机器人学的角度来看，机器人辅助治疗RAT是康复机器人学中的一种主动辅助机器人技术，吸引了众多研究人员进行研究，造福于自闭症谱系障碍自闭症儿童等残疾人。然而，RAT 的主要挑战是存在能够检测 ASD 人群情感状态的模型，并且能够回忆个人偏好。此外，通过专家诊断和建议来指导机器人更新治疗方法以适应不同的状态和场景，是自闭症谱系障碍治疗过程中至关重要的一部分。本文提出了边缘认知计算的架构，通过将人类专家和辅助机器人在同一框架中协作相结合，为自闭症谱系障碍患者提供长期支持。

General-purpose foundation models for increased autonomy in robot-assisted surgery
Authors Samuel Schmidgall, Ji Woong Kim, Alan Kuntz, Ahmed Ezzat Ghazi, Axel Krieger
端到端机器人学习的主导范式侧重于优化任务特定目标，解决单个机器人问题，例如拾取物体或到达目标位置。然而，最近关于机器人技术的高容量模型的工作已经显示出在大量多样化且与任务无关的视频演示数据集上进行训练的希望。这些模型对未见过的情况表现出了令人印象深刻的泛化能力，尤其是随着数据量和模型复杂性的扩展。从数据中学习的手术机器人系统一直难以像其他机器人学习领域一样快速发展，原因如下：1 缺乏现有的大规模开源数据来训练模型；2 对软体变形进行建模具有挑战性。这些机器人在手术期间协同工作，因为模拟无法匹配生物组织的物理和视觉复杂性，并且 3 种手术机器人在临床试验中测试时存在伤害患者的风险，需要更广泛的安全措施。本文旨在通过开发手术机器人的多模式、多任务、视觉语言动作模型，为提高机器人辅助手术中的机器人自主性提供一条途径。

Nonlinear vibration of a dipteran flight robot system with rotational geometric nonlinearity
Authors Yanwei Han, Zijian Zhang
昆虫的双翅类飞行机制常用于设计非线性飞行机器人系统。然而，具有多重稳定性的非线性机器人系统点击机构的动态响应仍不清楚。本文基于卡扣屈曲的多重稳定性，提出了一种具有点击机构的新型双翅机器人模型。利用欧拉拉格朗日方程得到了非线性飞行机器人系统的运动方程。研究了非线性势能、弹力、平衡分岔以及平衡稳定性，以显示多重稳定性特征。获得了系统参数平面内的瞬态分岔集和持久区域集以及相应的相图，并具有单、双井行为的多重稳定性。然后，通过三种椭圆函数的解析解定义了周期自由振动响应，并通过数值积分研究了幅频响应。基于拓扑等效方法，推导了简谐强迫机器人系统混沌振动的同位轨道混沌阈值，以反映混沌参数条件。最后制作了非线性扑动机器人样机并搭建了实验系统。对双翅机器人系统进行了非线性静力矩曲线、周期响应和动态飞行振动分析。结果表明，试验结果与理论分析和数值模拟吻合较好。

Effect of Optimizer, Initializer, and Architecture of Hypernetworks on Continual Learning from Demonstration
Authors Sayantan Auddy, Sebastian Bergner, Justus Piater
在从演示 CLfD 中持续学习的过程中，机器人不断地从人类演示中学习一系列现实世界的运动技能。最近，超网络已经成功解决了这个问题。在本文中，我们对不同优化器、初始化器和网络架构对 CLfD 超网络持续学习性能的影响进行了探索性研究。我们的结果表明，自适应学习率优化器运行良好，但专为超网络设计的初始化器对 CLfD 没有任何优势。我们还表明，能够进行稳定轨迹预测的超网络对于不同的网络架构具有鲁棒性。

Controllable Safety-Critical Closed-loop Traffic Simulation via Guided Diffusion
Authors Wei Jer Chang, Francesco Pittaluga, Masayoshi Tomizuka, Wei Zhan, Manmohan Chandraker
评估自动驾驶车辆规划算法的性能需要模拟长尾交通场景。生成安全关键场景的传统方法通常缺乏真实性和可控性。此外，这些技术通常忽略了代理交互的动态。为了减轻这些限制，我们引入了一种基于引导扩散模型的新型闭环模拟框架。我们的方法有两个明显的优势：1 生成紧密模拟现实世界条件的真实长尾场景；2 增强可控性，实现更全面和交互式的评估。我们通过新颖的指导目标来实现这一目标，这些目标可提高道路进度，同时降低碰撞和越野率。我们开发了一种新颖的方法，通过去噪过程中的对抗性术语来模拟安全关键场景，该方法允许对抗性代理通过合理的操作来挑战规划者，而场景中的所有代理都表现出反应性和现实的行为。我们使用 NuScenes 数据集凭经验验证我们的框架，展示了真实性和可控性方面的改进。这些发现证实，引导扩散模型为安全关键的交互式交通模拟提供了强大且多功能的基础，将其实用性扩展到更广泛的自动驾驶领域。

Shape-programmable Adaptive Multi-material Microrobots for Biomedical Applications
Authors Liyuan Tan, Yang Yang, Li Fang, David J. Cappelleri
有鞭毛的微生物可以在低雷诺数下游泳并适应环境的变化。具体来说，鞭毛可以通过基因表达来改变其形状或模式。在过去的十年中，人们一直在努力制造和研究不适应环境的刚性类型的微型机器人。最近，获得模仿真实微生物的自适应微型机器人越来越受到关注。然而，尽管已经出现了一些由水凝胶实现的自适应微型机器人，但微型机器人在环境引起变形之前和之后的游泳行为并没有以系统标准化的方式预测。在这项工作中，实验、有限元分析和动态建模一起呈现，以实现对这些自适应微型机器人的完整理解。上述三个部分经过交叉验证，证明了使用此类方法的成功，促进了形状可编程甚至游泳性能可编程微型机器人的生物应用。此外，使用所提出的微型机器人进行目标物体输送的应用已得到成功演示。

Physics-Informed Multi-Agent Reinforcement Learning for Distributed Multi-Robot Problems
Authors Eduardo Sebastian, Thai Duong, Nikolay Atanasov, Eduardo Montijano, Carlos Sagues
多机器人系统的网络性质在多智能体强化学习的背景下提出了挑战。集中控制策略不会随着机器人数量的增加而扩展，而独立控制策略不会利用其他机器人提供的信息，在合作竞争任务中表现不佳。在这项工作中，我们提出了一种基于物理的强化学习方法，能够学习分布式多机器人控制策略，这些策略既可扩展，又可利用每个机器人的所有可用信息。我们的方法具有三个关键特征。首先，它在策略表示上强加了端口哈密顿结构，尊重物理机器人系统的能量守恒特性和机器人团队交互的网络性质。其次，它使用自注意力来确保稀疏策略表示能够处理交互图中每个机器人的时变信息。第三，我们提出了一种由自注意力端口哈密顿控制策略参数化的软演员批评家强化学习算法，该算法在训练过程中考虑了机器人之间的相关性，同时克服了价值函数分解的需要。在不同的多机器人场景中的广泛模拟证明了所提出的方法的成功，在可扩展性方面超越了以前的多机器人强化学习解决方案，同时实现了相似或优越的性能，平均累积奖励比机器人团队的现有技术高出 6 倍

Energy-Efficient Power Control for Multiple-Task Split Inference in UAVs: A Tiny Learning-Based Approach
Authors Chenxi Zhao, Min Sheng, Junyu Liu, Tianshu Chu, Jiandong Li
无人机有限的能量和计算资源阻碍了空中人工智能的应用。无人机中分割推理的使用因其在减轻计算和能源需求方面的有效性而受到广泛关注。然而，考虑到能量水平和延迟约束等各种关键参数，尤其是涉及多个任务，在无人机中实现节能分割推理仍然很复杂。在本文中，我们提出了一种用于分割推理中能量最小化的双时间尺度方法，其中离散变量和连续变量被分成两个时间尺度，以减少动作空间的大小和计算复杂性。这种分离使得能够利用微小的强化学习 TRL 来为顺序任务选择离散传输模式。此外，优化编程OP嵌入在TRL的输出和奖励函数之间，以优化连续发射功率。具体来说，我们用传输时间的优化代替传输功率的优化，以降低OP的计算复杂度，因为我们揭示了能量消耗随着传输时间的增加而单调减少。这种替换显着减少了可行区域，并能够根据最佳发射功率的封闭式表达式快速求解。

Bidirectional Temporal Plan Graph: Enabling Switchable Passing Orders for More Efficient Multi-Agent Path Finding Plan Execution
Authors Yifan Su, Rishi Veerapaneni, Jiaoyang Li
多智能体路径查找 MAPF 问题涉及为共享环境中的多个智能体规划无碰撞路径。大多数 MAPF 求解器都依赖于代理可以在特定时间步到达特定位置的假设。然而，现实世界执行的不确定性可能会导致代理偏离这一假设，从而导致冲突和死锁。先前的研究通过让智能体遵循 Temporal Plan Graph TPG 来解决这个问题，在 MAPF 计划中定义的每个位置强制执行一致的传递顺序。然而，我们表明 TPG 过于严格，因为在某些情况下，满足传递顺序需要代理不必要的等待，导致更长的执行时间。为了克服这个问题，我们引入了一种新的图形表示，称为双向时间计划图 BTPG，它允许在执行期间切换传递的订单，以避免不必要的等待时间。我们设计了两种随时构建 BTPG 的算法 BTPG na ve 和 BTPG 优化的。

Laboratory Experiments of Model-based Reinforcement Learning for Adaptive Optics Control
Authors Jalo Nousiainen, Byron Engler, Markus Kasper, Chang Rajani, Tapio Helin, C dric T. Heritier, Sascha P. Quanz, Adrian M. Glauser
对类地系外行星的直接成像是下一代地面望远镜最重要的科学驱动力之一。通常，类地系外行星与其主恒星的角距较小，这使得它们的探测变得困难。

Leveraging Partial Symmetry for Multi-Agent Reinforcement Learning
Authors Xin Yu, Rongye Shi, Pu Feng, Yongkai Tian, Simin Li, Shuhao Liao, Wenjun Wu
将对称性作为归纳偏差纳入多智能体强化学习 MARL 中，从而提高了泛化性、数据效率和物理一致性。虽然先前的研究已经成功地使用了完美对称先验，但多智能体领域中的部分对称领域仍未得到探索。为了填补这一空白，我们引入了部分对称马尔可夫博弈，它是马尔可夫博弈的一个新子类。然后，我们从理论上证明，在 MARL 中利用对称性引入的性能误差是有界的，这意味着即使在部分对称情况下，对称先验在 MARL 中仍然有用。受这一见解的启发，我们提出了部分对称利用 PSE 框架，该框架能够在不同的对称性破缺条件下自适应地将先验对称性合并到 MARL 中。具体来说，通过自适应调整对称性的利用，我们的框架能够实现 MARL 算法的卓越样本效率和整体性能。进行了大量的实验来证明所提出的框架相对于基线的优越性能。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页

pic from pexels.com