用大模型训练实体机器人，谷歌推出机器人代理模型

用大模型训练实体机器人，谷歌推出机器人代理模型

news/2025/1/9 1:15:33/文章来源:https://blog.csdn.net/weixin_57291105/article/details/135844180

谷歌DeepMind的研究人员推出了一款，通过视觉语言模型进行场景理解，并使用大语言模型来发出指令控制实体机器人的模型——AutoRT

AutoRT可有效地推理自主权和安全性，并扩大实体机器人学习的数据收集规模。在实验中，AutoRT指导超过20个实体机器人执行指令，并通过远程操作和自主机器人策略收集了77,000个真实机器人操作的片段。

这充分说明，AutoRT收集的机器人操作数据更加多样化，并且在大语言模型的帮助下AutoRT可以轻松实现与人类偏好相一致的机器人行为指令，该模型对于训练实体机器人帮助巨大。

论文地址：https://auto-rt.github.io/static/pdf/AutoRT.pdf

大语言模型是AutoRT的核心组建之一，充当机器人的指挥“大脑”，根据用户的提示和环境条件为一个或多个机器人提供任务指令，主要包括环境探索、任务生成、自主行为和行为过滤四大模块。

环境探索

负责让机器人在环境中寻找适合操作的场景。该模块使用了视觉语言模型构建环境地图,识别并定位各个对象。

然后根据对象特征采样导航目标,引导机器人驶向潜在的操作场景。这使得AutoRT可以无需事先了解环境布局就进行部署。

简单来说，就是让机器人自己在房间、办公室等环境进行自行操作和观察,到处看看有啥可以操作的东西。它会先把当前环境里的桌子、杯子这些物体定位好,明确具体的坐标，方便以后的动作指令操作。

任务指令生成

首先使用视觉语言模型描述当前场景和环境中的对象,然后将这些文字描述输入大语言模型,生成机器人可以执行的一系列操作任务指令。

任务生成考虑不同的数据收集策略,为它们各自生成适配的任务列表。此外,任务生成过程中还内嵌了“机器人约束”,定义了机器人需要遵守的基本规则、安全规则和具体约束,确保任务的安全性和合理性。

自主执行

在任务执行阶段，机器人根据生成的任务执行计划来执行具体的操作。机器人可以根据需要执行自主策略，如通过路径规划和运动控制来移动和操作物体。

此外，机器人还可以通过与人类操作员进行通信来执行任务。在需要人类干预或指导的情况下，机器人可以向操作员发送请求或询问，并根据操作员的指示进行相应的操作。

自主执行的目标是使机器人能够在不同环境和任务下独立运行，并从中获取丰富的数据。

行为指令过滤

主要对任务生成的输出进行再次筛选,移除不安全或不合理的任务。该模块同样基于大语言模型,将生成的任务及可选的数据收集策略作为输入，同时输出每个任务指令所匹配的策略或拒绝理由。

可以把这个模块看成是一个自我反思的过程,大语言模型对自己生成的内容进行纠错和修正，提升整体的安全性能。

通过以上4大模块的协同工作，AutoRT能够在真实世界的不同环境中快速收集大规模、多样化的机器人数据。

相比于传统的数据收集方法，AutoRT利用先进的视觉感知和语言模型技术，使机器人能够在未知的情境下自主决策并执行任务，从而最大限度地提高数据收集的效率和安全性。

此外，AutoRT还支持与人类操作员的交互，使机器人能够在需要时获取人类的帮助和指导。

本文素材来源AutoRT论文，如有侵权请联系删除

END

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/246124.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

K8s 安装部署-Master和Minion(Node)文档

K8s 安装部署-Master和Minion(Node)文档

K8s 安装部署-Master和Minion(Node)文档操作系统版本：CentOS 7.4 Master ：172.20.26.167 Minion-1：172.20.26.198 Minion-2：172.20.26.210（后增加节点） ETCD：172.20.27.218 先安装部署ETC…

阅读更多...

pytorch 实现中文文本分类

pytorch 实现中文文本分类

🍨 本文为[🔗365天深度学习训练营学习记录博客🍦 参考文章：365天深度学习训练营🍖 原作者：[K同学啊 | 接辅导、项目定制]\n🚀 文章来源：[K同学的学习圈子](https://www.yuque.com/mi…

阅读更多...

WPF自定义圆形百分比进度条

WPF自定义圆形百分比进度条

先看效果图 1.界面代码 <UserControl x:Class"LensAgingTest.CycleProcessBar1"xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x"http://schemas.microsoft.com/winfx/2006/xaml"xmlns:mc"http://schemas.op…

阅读更多...

Java研学-代理模式

Java研学-代理模式

一概述 1 分类静态代理：在程序运行前就已经存在代理类的字节码文件，代理对象和真实对象的关系在运行前就确定了。（代理类及对象要自行创建） 动态代理：代理类是在程序运行期间由 JVM 通过反射等机制动态的生成的…

阅读更多...

朴素贝叶斯分类算法

朴素贝叶斯分类算法

1.分类算法分类算法是有监督学习的一个核心问题，他从数据中学习一个分类决策函数或分类模型，对新的输入进行预测，输出变量取有限个离散值。 🌍分类算法的内容是要求给定特征，让我们得出类别。那么如何由指定特征&…

阅读更多...

Asp.Net Core 获取应用程序相关目录

Asp.Net Core 获取应用程序相关目录

在ASP.NET Core中，可以通过以下三种方式获取应用程序所在目录： 1、使用AppContext.BaseDirectory属性： string appDirectory AppContext.BaseDirectory; 例如：D:\后端项目\testCore\test.WebApi\bin\Debug\net6.0\ 2、使用…

阅读更多...

Leetcode刷题笔记题解（C++）：LCR 153. 二叉树中和为目标值的路径

Leetcode刷题笔记题解（C++）：LCR 153. 二叉树中和为目标值的路径

思路：利用回溯的思想，回溯的退出条件为当前节点为空，是符合路径的判断条件为路径和为目标值且叶子节点包含了，代码如下： /*** Definition for a binary tree node.* struct TreeNode {* int val;* TreeNode *…

阅读更多...

【C++】入门基础

【C++】入门基础

前言：C是在C的基础之上，容纳进去了面向对象编程思想，并增加了许多有用的库，以及编程范式等。熟悉C语言之后，对C学习有一定的帮助，因此从今天开始们将进入Ｃ的学习。 💖 博主CSDN主页:…

阅读更多...

《动手学深度学习(PyTorch版)》笔记4.5

《动手学深度学习(PyTorch版)》笔记4.5

注：书中对代码的讲解并不详细，本文对很多细节做了详细注释。另外，书上的源代码是在Jupyter Notebook上运行的，较为分散，本文将代码集中起来，并加以完善，全部用vscode在python 3.9.18下测试通过。…

阅读更多...

ES文档索引、查询、分片、文档评分和分析器技术原理

ES文档索引、查询、分片、文档评分和分析器技术原理

技术原理索引文档索引文档分为单个文档和多个文档。单个文档新建单个文档所需要的步骤顺序： 客户端向 Node 1 发送新建、索引或者删除请求。节点使用文档的 _id 确定文档属于分片 0 。请求会被转发到 Node 3，因为分片 0 的主分片目前被分配在 …

阅读更多...

微信小程序（十七）自定义组件生命周期（根据状态栏自适配）

微信小程序（十七）自定义组件生命周期（根据状态栏自适配）

注释很详细，直接上代码上一篇新增内容： 1.获取手机状态栏的高度 2.验证attached可以修改数据 3.动态绑定样式数值源码： myNav.js Component({lifetimes:{//相当于vue的created,因为无法更新数据被打入冷宫created(){},//相当于vue的mount…

阅读更多...

【JS基础】事件对象event、环境对象this、事件的高级操作

【JS基础】事件对象event、环境对象this、事件的高级操作

文章目录一、事件对象1.1 事件对象是什么？1.2 使用方法二、环境对象this以及回调函数2.1 它是什么？2.2 演示示例三、事件的高级操作3.1 事件流3.2 事件捕获3.3 事件冒泡以及阻止冒泡3.4 事件解绑3.5 mouseover和mouseenter事件的区别3.6 事件委托它是…

阅读更多...

HTML新手教程

HTML新手教程

HTML入门教程：【狂神说Java】HTML5完整教学通俗易懂_哔哩哔哩_bilibili 一.初识HTML HyperTextMarkupLanguage（超文本标记语言） 超文本包括：文字、图片、音频、视频、动画。 HTML5的优势世界知名浏览器厂商对HTML5的支持市场的…

阅读更多...

解决WinForms跨线程操作控件的问题

解决WinForms跨线程操作控件的问题

解决WinForms跨线程操作控件的问题介绍在构建Windows窗体应用程序时，我们通常会遇到需要从非UI线程更新UI元素的场景。由于WinForms控件并不是线程安全的，直接这样做会抛出一个异常：“控件’control name’是从其他线程创建的，…

阅读更多...

每日OJ题_算法_二分查找⑦_力扣153. 寻找旋转排序数组中的最小值

每日OJ题_算法_二分查找⑦_力扣153. 寻找旋转排序数组中的最小值

目录力扣153. 寻找旋转排序数组中的最小值解析代码力扣153. 寻找旋转排序数组中的最小值 153. 寻找旋转排序数组中的最小值 - 力扣（LeetCode） 难度中等已知一个长度为 n 的数组，预先按照升序排列，经由 1 到 n 次旋转后…

阅读更多...

node学习过程中的终端命令

node学习过程中的终端命令

冷的哥们手真tm冷，打字都是僵的，屮目录一、在学习nodejs过程中用到的终端命令总结一、在学习nodejs过程中用到的终端命令 node -v nvm install 20.11.0 nvm list nvm list available nvm on nvm -v nvm use 20.11.0 node加要运行的js文件路径 ps&a…

阅读更多...

Keycloak - docker 运行前端集成

Keycloak - docker 运行前端集成

Keycloak - docker 运行 & 前端集成这里的记录主要是跟我们的项目相关的一些本地运行/测试，云端用的 keycloak 版本不一样，不过本地我能找到的最简单的配置是这样的 docker 配置 & 运行 keycloak keycloak 有官方(Red Hat Inc.)的镜像&#…

阅读更多...

搭建Redis集群

搭建Redis集群

一应用场景为什么需要redis集群？ 当主备复制场景，无法满足主机的单点故障时，需要引入集群配置。一般数据库要处理的读请求远大于写请求 ，针对这种情况，我们优化数据库可以采用读写分离的策略。我们可以部署一台…

阅读更多...

数据结构与算法——队列

数据结构与算法——队列

概述计算机科学中，queue 是以顺序的方式维护的一组数据集合，在一端添加数据，从另一端移除数据。添加的一端称为尾，移除的一端称为头。功能插入offer(value : E) : boolean　　取值并移除poll() : E　　取值peek() : E　　判断…

阅读更多...

项目中日历管理学习使用

项目中日历管理学习使用

一些项目中会有日历或日期设置，最基本的会显示工作日，休息日，节假日等等，下面就是基于项目中的日历管理功能，要显示工作日，休息日，节假日效果图获取国家法定节假日工具类 public class Holi…

阅读更多...

最新文章

推荐文章