2024年度总结(具身智能赛道,欢迎交流)

      随着各个互联网大厂,新能源产业纷纷入场机器人赛道,各家几近明牌,都笃定未来十年具身智能将是最重要的科技革命之一。想起一句话“技术爆发的节点,就是入场的时机”。机器人是否能真正替代人类暂且不论,只谈谈个人的一些经历。

1 一些探索

      跟随时代的大潮,2024年对各类机器人硬件、算法、仿真软件,落地部署等有了一定了解,也做了一些测试,当然多数是基于开源的资料做的仿真测试案例,一部分是基于开源做的适配。

  • 包括机械臂,无人机,移动小车,移动机械臂,旋翼机械臂,四足+机械臂,6D抓取姿态预测,基于相机和VR的遥操作,主从臂遥操作等,基于大模型的机械臂任务生成,VLA模型微调。
  • 算法涉及强化学习,模仿学习,深度学习,大模型,传统控制,基本通讯逻辑,
  • 测试软件包括gazebo,mujoco,webots,Isaac gym,Isaac sim。
  • 此外做了斗地主ai和掼蛋ai测试,基于文心和GPT的问答网站搭建。

      总体上看,各方面都有所涉及,但并未深入,然而也算有一些经验,包括市场上各家各类机器人产品的优势,各类前沿方案的可复现情况,和改进逻辑。

2 一些看法

      从硬件上看各家的硬件尚未收敛,或者说尚未有一个最优的硬件方案,当前的市场甚至未真正进入一个百家争鸣的态势,随着研发和竞争的的进一步加剧,成本会进一步降低,直到这个价格适合进入千家万户,各行各业,这个时候会才会真正呈现一个机器人革命,而现在仍是机器人时代来临的前夕,也是入场的好时机。

      从算法上看,当前机器人领域同样希望做一个大模型,但在实际推理时需要较高的算力,如果远程部署会影响实时性,如果本地部署存在成本高,部署硬件大的问题。GPU小型化、高性能仍是需要解决的问题,在保证性能的前提下,减小模型也是一个重中之重。

      但这两者解决之后最大的问题还是场景部署,尽管各家都在提倡通用场景,但目前看短期难以实现,当前的问题仍是机器人如何快速真正适应一个复杂多变的场景。

3 一些想法

      具身智能这个赛道还很长,也很大,需要做的东西很多。我对这个方向很感兴趣,也正在参与其中,接下来主要是做端到端。欢迎感兴趣的朋友一块探索这片蓝海。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7610.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

docker部署jenkins

环境: centos7.9 jenkins/jenkins:lts-jdk11 1、拉去jenkins镜像,请指明版本号 [rootlocalhost ~]# docker pull jenkins/jenkins:lts 开始拉取 拉取完成 [rootlocalhost ~]# docker pull jenkins/jenkins:lts lts: Pulling from jenkins/jenkins 0a9…

沃尔玛 礼品卡绑定 分析

声明: 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 逆向分析 部分代码参考 func doPost…

【2024年华为OD机试】 (A卷,100分)- 整理扑克牌(JavaScriptJava PythonC/C++)

一、问题描述 题目描述 给定一组数字,表示扑克牌的牌面数字,忽略扑克牌的花色,请按如下规则对这一组扑克牌进行整理: 步骤1:分组形成组合牌 炸弹:当牌面数字相同张数大于等于4时。葫芦:3张相同牌面数字 + 2张相同牌面数字,且3张牌与2张牌不相同。三张:3张相同牌面数…

Arduino大师练成手册 --控制 OLED

要在 Arduino 上使用 U8glib 库控制带有 7 个引脚的 SPI OLED 显示屏,你可以按照以下步骤进行: 7pin OLED硬件连接 GND:连接到 Arduino 的 GND 引脚。 VCC:连接到 Arduino 的 5V 引脚。 D0(或 SCK/CLK)…

单片机基础模块学习——按键

一、按键原理图 当把跳线帽J5放在右侧,属于独立按键模式(BTN模式),放在左侧为矩阵键盘模式(KBD模式) 整体结构是一端接地,一端接控制引脚 之前提到的都是使用了GPIO-准双向口的输出功能&#x…

AWScurl笔记

摘要 AWScurl是一款专为与AWS服务交互设计的命令行工具,它模拟了curl的功能并添加了AWS签名版本4的支持。这一特性使得用户能够安全有效地执行带有AWS签名的请求,极大地提升了与AWS服务交互时的安全性和有效性。 GitHub - okigan/awscurl: curl-like acc…

初识MySQL

文章目录 1.数据库2.查看数据库3.创建数据库4.字符集编码和排序规则6.修改数据库7.删除数据库 1.数据库 MySQL是一款使用率高且免费的数据库(使用率仅仅低于Oracle) 关系数据库和 NoSQL 数据库管理系统知识库(DB-Engines Ranking -) (此图数据于2025-1…

flutter_学习记录_00_环境搭建

1.参考文档 Mac端Flutter的环境配置看这一篇就够了 flutter的中文官方文档 2. 本人环境搭建的背景 本人的电脑的是Mac的,iOS开发,所以iOS开发环境本身是可用的;外加Mac电脑本身就会配置Java的环境。所以,后面剩下的就是&#x…

[b01lers2020]Life on Mars1

打开题目页面如下 看了旁边的链接,也没有什么注入点,是正常的科普 利用burp suite抓包,发现传参 访问一下 http://5edaec92-dd87-4fec-b0e3-501ff24d3650.node5.buuoj.cn:81/query?searchtharsis_rise 接下来进行sql注入 方法一&#xf…

【PyTorch】3.张量类型转换

个人主页:Icomi 在深度学习蓬勃发展的当下,PyTorch 是不可或缺的工具。它作为强大的深度学习框架,为构建和训练神经网络提供了高效且灵活的平台。神经网络作为人工智能的核心技术,能够处理复杂的数据模式。通过 PyTorch&#xff0…

机位:解锁摄影视角的多维度密码

目录 一、机位的构成要素 (一)高度维度 (二)角度维度 (三)距离维度 二、移动机位的魅力 (一)推镜头 (二)拉镜头 (三)摇镜头 …

【例51.3】 平移数据

题目描述 将a数组中第一个元素移到数组末尾,其余数据依次往前平移一个位置。 输入 第一行为数组a的元素个数; 第二行为n个小于1000的正整数。 输出 平移后的数组元素,每个数用一个空格隔开。 样例输入 复制 10 1 2 3 4 5 6 7 8 9 10 样例输出 复…

【Project】CupFox电影网站数据爬取分析与可视化

数据采集清洗与数据存储流程如下图所示。 数据分析与数据可视化流程设计如下 1.使用pymongo从数据库中查询所需的数据。对数据进行处理和分析,进行统计、分类、聚合等操作,提取关键指标和洞察。分析结果可以通过编写Python代码进一步优化、筛选和整理&a…

gradle创建springboot单项目和多模块项目

文章目录 gradle创建springboot项目gradle多模块项目创建 gradle创建springboot项目 适用IDEA很简单,如下图 gradle多模块项目创建 首选创建父项目,然后删除无用内容至下图 选择父项目目录,右键选择模块,创建子项目&#xff08…

数据库的JOIN连接查询算法

文章目录 3.2 Join 算法优化3.1.2 Nested Loop Join(NLJ)3.1.3 Block Nested Loop Join(BNLJ)3.1.4 Index Nested Loop Join(INLJ)3.1.5 Sort Merge Join(SMJ)3.1.6 Hash Join 3.2 J…

Golang Gin系列-8:单元测试与调试技术

在本章中,我们将探讨如何为Gin应用程序编写单元测试,使用有效的调试技术,以及优化性能。这包括设置测试环境、为处理程序和中间件编写测试、使用日志记录、使用调试工具以及分析应用程序以提高性能。 为Gin应用程序编写单元测试 设置测试环境…

二叉树的最大深度(C语言详解版)

一、摘要 嗨喽呀大家,leetcode每日一题又和大家见面啦,今天要讲的是104.二叉树的最大深度,思路互相学习,有什么不足的地方欢迎指正!好啦让我们开始吧!!! 二、题目简介 给定一个二…

开发环境搭建-3:配置 nodejs 开发环境 (fnm+ node + pnpm)

在 WSL 环境中配置:WSL2 (2.3.26.0) Oracle Linux 8.7 官方镜像 node 官网:https://nodejs.org/zh-cn/download 点击【下载】,选择想要的 node 版本、操作系统、node 版本管理器、npm包管理器 根据下面代码提示依次执行对应代码即可 基本概…

HTB:Support[WriteUP]

目录 连接至HTB服务器并启动靶机 信息收集 使用rustscan对靶机TCP端口进行开放扫描 将靶机TCP开放端口号提取并保存 使用nmap对靶机TCP开放端口进行脚本、服务扫描 使用nmap对靶机TCP开放端口进行漏洞、系统扫描 使用nmap对靶机常用UDP端口进行开放扫描 使用ldapsearch…

洛谷P1017 [NOIP2000 提高组] 进制转换

题目链接:P1017 [NOIP2000 提高组] 进制转换 - 洛谷 | 计算机科学教育新生态 题目难度:普及一 题目分析:这是道数学题,我们都知道,首先按照10进制转成n进制的做法:对这个数不断除以n,将余数一一…