资本相信人形机器人

文|刘俊宏

编|王一粟

闷热的场馆里,兴奋的议论声,所有人生怕错过这场AI让机器人进化的盛宴。

人山人海的会展现场  光锥智能拍摄

8月21日,2024世界机器人大会(WRC)在北京开幕。在这场由169家企业携600余款产品的展会中,具身智能以几乎单独“承包”一个场馆的阵仗,27家公司的人形机器人和机器狗吸纳了最多的观众。

在众多机器人的演示中,光锥智能发现各家企业执行复杂任务的能力明显变强,实用性也得到了很大的提升。

相比去年机器人更多演示跳舞、对话、走两步的简单任务能力,今年有伟景智能机器人摘水果、优必选机器人检修汽车、星辰智能机器人写毛笔字、加速进化的人形机器人足球比赛。宇数科技在表演了连续侧身翻跳跃的机器狗外,还带来了定价9.9万元的人形机器人——G1。在众多厂商机器人的能力演示和价格的发布中,人形机器人距离走向现实的时刻越来越近。

宇树科技G1机器人动作演示

宇树科技G1机器人动作演示

“大模型的发展,极大地促进了人形机器人的进步。”

科大讯飞副总裁、研究院院长刘聪对光锥智能称,不管是“大脑”感知和理解的能力,还是“小脑”的运动控制能力都大幅提升。

进一步,逐际动力联合创始人兼COO张力认为,AI的进化让机器人实现了跨越式的提升,“通用人工智能让软件、算法能够帮助机器人去实现很多以前根本完成不了的事”,

随着AI大模型的突破,今天的人形机器人开始向着自动驾驶的方向发展。在借鉴了端到端大模型让汽车一边理解世界,一边快速迭代的进化中,机器人也展现出了能够理解复杂指令和学习更流畅的动作。同时,在大模型训练需求下,人形机器人也来到了数据驱动智能迭代的阶段。而各家机器人厂商也在试图从家用、工业、仓储物流、零售等一系列场景中占得一席之地。希望以单一场景为中心取得数据和迭代的闭环后,打通不同领域,最终走向通用。

尽管在过去AI发展的十年中,机器人曾经历多次希望和幻灭。但通过本次机器人的明确进化方向,星尘智能创始人来杰兴奋地称,“下一个十年,最值得做的就是人形机器人”。

机器人正在掀起一场资本、技术和产业的共同狂欢。

资本相信人形机器人

“这两年看到最多的投资,除了大模型就是机器人”,刘聪对光锥智能称。

虽然人形机器人行业尚处能力演示的阶段,但投资者和创业者们都知道,不能错过这场风口。

在回顾近一年来的投资趋势后,我们发现人形机器人作为热度最高的机器人终极形态,技术和难度都最高的同时,也在资本市场中占领了高地。

创业者层面,IT桔子数据显示,2023年1月至今国内共成立了29家人形机器人公司,其中有22家已经获得至少1轮融资。其中,由前华为天才少年“稚晖君”创立的智元机器人,在成立17个月就完成了七轮融资,投前估值已达70亿元。

站在资本的角度,根据《中国电子报》的不完全统计,2024年上半年全球人形机器人领域融资事件超过22起,融资金额超过70亿元。对于人形机器人的投资热情,不少投资机构的布局堪称“扫货”。

蓝驰创投合伙人曹巍表示,在机器人领域已经投资了超过10家早期项目。经纬创投更是手握宇树科技、智元机器人、银河通用、星尘智能,四家人形机器人公司的“明星天团”。

“行业和资本都对机器人的未来很乐观,毕竟这是个万亿的市场”。在大会现场,优必选全球营销总监李卓对光锥智能称。

于是,人形机器人在软件、硬件、资本推动、前沿应用效果的共同作用下,成了AI时代最热门的赛道。

以宇树科技在2023年初才开始探索人形机器人的经验为例。之前不做人形机器人的理由,王兴兴认为,“全球人形机器人的控制技术,大家都做的不是特别理想。性能上不去,达不到实用或者干活的阶段,所以过去很多年都没做人形机器人”。

如今,随着机器人软硬件技术升级,人形机器人正逐渐从实验室走到实际的运用场景中。今年7月,马斯克称特斯拉工厂已有两台Optimus机器人在进行电池搬运工作。在本次机器人大会现场,我们也看到了优必选的人形机器能执行简单的汽车质检任务。

优必选机器人演示质检场景

优必选机器人演示质检场景

诚然,以人类熟练工的角度来衡量,机器人“员工”的效率还是太低。但若是与规模叠加,人形机器人24小时连轴工作的特性,还是吸引了汽车、物流、科研院所、AI科技等不同行业的尝试意愿,共同催促着人形机器人的交付进程。

“在2022年底,我们还没做人形机器人,但已经有一些客户找我们想买人形机器人了”,王兴兴认为宇树科技的人形机器人进展都是顺势而为的结果。

不过,猎豹移动董事长兼CEO、猎户星空董事长傅盛认为机器人行业还有很多方面需要打磨,尤其是“两条腿走路”的人形机器人要面临物理学的限制,“双足机器人的技术过于复杂,它必须依赖于机械结构。机械结构的迭代不会像自动驾驶那么快,每年能进步的幅度不多。”

但总之,行业内的玩家们在人形机器人的预计成熟时间上,达成了基本的一致意见。李卓对光锥智能表示称,“预计行业还有3-5年才能彻底成熟”。

在头部创业者们看来,此时此刻的人形机器人恰如2019年,特斯拉刚推出FSD芯片、百度Apollo刚拿到多张测试牌照的自动驾驶,一切都充满了希望。

一切,都是因为人形机器人在本轮AI大模型的影响下,实现了根本性的改变。

AI进化,机器人更像人

“一个是大语言模型,另一个是端到端算法。”

光轮智能创始人兼CEO谢晨如此总结着本轮机器人进化的最大原因。

在大会现场,无论是人形机器人、机器狗,甚至差异化设计的餐饮机器人都表现出了“更合理”的动作表现。以一年周期为对比,今年大会上的机器人操作明显流畅了许多。

较为明显的例子,可以从机器人做冰淇淋这一简单任务中看出。在去年的世界机器人大会上,机械臂的运动基本上是单调地执行“转圈”。而今年遨博智能的冰激淋机器人动作明显更加流畅,机械臂仅转了一圈,就将冰淇淋接了出来。

2023年(上)和2024年(下)冰淇淋机器人的动作表现对比

2023年(上)和2024年(下)冰淇淋机器人的动作表现对比

不同的动作流畅度,意味着机器人任务执行的底层逻辑发生了改变。

“原先机器人操作设计是模块化的,底层是学习加规则混合的方案。”星海图联合创始人、清华大学交叉信息学院助理教授、MARS Lab主任赵行解释称,“这种模式有点像之前自动驾驶的物体检测-决策-规划-控制的过程。例如做一个抓取策略,之前我们要对物体进行检测、状态和姿态估计。但现实情况的物体大多没什么姿态可言,就像一张纸铺在桌子上,很难定义姿态和关键点。”

这与自动驾驶的发展过程如出一辙。此前的机器人动作规划与自动驾驶发展到“端到端”前,遇到得是同样的问题——在特定场景的开发模式下,只能靠规则写有限的动作,无法适应真实世界的无限场景。

机器人只能操作有限形状和种类的物体,就像是自动驾驶只能在封闭路段使用一样“鸡肋”。而有了“端到端”的机器学习之后,如同汽车能够自己学习如何掉头一样,机器人也能学习如何抓取不同形状、颜色、柔软程度不同的物体。

优必选机器人听指令抓东西

优必选机器人听指令抓东西

参考自动驾驶结合大模型的趋势,机器人在结合了多模态大模型后,也开始能理解现实世界。在现场,银河通用机器人展示的便是药店值班的场景。机器人在拿取货架上的药品之余,看到有东西掉到地上还能自己捡起来。

银河通用机器人演示药店值班场景

AI大模型对于机器人能力提升的重要性,刘聪认为主要体现在三个方面:

首先,大模型显著提升了机器人解决复杂任务的能力,根据理解,把复杂任务拆解成一系列可执行的任务。

接下来,在多模态大模型的能力下,机器人可以依托视觉、触觉等在更复杂地场景里做事。

最后,体现在运动能力上,机器人可以根据AI合成的数据做模拟训练。如果没有大模型,机器人实现的功能会相对受限。

由此也看出,数据是除了大模型技术外,制约机器人下一步进化最关键的要素。

为了获取足够用于机器人训练的数据,不少厂商通过真实数据和仿真数据结合的方式解决。在真实数据的获取中,厂商一般通过真人动作和机器人遥操作的方式,将任务过程中的数据“喂”给大模型。而仿真数据则是通过搭建一个尽量真实的场景,设定尽可能多的建模和现实参数,让虚拟化的机器人进行训练。

不过,上述的两种方式还是存在着各自的短板,当前机器人行业还远未达到数据飞轮的启动时刻。一方面真实数据的成本极高,机器人当前还达不到自动驾驶般的普及度。在真实数据足够多之前,厂商需要花长时间和配备数据标准团队来一点点积累。而对于仿真数据而言,最大的问题还是现实仿真不够真实。机器人在模拟世界能成功,但导入到现实世界就会有一定的失败率。

“现阶段,对机器人行业最大的一个限制,还是AI不太够。AI模型、AI的训练数据集、AI的场景的落地部署,都完全远远不够。”王兴兴称。

而随着AI的发展,赵行预判,“随着更高效的算法和算法的泛化能力提升,未来机器人学习一个技能的数据量将会从现在的几千、几万,下降到一千甚至几百几十的数量级。”

参考自动驾驶行业由量产带来的数据飞轮,为了进一步解决数据问题,不少机器人厂商正在探索从量产中“拿”数据了。

抢销量 人形机器人站在量产前夜

价格,是人形机器人走向量产的一大制约因素。

据光锥智能在世界机器人大会上向各家了解,智元机器人合伙人兼营销服副总裁姜青松称,一台1.7m高的人形机器人行业内售价大概为60-70万。

相比前几年数百万起的波士顿动力,这些价格已经是少数行业能接受的“尝鲜价”,但离大规模普及还非常遥远。

王兴兴称,“现在还没有真正到商业闭环。一台机器人达不到比人还低的成本,商业价值依旧不是正向的。”

这是因为,从研发成本角度,由于人形机器人的不成熟,公司的研发过程会在技术布局、硬件选用、场景设计等环节中设置充分的冗余空间。这导致产品在前期研发成本的分摊下,“背”上了大量除必要硬件之外的“隐性成本”。

而在销售环节结束之后,机器人公司还要继续为应用效果负责。“厂商要为工业应用试点客户,配置专门的驻场团队来进行后续研发和维护”,在大会现场,一位参展商这样告诉光锥智能。

虽然当前的客户需求和产品都非常不标准化,但是光锥智能在大会现场发现,不少厂商已经尝试在不同的需求下,制定了相应的产品策略,试图让机器人的销售更加顺畅。

基本上,光锥智能了解到多家厂商的通用人形机器人售价集中在50-60万元的区间,并搭配廉价的量产版本作为产品线补充。例如,四足机器人销量最高的宇树科技,其通用人形机器人H1售价就定在了50-60万,最新的G1人形智能体也发布了量产版本,售价仅9.9万人民币起。

另一边,众擎机器人的人形机器人销售更加极致,为了降低成本,在拿掉了机器人的“头和双臂”后,众擎DG01干脆把“大双足机器人”的价格干到了3.85万。

这或许意味着,人形机器人的第一轮价格战快要来了。

众擎机器人定价3.85万  光锥智能拍摄

但更大规模的降价,还得依靠量产。

日前,智元机器人预计今年的出货量为200台,已经是行业头部水平。而上一个阶段中,商用清洁机器人的单家出货量也仅在一年千台左右。

什么时候能突破一年万台,甚至十几万台的销量,才是机器人真正的“iPhone时刻”。

为了达到量产目标,头部人形机器人厂商已经把第一个场景瞄向了工厂。

在全球范围,除了特斯拉正在使用的自家机器人Optimus外,OpenAI 投资的Figure已经与宝马合作,计划在美国南卡罗来纳州落地Figure 01机器人。而美国机器人制造商Apptronik则与奔驰合作,Apollo机器人已经在奔驰的流水线上搬箱子了。

在国内,当前落地最快的还是人形机器人唯一一家上市公司优必选。今年以来,优必选的人形机器人已经进入蔚来汽车、东风柳汽、吉利汽车、一汽等多家车企“打工”。随着优必选在经典制造业场景的落地,人形机器人在质检、搬货、分拣、拧螺丝、装配等环节,初步验证了行业应用的可行性。

“目前机器人行业尚在早期,但随着大模型的加持,技术和产品的从0到1,有望在三年内一起突破。”谢晨总结道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/409200.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3 element-plus el-table 多层级表头动态渲染。

效果图: html: <el-table :data"arrlist" border style"width: 100%"><template v-for"(i, index) in currentFieldData" :key"index"><el-table-column :label"i.label" :header-D"i.headerAlign&q…

TCP系列相关内容

一、TCP上传文件 loop——本地回环测试地址。 void *memset&#xff08;void *s,int c,size_t n&#xff09;——给一个变量设定一个值。 1、“粘包”问题 两次分别发送的数据&#xff0c;被一起接收形成该现象。 原因&#xff1a;TCP流式套接字&#xff0c;数据与数据间没…

分布式锁 redis与zookeeper

redis实现分布式锁 原理 基于redis命令setnx key value来实现分布式锁的功能&#xff0c;只有当key不存在时&#xff0c;setnx才可以设置成功并返回1&#xff0c;否则设置失败返回0。 方案1&#xff1a; 方案1存在的问题 假如在加锁成功&#xff0c;释放锁之前&#xff0c;…

飞书怎么关联任意两段话

最近开始用飞书记文档&#xff0c;体验实在是非常的丝滑&#xff0c;对我来说感觉没有找到更好的竞品了。废话不多说&#xff0c;接下来简单介绍一下怎么关联任意两段话吧。 首先说明&#xff0c;关联可以单向&#xff0c;也可以双向。 直接举例。 我想要将蓝字关联到最下面的…

自适应学习率(Datawhale X 李宏毅苹果书 AI夏令营)

传统的梯度下降方法在优化过程中常常面临学习率设置不当的问题。固定的学习率在训练初期可能过大&#xff0c;导致模型训练不稳定&#xff0c;而在后期可能过小&#xff0c;导致训练速度缓慢。为了克服这些问题&#xff0c;自适应学习率方法应运而生。这些方法通过动态调整学习…

微服务通信

目录 一、Feign远程调用 1、Feign简介 2、基本使用 二、Dubbo 1、基本简介 2、基础实现 一、Feign远程调用 先来看我们以前利用RestTemplate发起远程调用的代码&#xff1a; //通过restTemplate调用商品微服务String url "service-product";Product product …

proc文件的写操作机制

“一切皆是文件”。 Linux的基本哲学之一。它是指linux系统中的所有一切都可以通过文件的方式访问、管理&#xff0c;即便不是文件&#xff0c;也以文件的形式来管理。例如硬件设备、进程、套接字等都抽象成文件&#xff0c;使用统一的用户接口&#xff0c;虽然文件类型各不相同…

qt-内置图片遍历-Lambda按钮

内置图片遍历-Lambda按钮 知识点widget.hwidget.cppmain.cpp运行图 知识点 使用新的connect语法连接信号和槽 --Lambda 使用 connect(btn, &QToolButton::clicked, this, [this, btn,index]() { onToolButtonClicked(btn)}); // Lambda表达式中调用成员函数&#xff0c;并…

Springboot打包、部署

一、导入maven打包插件 <build><plugins><plugin><groupId>org.springframework.boot</groupId><artifactId>spring-boot-maven-plugin</artifactId></plugin></plugins> </build> 二、执行打包操作&#xff08;…

基于imx6ull平台opencv的图像采集和显示屏LCD显示功能(不带Qt界面)

目录 一、概述二、环境要求2.1 硬件环境2.2 软件环境 三、开发流程3.1 编写测试3.2 验证功能 一、概述 本文档是针对imx6ull平台opencv的图像采集和显示屏LCD显示功能&#xff0c;opencv通过摄像头采集视频图像&#xff0c;将采集的视频图像送给显示屏LCD进行显示。 测试结果…

【数据结构3】哈希表、哈希表的应用(集合与字典、md5算法和文件的哈希值)

1 哈希表 哈希表一个通过哈希函数来计算数据存 储位置的数据结构&#xff0c;通常支持如下操作: 插入(键&#xff0c;值):插入键值对(键&#xff0c;值) Get(key):如果存在键为键的键值对则返回其值&#xff0c;否则返回空值 删除(键):删除键为键的键值对哈希表(Hash Table&am…

使用kafka改造分布式事务

文章目录 1、kafka确保消息不丢失&#xff1f;1.1、生产者端确保消息不丢失1.2、kafka服务端确保消息不丢失1.3、消费者确保正确无误的消费 2、生产者发送消息 KafkaService3、UserInfoServiceImpl -> login()4、service-account - > AccountListener.java 1、kafka确保消…

Renesa Version Board开发RT-Thread 之UART驱动应用

目录 概述 1 硬件介绍 2 软件配置 2.1 RT-Thread Studio配置参数 2.2 FSP配置MCU 3 RT-Thread中UART的接口介绍 3.1 RT-Thread UART简介 3.2 RT-Thread 下的UART接口 4 UART的应用 4.1 应用功能实现 4.2 源代码文件 5 测试 程序下载地址&#xff1a; RenesaVersio…

应用层协议(上)Http(URL、Cookie、Session)内含逻辑图解通俗易懂!

绪论​ “少年没有乌托邦 心向远方自明朗”&#xff0c;本章是应用层常用且重要的协议htttp&#xff0c;没看过应用层建议一定先看那一篇后再看本章才能更好的去从上到下的理解应用层。 话不多说安全带系好&#xff0c;发车啦&#xff08;建议电脑观看&#xff09;。 1.Http协…

Linux rocky 9.2 安装mysql-8.0.39-linux-glibc2.28-x86_64.tar.xz

数据库官方下载&#xff1a;MySQL :: Download MySQL Community Server 本文也绑定该资源包&#xff0c;免费提供下载学习。 1.系统版本 2.新建目录&#xff0c;存放数据库安装包&#xff0c;并且上传 需要用到的工具&#xff1a;yum -y install vim lrzsz tar 上传解压&…

探索Python交互式编程的新境界:Python-prompt-toolkit的魔法

文章目录 探索Python交互式编程的新境界&#xff1a;Python-prompt-toolkit的魔法背景&#xff1a;为何选择Python-prompt-toolkit&#xff1f;Python-prompt-toolkit是什么&#xff1f;如何安装Python-prompt-toolkit&#xff1f;简单使用&#xff1a;Python-prompt-toolkit的…

C++,std::queue 详解

文章目录 1. 概述2. 包含头文件3. 基本操作3.1 构造函数3.2 赋值操作3.3 成员函数 4. 迭代器5. 示例6. 注意事项参考 1. 概述 std::queue 是 C 标准模板库&#xff08;STL&#xff09;中的一个容器适配器&#xff0c;它提供了一种先进先出&#xff08;FIFO&#xff09;的数据结…

【研发日记】嵌入式处理器技能解锁(五)——TI C2000 DSP的中断系统

文章目录 前言 背景介绍 中断框架 外设中断 ePIE模块 CPU中断 中断嵌套 应用实例 总结 参考资料 前言 见《【研发日记】嵌入式处理器技能解锁(一)——多任务异步执行调度的三种方法》 见《【研发日记】嵌入式处理器技能解锁(二)——TI C2000 DSP的SCI(串口)通信》 见…

基于Java的小区物业管理系统APP的设计与实现(论文+源码)_kaic

摘 要 小区物业管理系统是现代社会中非常热门的软件&#xff0c;伴随着社区规模的不断扩大和住户的不断增多&#xff0c;本系统的主要目的是辞别帐本以及传统的单一数据管理系统&#xff0c;快捷的保存用户各种数据信息。本系统针对Java系统展开&#xff0c;使用Java、SpringB…

无人机RTK定位定向技术详解

无人机RTK&#xff08;Real-Time Kinematic&#xff0c;实时动态差分技术&#xff09;定位定向技术&#xff0c;是无人机领域的一项高精度导航与定位技术。它结合了全球导航卫星系统&#xff08;如GPS、GLONASS、Galileo、BDS等&#xff09;与实时差分技术&#xff0c;通过地面…