什么是具身智能

 具身智能(Embodied Intelligence)是人工智能与机器人学交叉的前沿领域,强调智能体通过身体与环境的动态交互实现自主学习和进化,其核心在于将感知、行动与认知深度融合‌。通俗地讲,就是机器人或者智能系统在物理环境中通过感知、行动和交互实现的智能能力。

具身智能是AI发展与应用的下半场,近期来国家将具身智能作为关键未来产业,各地政府重点发展和培育具身智能这一潜力行业。具身智能等未来产业是经济增长,科技进步的引擎,因此也是各国的竞争高地。

关注具身智能有一段时间了,大模型火了之后更是让具身智能焕发新的生命力,本文主要学习和分享具身智能的相关知识,一起感受它的魅力。

产业概述

具身智能是指通过身体与环境的动态互动,实现对世界的感知、认知和行为控制的智能系统。具身智能的科学立论是真正的理解源于行为实践,通过实际的行动和交互,机器或个体才能深刻地理解和具象化场景与概念。

图片

具身智能架构定义--来源于头豹研究院

“知行合一”是具身智能的核心科学理论,认为只抽象化概念,但并不进行实际 的操作行动,人工智能是无法达到AGI的。

具身智能是指通过身体与环境的动态互动,实现对世界的感知、认知和行为控制的智能系统,它强调智能行为的产生不仅仅依赖于内部处理,而是与身体的能力、感知和动作紧密相关。 

根据具身智能的技术实现逻辑,“知”是建立在“行”之上,只有机器真正的行动才能完全具象化地理解某一个场景。例如,卧室这一概念具备睡觉和休息等行为特征,而人在概念层是无法真正只通过睡觉和休息这一抽象概念去完全理解卧室的场景,只有通过完成坐上椅子,躺在床上等行为任务才能真正地理解卧室场景。同理,人工智能只有真正在行为上实现才能代表它真正地理解了该场景。

具体知识可以追溯至古老的汉字文化中。在中国的甲骨文中,许多字都是通过行为的表征所来刻画的一个概念,比如“关”是两个门要关闭的象形文字。人只有通过关闭东西的动作才能真正理解该文字所要代表的含义,因此,理解行为,实现行为是理解概念及场景的关键,这也是具身智能核心的科学立论。

发展历史

具身智能并不是近几年的概念,只是大模型的崛起加速了具身智能的发展和使得具身智能成为焦点。

具身智能发展历经三大阶段:第一阶段为具身智能概念提出阶段,核心在于哲学概念的思考与讨论;第二阶段为人工智能和机器人控制的技术积累;第三阶段则为大模型为具身之带来的技术范式突破。

图片

具身智能发展历程--来源于头豹研究院

◼ 1950-1990:具身智能概念提出阶段,核心在于哲学思考 

1950年,艾伦·图灵在其论文《Computing Machinery and Intelligence》中首次提出具身智能的概念,随后的40年间,在人工智能领域,众多针对符号主义局限性的思考蔓延,随着“莫拉维克” 悖论理论在学术界得到广泛认同,智能与身体和环境的紧密联系被广泛强调。 

◼ 2000-2019:技术积累与实验室探索阶段 

自二十一世纪初以来,人工智能领域经历了显著的技术突破,尤其是深度学习网络的发展极大地增强了机器在复杂逻辑推理方面的能力。通过结合深度学习和强化学习技术,机器人已能在如物体识别等简单重复的任务中有效运作。此外,人工智能在围棋、象棋等需要高度抽象思维的领域取得了显著进展。尽管在这一阶段机器人尚未达到真正意义上的智能,主要仍限于推导已知信息和执行重复指令,但这些技术进步为实现更高级的具身智能奠定了坚实的基础。 

◼ 2019-2024:人工智能技术深化引领具身智能走向技术突破阶段 

进入2020年代,大规模模型技术的先进发展为具身智能引入了新的技术范式。利用基于Transformer架构的注意力机制,这些大型模型能够将复杂的文本信息转化为向量表示,实现与人类的语音交互的高水平对话。同时,产业界也开始探索将这些先进的大模型与视觉处理技术结合,使得机器人能够通过视觉和语音交互来精确执行具体任务。到了2023年,宇树科技,智元机器人,包括特斯拉和小米在内的科技巨头相继推出了1:1比例的人形机器人,这些机器人能够执行基本的任务规划和操作,展示了具身智能在实际应用中的新里程碑。

图片

具身智能系统框架--来源于IDC

行业现状

◼ 市场情况

具身智能的市场潜力巨大,随着社会经济的发展和人们对智能化生活的需求不断增加,具身智能技术在各个领域的应用前景十分广阔。

在制造业领域,随着智能制造的推进,具身智能机器人将成为实现生产自动化、智能化的关键设备。在服务业领域,具身智能技术的应用将为人们提供更加便捷、高效的服务体验,提升服务效率和质量。在医疗领域,具身智能技术将在手术辅助、康复治疗、护理等方面发挥重要作用,为患者提供更加精准、个性化的医疗服务。

据市场研究机构预测,未来几年全球具身智能市场规模将保持高速增长态势,市场规模有望在未来十年内实现数倍甚至数十倍的增长。在中国,随着制造业转型升级、人口老龄化加剧以及消费升级的推动,具身智能市场需求将持续增长,市场前景极为广阔。

◼ 技术进展

近年来,具身智能技术多点突破,技术上取得迅猛发展。

在感知技术方面,高精度传感器的不断涌现,使得智能体能够更精准地感知环境信息,为智能体的决策提供更丰富的数据支持。新型触觉传感器能够模拟人类皮肤的触觉感受,让智能体在与物体交互时,从而实现更精细的操作。在决策与控制算法上,强化学习和深度学习的融合应用,大幅提升了智能体的自主决策能力。通过大量的训练数据和复杂的环境模拟,智能体能够实现更加智能、灵活的行为控制。在机器人路径规划中,基于强化学习的算法可以使机器人在复杂的环境中快速找到最优路径,同时避开障碍物,提高行动效率。

如今得益于大模型的快速发展,如今具身智能的大脑也越来越聪明,使其在智能化方面越来越强大,未来的机器人将可以极大提高生产力。

◼ 知名企业

具身智能的未来极富想象力,因此国内外多家公司纷纷布局该领域,除了诸如波士顿动力,Figure AI等国外巨头外,国内也诞生了许多明星企业,宇树科技,智元机器人,优必选,众擎机器人等深圳机器人八大金刚。除此之外,许多大厂也跨界造机器人,例如特斯拉,小米和小鹏等公司也布局具身智能,机器人不仅是未来的前景产业,短期内在造车上也能很快体现它的价值。

另外,有一些不造机器人,但是”卖铲子“的企业也在做大蛋糕,例如英伟达不仅是GPU的巨头,更是推出了Project GR00T人形机器人基础模型,Isaac机器人平台和专用芯片等,极大推动了具身智能产业的发展。

图片

具身智能产业链图谱--来源于头豹研究院

未来发展

具身智能不仅是当代新兴科技发展的重要方向,也是一个高潜力的行业市场。未来想要更好发展可以考虑做好以下几点:

◼ 重视研发投入

具身智能对软硬件以及算法都有极高的要求,现在不管是AI还是具身智能都还是初始阶段,现阶段各家企业可以加大研发力度,重视AI大模型技术,相关算法与重点零配件等研发,形成自己独特的竞争优势。同时想办法降低供应链的成本,只有人人用得起,价格不算太贵的机器人市场前景才更好,当然这需要时间。

图片

具身智能关键技术--来源于IDC

◼ 加强产业联合

具身智能行业呈现出蓬勃发展的态势,吸引了大量的企业、资本和人才的涌入。未来可以考虑聚焦于细分市场,以创新的技术和灵活的市场策略,在特定领域取得了独特的竞争优势。

一些专注于农业机器人研发的初创企业,针对农业生产的特点和需求,开发出了具有除草、采摘、灌溉等功能的智能农业机器人,为农业现代化提供了新的解决方案。针对老年人群体,推出保姆型的机器人,提供情感陪伴和生活照料等功能。针对制造业或者危险工种,推出劳作型机器人,可以提高生产效率,除此之外,物流,安保,医疗,服务等行业也是具身智能大展身手的好地方。

随着行业的发展,具身智能的产业生态逐渐形成,产业链上下游企业之间的合作不断加强。从传感器、芯片等核心零部件的研发生产,到机器人本体的制造和系统集成,再到应用场景的开发和运营,各个环节的企业相互协作,共同推动具身智能产业的发展。行业协会、科研机构等也在技术标准制定、人才培养、技术交流等方面发挥着重要作用,为具身智能行业的健康发展提供了有力支持。

◼ 建立业界统一标准

如今市场上的具身智能公司可谓百花齐放,政府的支持与资本的青睐使得具身智能公司成为宠儿,例如热度不减的人形机器人领域近年来涌现出了不同结构形态、不同技术方向的相关产品,为统一人形机器人领域的技术语言,规范人形机器人技术产品的发展路径,也需要定义人形机器人领域相关术语,并对人形机器人领域产品进行分类分级。此外一些技术细节,例如零配件等标准也需建立起来。

同时随着具身智能的广泛应用,其伦理和安全问题也日益受到关注,相关规则也需统一。

另外,数据非常重要,在信息时代数据就是燃料。只有丰富的数据提供给机器人训练,模仿学习,机器人才会越来越聪明。目前业界比较创新的是智元机器人推出了世界上首个大规模高质量机器人学习数据集AgiBot World,AgiBot World配套提供了基准模型、基准测试并构建出一套完整的生态系统,让高质量机器人数据在学术界与工业界都触手可及,具身智能领域的“ImageNet时刻”已经到来!

图片

智元机器人AgiBot World介绍

总结

英伟达创始人黄仁勋曾说过机器人将引领未来产业革命,很可能成为世界上最大的产业。具身智能会是新的技术革命,会使人类社会跨越另一个层次,对此我们不必恐慌,欣然看待,相信带给我们的必是好的影响。

参考资料:

- 头豹研究院

- IDC

- 北京社科院王鹏

                                                    关注一下,后续有更多精彩内容~

图片

                                

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/42688.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java实现pdf中动态插入图片

今天接到一个需求&#xff0c;需要在pdf中的签名处&#xff0c;插入签名照片&#xff0c;但签名位置不固定&#xff0c;话不多说上代码&#xff1a; 1、首先引入itextpdf依赖包&#xff1a; <dependency><groupId>com.itextpdf</groupId><artifactId>…

MySQL8.4 InnoDB Cluster高可用集群使用指南

简介 高可用方案 Orchestrator&#xff1a; 可视化 Web 界面管理 MySQL 拓扑结构&#xff0c;并且兼容多种复制架构&#xff08;异步、半同步、GTID&#xff09;&#xff0c;提供自动和手动的故障转移。但是8.0.21后 MySQL 更新了主从复制相关命令&#xff0c;Orchestrator无…

从泛读到精读:合合信息文档解析如何让大模型更懂复杂文档

从泛读到精读&#xff1a;合合信息文档解析如何让大模型更懂复杂文档 一、引言&#xff1a;破解文档“理解力”瓶颈二、核心功能&#xff1a;合合信息的“破局”亮点功能亮点1&#xff1a;复杂图表的高精度解析图表解析&#xff1a;为大模型装上精准“标尺”表格数据精准还原 功…

git:远程仓库拉取到本地,fork到本地,修改后再上传

讲述仓库成员拉取远程仓库&#xff08;即组长的仓库&#xff0c;里面有成员&#xff09;到本地&#xff0c;修改内容再上传的详细步骤&#xff1a; 1.进入仓库&#xff0c;首先fork &#xff08;如不&#xff0c;所作操作会直接对远程仓库进行&#xff0c;不用管理员审核&…

windows清除电脑开机密码,可保留原本的系统和资料,不重装系统

前言 很久的一台电脑没有使用了&#xff0c;开机密码忘了&#xff0c;进不去系统 方法 1.将一个闲置u盘设置成pe盘&#xff08;注意&#xff0c;这个操作会清空原来u盘的数据&#xff0c;需要在配置前将重要数据转移走&#xff0c;数据无价&#xff0c;别因为配置这个丢了重…

频谱分析仪的最大保持功能

专门应用于例如遥控器之类的&#xff0c;按一下&#xff0c;一瞬间出现的信号的测量。 把仪器连接天线&#xff0c;观测空间中的一些信号&#xff0c;比如WIFI的信号&#xff0c;我们可以看到仪器接收到的信号其实是一直变化的&#xff0c;并不是每一次扫描都能扫到我们想要的这…

智能粉尘监测解决方案|守护工业安全,杜绝爆炸隐患

在厂房轰鸣的生产线上&#xff0c;一粒微小粉尘的聚集可能成为一场灾难的导火索。如何实现粉尘浓度的精准监控与快速响应&#xff1f;我们为您打造了一套"感知-预警-处置"全闭环的智能安全方案&#xff01; 行业痛点&#xff1a;粉尘管理的生死线 在金属加工、化工…

Excel处理控件Aspose.Cells指南:如何在不使用 Microsoft Excel 的情况下解锁 Excel 工作表

Microsoft Excel 允许用户使用密码保护工作表&#xff0c;以防止未经授权的更改。但是&#xff0c;在某些情况下&#xff0c;您可能需要在不使用 Microsoft Excel 的情况下解锁 Excel 工作表。在本指南中&#xff0c;我们将探讨解锁 Excel 工作表的不同方法&#xff0c;例如使用…

音乐webpack(通杀webpack-1)

本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;不提供完整代码&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01; 本文章未经许可…

【stm32--HAL库DMA+USART+空闲中断不定长收发数据】

串口通信-Hal库实现不定长度收发&#xff0c;DMAUSART DMA串口STM32CUBEMX配置&#xff08;工程创建&#xff09;基础配置时钟配置工程配置 代码编写现象 DMA 在正式配置之前&#xff0c;我们先来一起简单了解一下DMA。DMA&#xff08;Direct Memory Access&#xff0c;直接内…

爬虫的第三天——爬动态网页

一、基本概念 动态网页是指网页内容可以根据用户的操作或者预设条件而实时发生变化的网页。 特点&#xff1a; 用户交互&#xff1a;动态网页能够根据用户的请求而生成不同的内容。内容动态生成&#xff1a;数据来自数据库、API或用户输入。客户端动态渲染&#xff1a;浏览器…

【MATLAB例程】三维环境,基于TOA的动态轨迹定位,轨迹使用UKF(无迹卡尔曼滤波)进行滤波,模拟TOA/IMU的数据融合

本代码实现了一个基于到达时间&#xff08;TOA&#xff09;测距的三维定位系统&#xff0c;结合无迹卡尔曼滤波&#xff08;UKF&#xff09;对移动目标的轨迹进行优化。代码通过多锚节点&#xff08;>3&#xff09;的TOA测量数据&#xff0c;先进行初步定位解算&#xff0c;…

旋转变换原理

旋转变换原理 旋转是仿射变换的一种&#xff0c;通过变换矩阵实现图像绕指定中心旋转&#xff0c;保持直线和平行性不变。其数学表示为&#xff1a; 其中&#xff1a; ( c x , c y ) (c_x, c_y) (cx​,cy​) 是旋转中心。 θ \theta θ 是旋转角度&#xff08;逆时针为正&…

【计算机网络】DHCP工作原理

DHCP(动态主机配置协议) Dynamic Host Configuration Protocol 基于UDP协议传输 DHCP分配IP地址的过程 &#xff08;1&#xff09;DHCP DISCOVER客户机请求 IP 地址&#xff1a; 当一个 DHCP 客户机启动时&#xff0c;客户机还没有 IP 地址&#xff0c;所以客户机要通过 DHC…

应用于汽车车灯电路中的电感产品选型及质量管控标准

随着汽车的智能化与电动化发展&#xff0c;汽车车灯系统逐渐从单一照明功能向集成化、智能化和高能效方向演进。汽车车灯的性能关系着行车安全和驾驶体验&#xff0c;而车规级电感器作为车灯驱动电源电路中的核心元件&#xff0c;其性能直接决定了汽车车灯的效率、可靠性及环境…

MinGW下编译ffmpeg源码时生成compile_commands.json

在前面的博文MinGW下编译nginx源码中&#xff0c;有介绍到使用compiledb工具在MinGW环境中生成compile_commands.json&#xff0c;以为compiledb是捕获的make时的输出&#xff0c;而nginx生成时控制台是有输出编译时的命令行信息的&#xff0c;笔者之前编译过ffmpeg的源码&…

JDBC FetchSize不生效,批量变全量致OOM问题分析

背景 一个简单的基于 JDBC 采集数据库表的功能&#xff0c;当采集 Postgre SQL 某表&#xff0c;其数据量达到 500万左右的时候&#xff0c;程序一启动就将 JVM 堆内存「6G」干满了。 问题是程序中使用了游标的只前进配置&#xff0c;且设置了 fetchSize 属性&#xff1a; q…

OpenCV 图形API(或称G-API)

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 引言 OpenCV 图形API&#xff08;或称G-API&#xff09;是一个新的OpenCV模块&#xff0c;旨在使常规图像处理更快且更便携。通过引入一种新的基于图的执行…

注意!ChatGPT 全新 AI 图像功能延迟对免费用户开放

2025 年 3 月 25 日&#xff0c;OpenAI 正式宣布在 ChatGPT 中推出基于 GPT-4o 模型的全新原生图像生成功能。 这一功能允许用户通过对话生成和编辑图像&#xff0c;支持从写实风格到插图风格的多种形式。OpenAI 首席执行官萨姆・奥特曼&#xff08;Sam Altman&#xff09;在社…

方阵幂次(矩阵快速幂)

#include <bits/stdc.h> using namespace std;int n; vector<vector<int>> fuc(vector<vector<int>> a,vector<vector<int>> b){ // 矩阵乘法函数vector<vector<int>> f(n,vector<int>(n));for(int i0;i<n;i){…