达闼GDC 2023全球开发者大会重磅发布海睿AGI平台,共建具身智能新生态!

4d5e0a34198a16a4a868a958c3a977d5.gif

近年来,人形机器人赛道上,波士顿动力、特斯拉、达闼等各家企业不断展示最新成果,让人们看到了机器人行业蓬勃的生命力。

近日,机器人概念再一次被引爆。

聚焦“共建具身通用人工智能新生态”,全球领先的智能机器人独角兽企业达闼机器人公司在GDC 2023全球开发者大会上,正式发布海睿OS 5.1和支持多GPT服务的通用人工智能平台“海睿AGI平台”,这种结合GPT技术、算力更为集中且高效的“云-网-端”模式,代表了全球智能机器人技术演进的一种全新架构,赋予了人形机器人大规模商业化落地的可行性,“云-网-端”的技术架构将推动机器人产业向智能化、自动化加速迈进。

1b933b8972ccb3773951526283e0b8b8.png

无独有偶,英伟达创始人黄仁勋在ITFWorld 2023半导体大会上提出,AI下一个浪潮将是“具身智能”,与人形机器人密不可分的“具身智能”概念刷屏网络。

具身智能这个概念其实由来已久,它是人工智能的一个研究方向。“具身智能”意指有身体并支持物理交互的智能体,智能并不只是存在于思考和决策的过程中,还体现在与环境的交互和探索中,强调物理身体在智能行为中的重要性。智能不仅仅是关于思考和解决问题,还包括了感知环境和在物理世界中采取行动的能力。

2015年,致力于成为机器人服务运营商的达闼在创立之初就看到了这个概念蕴含的重大意义,那个时候所谓的具身智能概念还被叫做embodiment 。

当时,达闼创始人兼CEO黄晓庆就预见到,人工智能+机器人是实现机器人产业智能化发展和商业化落地的路径,并提出,未来的机器人一定会是一种基于“云(云端大脑)、网(安全网络)和端(机器人终端)”架构的技术体系。这种架构是一个通用云端机器人基础平台,可以支撑所有人形智能机器人的操作系统。

ffa60995ddf8c71a36f1395ff055e813.png

17b8f623f2947e4db9cda87e260af84f.png

GPT引发的云端“大脑”变革

达闼在创业初期提出的人工智能+5G+机器人概念过于超前,在发展中遇到了三个瓶颈,一个是AI智能化瓶颈,一个是信息传输瓶颈,还有一个则是机器人硬件的瓶颈。

然而,达闼始终坚信第一性原理,在机器人领域不断深耕。从“功能”到“智能”,从概念试点到全面普及,达闼终于迎来了机器人行业市场爆发的拐点。在通用人工智能、5G网络、机器人关节、新型传感器、新材料等多个领域先进技术的支持之下,尤其是去年年底OpenAI的突破性ChatGPT的持续爆火,达闼对具身智能的超前预判已经照进现实。

达闼“云端大脑”架构曾经最引人争议的智能化问题,已不再是瓶颈。当前以GPT技术为代表的多模态大模型技术,已经很大程度上契合了人形机器人的决策需求的要素。视觉大模型(VLM)已经能赋能人形机器人识别更精确,场景更通用,而通用语言、环境感知能力(ChatGPT)则是自动化决策的基础,融合多模态大模型使得类人智能通用机器人(GPR)变为可能。

同时,借助5G和云端技术,将会对于机器人芯片、视觉等硬件和架构都会带来极大的精简,减少了机器人开发难题,且更容易突破算力瓶颈。再加上达闼自主研发生产的智能柔性关节SCA等自主化硬件,可以让机器人模型快速迁移,有望构建有史以来最大的机器人数据飞轮,通用多模态大模型的All in One的多任务训练方案能使得机器人更好适应人类生活场景。

达闼持续打造的云端机器人全栈技术体系,以及在智能机器人领域的前瞻性探索和实践获得了上级政府机构和产业界的大力支持。2022年7月,国家科技部正式批复支持达闼机器人建设“云端机器人国家新一代人工智能开放创新平台”,这也是中国第一家,也是目前唯一一个国家级的新一代人工智能云端机器人开放创新平台,这意味着达闼的理念和战略布局,已经得到了国家层面的支持以及国际产业界的认可。

891f6bbadd6e0ccc3e325ee58b6e7469.png

站在这个维度,我们再次审视GPT引发大模型革命所带来的价值,会非常认同达闼在GDC 2023全球开发者大会上所提到的一个观点,也难免为之激动不已:AlphaGo是人工智能的第1颗原子弹,而GPT技术毫无疑问就是氢弹,是人类启动第四次工业革命的钥匙。一个“AI+5G+机器人”的的新时代也即将随之开启。

781e4c84051ae328cfce5a3de95862fc.png

RobotGPT带来了哪些改变

在达闼GDC 2023全球开发者大会上,我们注意到达闼创新性地提到一个词:RobotGPT。

如同GPT技术用于chat方向,RobotGPT是将Robot与GPT技术融合的一个新领域,也构成了海睿AGI平台的运作内核。

正如笔记本电脑借助Windows,手机借助安卓快速实现了普及,机器人作为GPT最佳应用及商业平台,借助云端通用性、多模态去完成各种任务,同时打破载体数量限制,以一种更加高效、智能的方式赋能机器人产业生态发展,这无疑是一项颠覆性技术路径变革,或将彻底改变机器人作业的模式。

这或许是继中国在错失Windows、安卓后,基于机器人这个新载体站在全球科技创新和行业引领第一梯队的一次全新机遇。

海睿AGI平台如同于如今的计算机操作系统和应用开发环境,它能借助GPT技术,在机器人领域构建了一个Windows、Android的开发环境和生态,让在里面开发应用的人有工具可用,让开发完应用的人有地方可以变现,从而形成了一种机器人领域的新生态。

其次,云端大脑操作系统的作用也非常明显。一个简单的应用案例就是,达闼这套“云网端”全栈式运营模式,能让多台机器人共享一个大脑,实现“多机器人协同作业”能力。或者一台连接上云端的机器人,能凭借自身具备的智能处理能力和与物理世界互动能力完成多种类工作,从而大幅度减少人类人力资源投入,降低生产成本,提升社会劳动生产力。

借助海睿OS 5.1,云端机器人可以控制一个家庭单位中的多台机器人,实现一台机器人由单任务,向多步骤、复杂任务的执行,但算力要求更小、成本更低、协作效能更高。这将帮助机器人以更快速、更具效率的方式完成一次自动化、精确化、高效化和智能化工作方式的演进变革。

从整个流程以及结果来看,当机器人具备了感知和认知能力后,面对例如家庭这种外部环境和任务较为复杂的非结构化环境,可以从云端获取算力,像人类一样做出最优决策,规划出实现预期目标所需活动的过程,并计划出机器人一系列的执行动作,调用各类模块,以动作累积成本最小化为原则来调动多台机器人执行,从而也有望快速进入商业化的飞跃时代,就此彻底改变未来人类生活。

目前,达闼已经构建了超过3700个机器人技能和数据,对于机器人应用开发人员,可以通过机器人技能商店HARIX RSS(Robot Skill Store)下载开发机器人应用的技能和数据等各种资源,进一步加快对于机器人落地的研发。

达闼也看到,机器人在各类环境中的应用,回归到执行层面则大多都是独立的模块化软硬件。作为机器人行业里为数不多像特斯拉一样具备软硬件全栈开发和运营能力的企业,目前达闼也尝试布局上下游,以一种软硬件结合的形式,去构建更理想的机器人应用环境。

例如在硬件上,达闼自主研发的智能柔性关节,能够很好应用于多关节机器人,一定程度上解决了零部件卡脖子问题。同时,据机器人大讲堂了解,达闼还布局了传感器、CPU、通信、5G、新材料等领域,未来有望加快机器人硬件的全栈式开发。

可以预见,未来的机器人像手机行业一样,将会形成一个整体的多产业链集成,目前,已有数百家机器人、医疗、科研等合作伙伴加入达闼SCA生态建设。

作为行业领先者,达闼的全栈产业体系也得到了上海市的大力支持,达闼于2021年获批上海市战略性新兴产业项目,为该专项设立以来支持力度最大的项目。

01c27b49ea7aa20829df7d663ba0072a.png

海睿AGI背后更多细节解析

从技术特性上来看,达闼对于海睿AGI主要透露出两个信息量巨大的细节:

(1)海睿AGI平台作为应用及商业平台,可支持多GPT大模型

(2)海睿AGI平台提供从数字孪生构建、仿真、训练、开发、运营全要素工具链

由于机器人要更好完成工作,首先要像人一样能通过视觉、听觉、触觉等基本能力感知世界,还需要能通过海量信息所学的知识,理解意图,利用长思维链推理能力认知世界。这种实践性学习方法与旁观性学习方法的不同点在于,主要借助主动感知或者执行任务的方法来感知世界,对世界进行建模,增强对世界的认知和锻炼行动能力。

因此,通过海睿AGI这个理想的数据生成和训练平台,用户能更容易结合数字孪生、元宇宙、5G神经网络等核心技术,帮助机器人通过数字孪生产生大量的训练数据。这意味着RobotGPT毫无疑问开辟出了另外一条更加低成本且高效率的技术路径,使得机器人可以更好地理解环境,处理人类的语言、情感和行为,更好地与人类进行协作共融。

海睿AGI平台也可以是一个理想的数据生成和训练平台,用户还可根据需要基于已提供的大模型进行调优,借助海睿AGI平台从头训练自己的大模型,对数据进行清洗、除伪和精挑细选,实现一种更智能化的RobotGPT状态,这相当于让一群专家站在机器人后面当参谋,大幅提高机器人的智能化运算。

2ff5692bbaafd8a5f85cedaf03b95c1d.png

按照达闼的规划,后续结合实际用户场景,用户还可以形成个性化、定制化的大模型,有望集成出更惊人的AGI 能力,帮助提高问题处理效率,也可以帮助机器人快速提供具身智能需具备的“感知、认知、决策、执行”能力。

目前,作为机器人大脑的GPT技术研发,国内正处于全球第二梯队,在GPT技术与机器人结合的领域,达闼目前布局较早,已经拥有较多的算法专家且形成一定的技术资源优势。但由于全球大模型的开发和优化仍然在不断进行中,对于GPT+机器人的开发领域参与者依然非常少,同时由于各大企业为了争夺GPT技术的数据量而选择各自为战且数据库都大多保密,这也导致了在GPT与机器人结合的领域中成果非常稀缺。

例如目前国际和国内的GPT模型都无法有效地支持机器人的多模态行为控制,其核心原因是缺乏有效数据。而人形机器人通用行为控制,需要一个大模型服务开发平台、共性技术服务平台,从而形成较为完善的超算环境及软件生态,因此达闼正将早期提出的建立海睿OS联盟的必要性提上日程。

据悉,达闼已携手产业合作伙伴共同发起共建共享GPT联盟,为参与联盟的企业与机构提供一个互利互助的平台。该平台未来将通过共享算力、资源和技术,使得各成员单位在技术研发、应用推广、资源共享等方面整合优势资源,共同研发和推广GPT技术,探索人工智能技术在各个领域的潜力,让开发者、使用者更容易挖掘机器人应用,为社会带来更多的创新和进步。

fa20d6f8eb9f5760d66701249e235b47.png

更远的未来

近两年,随着GPT技术的大爆发,全球各大巨头都进入GPT技术领域开始布局,中国也将机器人技术发展提到了至关重要的位置。从“十三五”到“十四五”再到“机器人+”行动计划,以及北京、上海、深圳等地出台的多项政策,都提出支持开展机器人规模化应用,全面助推机器人产业高速发展。在政策端、资本端、市场端的全面关注下,在稳健的内生需求+重大政策推进下,各行业机器人化的产业导向日益明确,机器人行业已经进入大规模商业化前夜。

回顾达闼本次发布会包括生态、开发软件、平台等亮点,我们可以看到,相比于大多数公司只聚焦在某一具体的环节或领域,达闼无论是战略定位,还是业务布局都着眼于全局,充分展现出“开放而自信”的中国高科技企业的领军者姿态。

达闼早在2019年就推出了自主研发和制造的第一台人形智能机器人”小姜”Cloud Ginger,它可以做优美的舞蹈,基本的抓取,基本的运动,她当时的负重能力只有1公斤。2022年9月,在上海世界人工智能大会上亮相的小姜2.0版本,已经有了五公斤的抓取能力,依托7自由度灵巧手,可实现高精度手眼协同抓取和工具操作能力,朝着聪明能干的人形双足机器人“保姆”迈进了关键性的一大步。

0d45dee23ef67fc5c4b345a8936ab0c3.png

根据预测,到2050年全球机器人数量会到一百亿,到2035年中国就有3.1亿老年人,机器人保姆的市场规模到2050年将达到30万亿美元,是今天通讯行业和汽车行业的总和还要多三倍。“机器人服务于人、达闼服务机器人”,黄晓庆表示,达闼的愿景是在2025年推出家庭保姆机器人,这将是人形双足机器人的一个重要应用场景。

达闼将坚持开源、开放、共享理念,有效整合全球的机器人技术、产业链、人才链、基金链等资源,打造一个完整的、世界级的云端机器人产业生态,加速中国机器人市场走向成熟,为人类创造更加智能化、便捷化的生活。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/57866.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

快讯 | 互联网惊现 AI 鬼城:上万个AI发帖聊天,人类不得入内;Spot机器狗集成ChatGPT,实现用语音和人类交流

一分钟速览新闻点 网易 CEO 丁磊:人工智能价值已被引导到生产第一线 中国电信天翼云将发布预训练大模型,目前已进入内部测试阶段 美团无人机上海首条常态化商用航线正式运行 百度文心一言大模型推理成本降为原来的十分之一 互联网惊现 AI 鬼城&#…

机器人视觉梳理(下)

原创 | 文 BFT机器人 03 机器人3D视觉应用案例 1.波士顿动力Atlas Atlas 使用 TOF 深度相机以每秒 15 帧的速度生成环境的点云,点云是测距的大规模集合。Atlas 的感知软件使用一种名为多平面分割的算法从点云中提取平面。多平面分割算法的输入馈入到一个映射系统…

FinTech普惠中国,技术创新智慧杭州

2017中国FinTech大会暨中国FinTech领军企业颁奖盛典 9月10日,“2017中国FinTech大会暨中国FinTech领军企业颁奖盛典”在杭州海外海皇冠大酒店隆重举办。本次大会由科技部现代服务产业联盟、中国FinTech百人会、中国首席技术官联盟联合主办,CCTV证券资讯…

2021第一季度云智能生态技术服务能力盘点

简介:为更好的让大家了解阿里云技术服务人才的能力,阿里云从技术服务培训认证的视角,持续就阿里云生态技术服务能力进行总结和盘点,便于各生态伙伴、云计算技术服务者、开发者了解。2021年第一季度,我们推出特别篇——…

移动互联智慧杭州、技术精英引领中国

2017中国(杭州)移动互联网大会暨中国首席技术官大会正式闭幕。 9月22日,“2017中国(杭州)移动互联网大会暨中国首席技术官大会”在杭州国际博览中心,即G20会场隆重举办。本次大会由中国首席技术官联盟、科…

无人驾驶时代的室外组网技术研究

无人驾驶时代的室外组网技术研究 车载自组网车载自组网简介车载自组网特点车载自组网组成及建构 主流自组网通信方式ZigBeeWIFIBlue ToothWiMAXDSRC4G/5G 参考文献 车载自组网 车辆通信网络就是在汽车上装载移动通信设备,为高速行驶中的车辆提供一种高速率的宽带无…

前加绩中国、信雅达高级全栈工程师:吴劲松

他是一名不甘平凡的开发者,通过自考上了中国科学技术大学的软件工程专业。曾就职过科大讯飞、信雅达、加绩中国等等知名开发公司,精益求精是他的开发理念,刻苦钻研是他的开发精神,坚持学习是他成长的轨迹,他就是本期程…

chatgpt赋能python:如何将Python改成中文

如何将Python改成中文 Python是一种广泛使用的编程语言,但默认情况下是英文界面。对于非英语母语国家的程序员来说,使用Python的过程中可能会遇到许多不方便之处,因此将Python改成中文是很有必要的。本文将介绍如何将Python改成中文&#xf…

chatgpt赋能python:Python创建对话框的完整指南

Python创建对话框的完整指南 Python是一种著名的高级编程语言,它拥有丰富的库和模块。在Python中,我们可以使用GUI(图形用户界面)编写应用程序并与用户交互。在这篇文章中,我们将介绍如何在Python中创建对话框&#x…

Taro 项目实现更改微信头像,使用七牛上传图片

一、效果图 二、taro 提供了选择图片的接口 https://taro-docs.jd.com/taro/docs/apis/media/image/chooseImage // 文档提供的示例 Taro.chooseImage({count: 1, // 默认9sizeType: [original, compressed], // 可以指定是原图还是压缩图,默认二者都有sourceType…

微信8.0内测更新!!!(附内测体验资格)

微信IOS版刚刚正式发布了8.0 在苹果AppStore里面即可下载 微信的大版本更新一直比较看心情 上次7.0版本的更新 还是2018年12月21日 这一次8.0的大更新会有什么功能?! 一起来看看这次更新了哪些新鲜玩意 ???? 01 / 新的开屏动画 02 / 常用表情更新 调…

chatgpt赋能python:Python自动化办公从入门到精通

Python自动化办公从入门到精通 随着科技进步和信息化程度日益提高,自动化办公已经越来越广泛地利用在各行各业中。Python作为一种非常高效和灵活的编程工具,在自动化办公领域也得到了广泛的应用。本文就介绍如何使用Python进行自动化办公,从…

chatgpt赋能python:Python生成图像:从入门到精通

Python生成图像:从入门到精通 Python是一种广泛使用的编程语言,尤其在数据科学和机器学习领域中得到了广泛地应用。该语言的一个强大功能就是能够生成高质量的图像。在这篇文章中,我们将深入探讨Python生成图像的方法。 Matplotlib简介 Ma…

chatgpt赋能python:Python快速上手指南:从入门到精通

Python 快速上手指南:从入门到精通 什么是Python? Python是一种高级编程语言,由Guido van Rossum于1991年开发。它被广泛用于数据科学、人工智能、网络开发、机器学习等领域,因为它易于学习、易于使用、易于阅读和易于维护。Pyt…

chatgpt赋能python:Python游戏开发教程:从入门到精通

Python游戏开发教程:从入门到精通 Python作为一门简单易学且功能强大的编程语言,越来越被广泛应用于游戏开发领域。Python游戏开发不仅可以让你创造有趣的游戏,还可以提高你的编程技能。本文将介绍Python游戏开发的基础知识、工具和技巧&…

chatgpt赋能python:手把手教Python:从入门到精通

手把手教Python:从入门到精通 Python是一种流行的编程语言,它简单易学且有着广泛的应用领域。从自动化脚本编写到数据科学和机器学习,Python都有着无数的应用场景。而在这篇文章中,我们将会从入门到精通手把手教您如何学习Python…

chatgpt赋能python:Python扩展开发:从入门到精通

Python扩展开发:从入门到精通 Python是一门高效、可扩展、易学易用的编程语言。Python的优秀性能在科学计算、数据处理、web开发等领域表现突出。然而,Python在特定的应用场景中,如图像处理和机器学习等领域,需要更高效的代码执行…

chatgpt赋能python:Python构建模型:从入门到精通

Python构建模型:从入门到精通 在数十年的软件开发中,Python一直是最受欢迎的编程语言之一。Python不仅易于入门,而且能够对各种数据科学应用进行建模和分析。在这篇文章中,我们将介绍Python几种常见的构建模型的方法和应用。 为…

python爬取微博热搜数据并保存!

主要用到requests和bf4两个库将获得的信息保存在d://hotsearch.txt下importrequests;importbs4mylist[]rrequests.get(ur… 很多人学习python,不知道从何学起。 很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。 很多已经做案…

文字转语音软件哪个比较好?快来收藏这几个宝藏软件

大家都知道配音是干什么的吧。简单来说,我们今天的有声读物、教学视频、广播促销等都是通过由配音来完成的。当然配音也分人工和软件配音。如果我们觉得自己的声音条件优越,可以选择自己配音。不过如果你们是因为紧张而无法配音的话,就可以使…