近年来,人形机器人赛道上,波士顿动力、特斯拉、达闼等各家企业不断展示最新成果,让人们看到了机器人行业蓬勃的生命力。
近日,机器人概念再一次被引爆。
聚焦“共建具身通用人工智能新生态”,全球领先的智能机器人独角兽企业达闼机器人公司在GDC 2023全球开发者大会上,正式发布海睿OS 5.1和支持多GPT服务的通用人工智能平台“海睿AGI平台”,这种结合GPT技术、算力更为集中且高效的“云-网-端”模式,代表了全球智能机器人技术演进的一种全新架构,赋予了人形机器人大规模商业化落地的可行性,“云-网-端”的技术架构将推动机器人产业向智能化、自动化加速迈进。
无独有偶,英伟达创始人黄仁勋在ITFWorld 2023半导体大会上提出,AI下一个浪潮将是“具身智能”,与人形机器人密不可分的“具身智能”概念刷屏网络。
具身智能这个概念其实由来已久,它是人工智能的一个研究方向。“具身智能”意指有身体并支持物理交互的智能体,智能并不只是存在于思考和决策的过程中,还体现在与环境的交互和探索中,强调物理身体在智能行为中的重要性。智能不仅仅是关于思考和解决问题,还包括了感知环境和在物理世界中采取行动的能力。
2015年,致力于成为机器人服务运营商的达闼在创立之初就看到了这个概念蕴含的重大意义,那个时候所谓的具身智能概念还被叫做embodiment 。
当时,达闼创始人兼CEO黄晓庆就预见到,人工智能+机器人是实现机器人产业智能化发展和商业化落地的路径,并提出,未来的机器人一定会是一种基于“云(云端大脑)、网(安全网络)和端(机器人终端)”架构的技术体系。这种架构是一个通用云端机器人基础平台,可以支撑所有人形智能机器人的操作系统。
GPT引发的云端“大脑”变革
达闼在创业初期提出的人工智能+5G+机器人概念过于超前,在发展中遇到了三个瓶颈,一个是AI智能化瓶颈,一个是信息传输瓶颈,还有一个则是机器人硬件的瓶颈。
然而,达闼始终坚信第一性原理,在机器人领域不断深耕。从“功能”到“智能”,从概念试点到全面普及,达闼终于迎来了机器人行业市场爆发的拐点。在通用人工智能、5G网络、机器人关节、新型传感器、新材料等多个领域先进技术的支持之下,尤其是去年年底OpenAI的突破性ChatGPT的持续爆火,达闼对具身智能的超前预判已经照进现实。
达闼“云端大脑”架构曾经最引人争议的智能化问题,已不再是瓶颈。当前以GPT技术为代表的多模态大模型技术,已经很大程度上契合了人形机器人的决策需求的要素。视觉大模型(VLM)已经能赋能人形机器人识别更精确,场景更通用,而通用语言、环境感知能力(ChatGPT)则是自动化决策的基础,融合多模态大模型使得类人智能通用机器人(GPR)变为可能。
同时,借助5G和云端技术,将会对于机器人芯片、视觉等硬件和架构都会带来极大的精简,减少了机器人开发难题,且更容易突破算力瓶颈。再加上达闼自主研发生产的智能柔性关节SCA等自主化硬件,可以让机器人模型快速迁移,有望构建有史以来最大的机器人数据飞轮,通用多模态大模型的All in One的多任务训练方案能使得机器人更好适应人类生活场景。
达闼持续打造的云端机器人全栈技术体系,以及在智能机器人领域的前瞻性探索和实践获得了上级政府机构和产业界的大力支持。2022年7月,国家科技部正式批复支持达闼机器人建设“云端机器人国家新一代人工智能开放创新平台”,这也是中国第一家,也是目前唯一一个国家级的新一代人工智能云端机器人开放创新平台,这意味着达闼的理念和战略布局,已经得到了国家层面的支持以及国际产业界的认可。
站在这个维度,我们再次审视GPT引发大模型革命所带来的价值,会非常认同达闼在GDC 2023全球开发者大会上所提到的一个观点,也难免为之激动不已:AlphaGo是人工智能的第1颗原子弹,而GPT技术毫无疑问就是氢弹,是人类启动第四次工业革命的钥匙。一个“AI+5G+机器人”的的新时代也即将随之开启。
RobotGPT带来了哪些改变
在达闼GDC 2023全球开发者大会上,我们注意到达闼创新性地提到一个词:RobotGPT。
如同GPT技术用于chat方向,RobotGPT是将Robot与GPT技术融合的一个新领域,也构成了海睿AGI平台的运作内核。
正如笔记本电脑借助Windows,手机借助安卓快速实现了普及,机器人作为GPT最佳应用及商业平台,借助云端通用性、多模态去完成各种任务,同时打破载体数量限制,以一种更加高效、智能的方式赋能机器人产业生态发展,这无疑是一项颠覆性技术路径变革,或将彻底改变机器人作业的模式。
这或许是继中国在错失Windows、安卓后,基于机器人这个新载体站在全球科技创新和行业引领第一梯队的一次全新机遇。
海睿AGI平台如同于如今的计算机操作系统和应用开发环境,它能借助GPT技术,在机器人领域构建了一个Windows、Android的开发环境和生态,让在里面开发应用的人有工具可用,让开发完应用的人有地方可以变现,从而形成了一种机器人领域的新生态。
其次,云端大脑操作系统的作用也非常明显。一个简单的应用案例就是,达闼这套“云网端”全栈式运营模式,能让多台机器人共享一个大脑,实现“多机器人协同作业”能力。或者一台连接上云端的机器人,能凭借自身具备的智能处理能力和与物理世界互动能力完成多种类工作,从而大幅度减少人类人力资源投入,降低生产成本,提升社会劳动生产力。
借助海睿OS 5.1,云端机器人可以控制一个家庭单位中的多台机器人,实现一台机器人由单任务,向多步骤、复杂任务的执行,但算力要求更小、成本更低、协作效能更高。这将帮助机器人以更快速、更具效率的方式完成一次自动化、精确化、高效化和智能化工作方式的演进变革。
从整个流程以及结果来看,当机器人具备了感知和认知能力后,面对例如家庭这种外部环境和任务较为复杂的非结构化环境,可以从云端获取算力,像人类一样做出最优决策,规划出实现预期目标所需活动的过程,并计划出机器人一系列的执行动作,调用各类模块,以动作累积成本最小化为原则来调动多台机器人执行,从而也有望快速进入商业化的飞跃时代,就此彻底改变未来人类生活。
目前,达闼已经构建了超过3700个机器人技能和数据,对于机器人应用开发人员,可以通过机器人技能商店HARIX RSS(Robot Skill Store)下载开发机器人应用的技能和数据等各种资源,进一步加快对于机器人落地的研发。
达闼也看到,机器人在各类环境中的应用,回归到执行层面则大多都是独立的模块化软硬件。作为机器人行业里为数不多像特斯拉一样具备软硬件全栈开发和运营能力的企业,目前达闼也尝试布局上下游,以一种软硬件结合的形式,去构建更理想的机器人应用环境。
例如在硬件上,达闼自主研发的智能柔性关节,能够很好应用于多关节机器人,一定程度上解决了零部件卡脖子问题。同时,据机器人大讲堂了解,达闼还布局了传感器、CPU、通信、5G、新材料等领域,未来有望加快机器人硬件的全栈式开发。
可以预见,未来的机器人像手机行业一样,将会形成一个整体的多产业链集成,目前,已有数百家机器人、医疗、科研等合作伙伴加入达闼SCA生态建设。
作为行业领先者,达闼的全栈产业体系也得到了上海市的大力支持,达闼于2021年获批上海市战略性新兴产业项目,为该专项设立以来支持力度最大的项目。
海睿AGI背后更多细节解析
从技术特性上来看,达闼对于海睿AGI主要透露出两个信息量巨大的细节:
(1)海睿AGI平台作为应用及商业平台,可支持多GPT大模型
(2)海睿AGI平台提供从数字孪生构建、仿真、训练、开发、运营全要素工具链
由于机器人要更好完成工作,首先要像人一样能通过视觉、听觉、触觉等基本能力感知世界,还需要能通过海量信息所学的知识,理解意图,利用长思维链推理能力认知世界。这种实践性学习方法与旁观性学习方法的不同点在于,主要借助主动感知或者执行任务的方法来感知世界,对世界进行建模,增强对世界的认知和锻炼行动能力。
因此,通过海睿AGI这个理想的数据生成和训练平台,用户能更容易结合数字孪生、元宇宙、5G神经网络等核心技术,帮助机器人通过数字孪生产生大量的训练数据。这意味着RobotGPT毫无疑问开辟出了另外一条更加低成本且高效率的技术路径,使得机器人可以更好地理解环境,处理人类的语言、情感和行为,更好地与人类进行协作共融。
海睿AGI平台也可以是一个理想的数据生成和训练平台,用户还可根据需要基于已提供的大模型进行调优,借助海睿AGI平台从头训练自己的大模型,对数据进行清洗、除伪和精挑细选,实现一种更智能化的RobotGPT状态,这相当于让一群专家站在机器人后面当参谋,大幅提高机器人的智能化运算。
按照达闼的规划,后续结合实际用户场景,用户还可以形成个性化、定制化的大模型,有望集成出更惊人的AGI 能力,帮助提高问题处理效率,也可以帮助机器人快速提供具身智能需具备的“感知、认知、决策、执行”能力。
目前,作为机器人大脑的GPT技术研发,国内正处于全球第二梯队,在GPT技术与机器人结合的领域,达闼目前布局较早,已经拥有较多的算法专家且形成一定的技术资源优势。但由于全球大模型的开发和优化仍然在不断进行中,对于GPT+机器人的开发领域参与者依然非常少,同时由于各大企业为了争夺GPT技术的数据量而选择各自为战且数据库都大多保密,这也导致了在GPT与机器人结合的领域中成果非常稀缺。
例如目前国际和国内的GPT模型都无法有效地支持机器人的多模态行为控制,其核心原因是缺乏有效数据。而人形机器人通用行为控制,需要一个大模型服务开发平台、共性技术服务平台,从而形成较为完善的超算环境及软件生态,因此达闼正将早期提出的建立海睿OS联盟的必要性提上日程。
据悉,达闼已携手产业合作伙伴共同发起共建共享GPT联盟,为参与联盟的企业与机构提供一个互利互助的平台。该平台未来将通过共享算力、资源和技术,使得各成员单位在技术研发、应用推广、资源共享等方面整合优势资源,共同研发和推广GPT技术,探索人工智能技术在各个领域的潜力,让开发者、使用者更容易挖掘机器人应用,为社会带来更多的创新和进步。
更远的未来
近两年,随着GPT技术的大爆发,全球各大巨头都进入GPT技术领域开始布局,中国也将机器人技术发展提到了至关重要的位置。从“十三五”到“十四五”再到“机器人+”行动计划,以及北京、上海、深圳等地出台的多项政策,都提出支持开展机器人规模化应用,全面助推机器人产业高速发展。在政策端、资本端、市场端的全面关注下,在稳健的内生需求+重大政策推进下,各行业机器人化的产业导向日益明确,机器人行业已经进入大规模商业化前夜。
回顾达闼本次发布会包括生态、开发软件、平台等亮点,我们可以看到,相比于大多数公司只聚焦在某一具体的环节或领域,达闼无论是战略定位,还是业务布局都着眼于全局,充分展现出“开放而自信”的中国高科技企业的领军者姿态。
达闼早在2019年就推出了自主研发和制造的第一台人形智能机器人”小姜”Cloud Ginger,它可以做优美的舞蹈,基本的抓取,基本的运动,她当时的负重能力只有1公斤。2022年9月,在上海世界人工智能大会上亮相的小姜2.0版本,已经有了五公斤的抓取能力,依托7自由度灵巧手,可实现高精度手眼协同抓取和工具操作能力,朝着聪明能干的人形双足机器人“保姆”迈进了关键性的一大步。
根据预测,到2050年全球机器人数量会到一百亿,到2035年中国就有3.1亿老年人,机器人保姆的市场规模到2050年将达到30万亿美元,是今天通讯行业和汽车行业的总和还要多三倍。“机器人服务于人、达闼服务机器人”,黄晓庆表示,达闼的愿景是在2025年推出家庭保姆机器人,这将是人形双足机器人的一个重要应用场景。
达闼将坚持开源、开放、共享理念,有效整合全球的机器人技术、产业链、人才链、基金链等资源,打造一个完整的、世界级的云端机器人产业生态,加速中国机器人市场走向成熟,为人类创造更加智能化、便捷化的生活。