《经济参考报》11月8日刊发文章《多方布局人形机器人赛道,智能应用前景广》。文章称,工信部日前印发的《人形机器人创新发展指导意见》,按照谋划三年、展望五年的时间安排,对人形机器人创新发展作了战略部署。
从开发基于人工智能大模型的人形机器人“大脑”,到打造仿人机械臂、灵巧手和腿足,再到发布自主研发的人形机器人产品.以“大模型”为代表的技术爆发加速了人工智能产业的发展。为了抓住这一轮技术变革的浪潮,促进区域以及产业发展,多个一线城市开启了“追逐赛”。以人工智产业发展高地北京为例,《北京市促进通用人工智能创新发展的若干措施(2023-2025年)》的发布是国内首个地方政府紧贴AI大模型产业化发展提出的专项措施。当下正值ChatGPT引发的“千模大战”打响,大模型可能为各行各业带来新的效率革命和体验升级。随着AI第一城北京行动了,上海、深圳、成都等地区都已陆续采取行动,抢占发展的“窗口期”。
人形机器人技术方案包括软件层和硬件层,后者可分为控制模 块、感知模块、运动模块、动力模块、散热总装模块。我们认为软件能力决定机器人产品 力的上限,硬件能力决定机器人的落地程度。目前 ChatGPT 预训练语言模型、PaLM-E 模型等 AI 技术和大模型的发展助力机器人向具身智能逼近,硬件技术方案实际类似搭积木 的过程,核心在于主机厂对成本和性能的权衡。
在今年特斯拉股东大会上,马斯克说到:“人形机器人Optimus对运动和力量的控制以及环境感知方面有显著加强,技术正在快速迭代。预计未来机器人的需求可能会达到100亿,甚至更多。如果以人类和机器人的比例为2:1推算,那么对人形机器人的需求可能会比电动汽车的还大不少。就凭借此寥寥数语,马斯克的信心、热情和投入很快点燃了人形机器人赛道的火焰,并有愈演愈烈的趋势至今。而从实际应用的角度来看,推动整个产业链走向成熟和完善的可能也是特斯拉。
从实际技术的角度来说,特斯拉这种企业做机器人有先天性优势,因为机器人与AI的很多基本原理都是相同的,而且也可以视为电动车的自然延伸,电动车可以视为第一代的四轮机器人。前两年马斯克提出要做机器人时引来不少说他“不务正业”的嘲讽,然而今年年初,理想汽车确定的愿景是成为最优秀的AI和机器人公司,而非全球最大的电动车企业。由此可见梦想也是会传播的。特斯拉的人形机器人Optimus首次亮相是在去年官方的2022 AI Day活动上,并在现场完成了自主行走、转身、停止、挥手问候等动作。Optimus的技术大部分与特斯拉汽车的一致,如机器视觉,以及处理视觉数据、做出行动决策、支持通信交流的“大脑”,还有最重要的与特斯拉汽车一致的芯片,还搭载与特斯拉车辆同源的FSD电脑以及Autopilot相关神经网络技术,预计最终售价不超2万美元,约合14.4万元人民币。
机器人自由度与量产成本为正相关关系,商业化进展较快机器人的共性在于,面向垂直化 场景且匹配了相应的自由度,成本适中能为市场接受。如 EVE 机器人专门用于安防和夜 间巡逻,其腿部为双轮结构,虽无法跨越障碍,但可满足夜间巡逻的基本需求,售价仅 32 万元。而特斯拉 Optimus 则依托汽车产业链优势平衡了机器人自由度与量产成本的矛盾, 能完成行走、上下落体、拿物体等商业化目标明确的动作,而量产后价格仅 2 万美元(目 标),是能完成行走、搬运物体同类机器人产品价格的 1/10。
人形机器人商业化的核心桎梏在于成本,而特斯拉的 FSD 产业 资源优势大概率会为 Optimus 商业化赋能:人形机器人与 FSD 在数据调度、数据处理、 算法模型等关键能力上具有较高共用性,如 Optimus 的硬件生产可共享特斯拉汽车的供应 链;Optimus 软件架构中可应用 FSD 的感知算法、规划控制模型(机器人的规控场景更复 杂),同时机器人涉及室内环境建模,可借鉴 FSD 的 3D 地图构建经验,综上我们认为 FSD 可迁移的成熟的软硬件能力或加速人形机器人商业化落地,具体表现为以下3点:
(1)车端算法迁移:Optimus 搭载特斯拉自研芯片(单芯片算力可达 362TFLOPs),也共享特斯拉汽车自动驾驶软件平台,我们看好特斯拉自身的自动驾驶技术赋能机器人的机器视觉算法、FSD 和 Dojo的数据积累和训练模型加快机器人功能优化,从而实现降本增效。具体而言,算法上,2022 年 AP 团队在原感知算法模型加入了占用网络 Occupancy Network 和矢量地图 Lane Network,进一步提升了感知模型的精度和对 Corner Case 的 覆盖度,Optimus 将会使用和 FSD 同样的 Occupancy Network 来识别可行动区域,或能 生成效果更好的 3D 地图,以弥补特斯拉未使用高精地图和雷达在长尾问题的感知不足。基础设施上,Dojo 超算中心为 FSD 大数据训练的关键,具有高稳定、高并行算力的特征,可提供更高效的数据标注和算法迭代,有望加强机器人的算法优势。
(2)供应链迁移:人形机器人由于硬件超配且关节数目多,量产成本较高,但机器人供 应链与电车供应链有较大重合度,如人形机器人能共用汽车的芯片、电池等,并能够对电 机电器、热管理等做适应性更改再使用。
我们看好 Optimus 与 FSD 供应链接轨、共享特斯拉国产供应链优势,实现规模化降低成本。站在当前时点,我们认为人形机器人已初步突破了软件领域的部分技术桎梏。
22 年 11 月 Open AI 发布 ChatGPT,并计划赋能机器人的零次任务规划、人机交互、视觉辅助、逻辑 判断功能,实现用语言文字控制机器人;23 年 3 月谷歌 PaLM-E 模型推出,融合了 ViT Vision Transformer 的 220 亿参数和 PaLM 的 5400 亿参数能力,集成了可控制机器人视 觉和语言的能力;23 年 5 月英伟达发布多模态具身智能系统 NVIDIA VIMA,标志 AI 能力 的又一显著进步,有望显著提升机器人的智能化水平、人机交互能力、自编译能力。
2023年或为产业化的当打之年:AI、大模型深度赋能机器人感知层和规划层,助力机器人更贴近具身智能。以微软 ChatGPT 预训练语言模型、谷歌 PaLM-E 模型、英伟达多模态具身智能系统 NVIDIA VIMA 为代表的 AI 技术突破,进一步助力机器人突破产品力上限。