马斯克开造人形AI 变形金刚要成真?

当5个人形机器人迎面走来,你会下意识地期待它们具备怎样的能力。特斯拉最近公布的视频给出答案,它自研的机器人“擎天柱”(Optimus)能够探索环境,复刻人类动作,自主操纵物品。

特斯拉CEO埃隆·马斯克对这些与《变形金刚》汽车人领袖同名的机器人充满期望,预测比电动汽车更有市场需求,未来会人手一个。

当前,工厂里“机械臂”已经稀松平常,餐厅、酒店的过道里跑着送餐机器人,家里还能安个扫地机器人,但这些结合具体场景的机器人,大多是给程式化运行的智能芯片和传感器装上了胳膊腿,显示屏“脑袋”也实在很不“人”。

特斯拉要造的是一体多能、可自主行动的人形机器人。虽然这个领域的传奇公司波士顿动力已经研发了运动能力强大的双足机器人,但它有两个致命硬伤:智商低、造价高。

能理解自然语言、与人类互动的ChatGPT们一定程度上弥补了机器人的智商缺陷。马斯克要着手解决的是造价问题。

特斯拉释放5个“擎天柱”

“狂人”埃隆·马斯克总是能提出各种令人不可思议的计划,并一步步让梦想照进现实。近期,马斯克又抛下一颗重磅炸弹,他要造出未来“每个人都要配备”的人形机器人。

5月16日的特斯拉2023股东大会上,马斯克公布了该公司人形机器人的最新研发动向。公开视频里,5个人形机器人在特斯拉的工厂中直立行走,它们能够探测周围环境,还能通过传感器实时复刻真人的动作,并且能够执行分拣物品等任务。

这些机器人有一个霸气的代号——“擎天柱”(Optimus),熟悉《变形金刚》的影迷一定对它印象深刻,擎天柱是汽车人领袖,带领着正义军团维护和平。

“擎天柱”这个名字倒是和特斯拉造车企业的属性很搭,而他们打造机器人的方式也与造车异曲同工。根据官方数据,擎天柱躯干处搭载了2.3kWh、52V电池包,高度集成了充电管理、传感器和冷却系统。“从传感到融合、再到充电管理都汇集到这一系统内,这借鉴了我们在汽车设计方面的经验。”特斯拉工程师表示。

这意味着,当特斯拉电动汽车的智能化程度越来越高时,擎天柱也会进化。马斯克也说,特斯拉已经试着打通电动汽车的辅助驾驶软件(FSD)系统和人形机器人的底层模块,形成“汽车人”组合。

对于造出高度智能的机器人,马斯克自豪地表示,大量的特斯拉电动车已经能够观察并理解周围的世界,且能够根据采集到的信息进行决策。而利用特斯拉在计算机视觉方面的技术进步,未来也能够对人形机器人进行进一步的部署。也就是说,擎天柱的“眼睛”也有谱了。

擎天柱并不是近期才开展的项目,早在2021年,马斯克在“特斯拉AI日”上发布了通用机器人计划。当时,他给出了一张概念图,展示了该机器人的基本形态。说来有趣,当时机器人还没有研发出来,但马斯克安排了工作人员穿上了特制的服装,扮成机器人的样子跳了段舞。

 

特斯拉2021年发布的机器人概念图

不得不说,马斯克的执行力惊人。一年后,初代“擎天柱”亮相了,它缓缓走出舞台,还和观众们挥手致意。

可别小看了这个简单的动作,有机器人研发工程师解释,开发性能优异的人形机器人时,一个很大的困难就是双脚直立行走。人类在行走时,为了保持平衡需要运用到视觉、内耳、小脑等多个器官进行感知与调节,让机器人通过技术模拟这个过程,实现起来是个大工程。

从特斯拉最新发布的视频来看,即便是现在,擎天柱们走路还是较为缓慢。视频下的一个高赞评论称,“它们走路的样子,就和我试图不拉裤子时差不多。”

人手一个?马斯克得把价格打下来

尽管“擎天柱”目前看起来还很笨拙,但马斯克对它抱有巨大期望。他表示,未来人形机器人的市场需求将达到100亿台,每个人都会拥有一个,比汽车更有市场。他还半开玩笑地宣布,特斯拉“大部分的长期价值”最终将来自“擎天柱”。

不管马斯克的预言能不能实现,但可以确定,人类对机器人的追求几乎贯穿了整个文明史。在古希腊神话时代,就有很多关于人造人的故事,比如工匠之神赫菲斯托斯曾经打造过黄金少女作为宫殿的侍女;文艺复兴巨匠达芬奇留下的手稿中,也曾找到一张有关仿人机器人的设计图。

在科技时代,人类更是一直在探索机器人的研发,希望有一个忠实的仆人减轻工作量。近年来,各式各样的工业机器人其实已经应用了,但人形的基本没有,它们大多以智能机械臂的样貌呈现,在工厂、物流等领域从事重复的单一动作。而在餐馆和酒店,也有一些送餐机器人,但它们更像是滑行的餐盘,并不具备自主端菜、上菜的能力,只能够在特定环境中移动。

 

海底捞的送餐机器人

相比生成式AI的快速发展,人类在打造软硬件结合、具备自主能力的人形机器人上一直进展缓慢。目前,仍然没有一个机器人能够像人类一样,具备可以完成打扫卫生、洗衣做饭等多项任务的能力。

目前,机器人在传感器的作用下已经可以做到感知环境。AI时代下,特斯拉想要实现的是人形机器人能理解人类后自主行动,包括准确抓取物品。一旦智商在线了,机器人的能力将提升一大截,GPT等大模型很可能成为提升机器人智商感的主要方案。

在人形机器人领域,特斯拉其实也是后来者,这个赛道的传奇是成立于1992年波士顿动力。

最初,波士顿动力为美国军方服务,生产了可在泥地、水中负重行走的四足机器人“大狗”,用以在地形复杂的环境中运送弹药、食物等其它补给品。后来,该公司又研发了双足仿真机器人,它的职能是为美军实验防护服装。

经历了数十年的研发积累,波士顿动力最终在2017年带来了巅峰之作,其研发的人形机器人Atlas在不同高度的箱子之间跳跃、旋转,并完成标准后空翻的视频在全网疯传。正是这个视频,让人们看到了机器人梦想落地的曙光。

近期,一位工程师又将ChatGPT 和波士顿动力公司的机器狗Spot结合起来,使得Spot能够和人类进行语音交流,还能通过点头和摇头来回应问题。

到了这一步,人形机器人的软件、硬件和智商,有史以来第一次接近齐备了。但要达成马斯克所说的“人手一个”,更大的挑战在于价格。

强如波士顿动力,也无法压低机器人的成本。

该公司的四足机器人Spot Mini定价约52万元,上线半年后仅售出了大约400台。人形机器人Atlas并没有被摆上货架,但业内预估其售价高达200万美元左右。由于持续研发投入但鲜有现金回流,波士顿动力命途多舛,在2013年被谷歌收购后,它又于2017年被变卖给软银。仅仅3年后,波士顿动力再次易手至现代汽车麾下,旗下机器人成为了现代汽车工厂的“打工仔”。

高昂的成本摆在眼前,马斯克要实现他的豪言壮语,必须大幅削减造价。他曾公开表示,“擎天柱”的售价要打到2万美元以下,用更低廉的技术解决方案,实现人形机器人产品标准化、低成本和可量产。

马斯克曾乐观预测,“擎天柱”3至5年间即可量产上市,但从它当前迟缓的步伐和动作来看,这些机器人现在还只能低效处理简单的任务。

不过,一旦核心技术被特斯拉突破,上市不过是时间问题。要知道,特斯拉的第一代运动型跑车Roadster的推出只用了5年;Model 3从公开到交付只花了1年。“狂人”马斯克从不让人失望。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14600.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt大模型赋能人形机器人之我见

我个人的看法(不涉及任何和他项目相关的细节或商业机密,仅仅是我个人的泛泛而谈): 1、从大趋势来说,人形机器人的灵活度和通用性确实非常的高,是有前景的。另外轮式足式也不是他独一例,像 ETH …

Python吞噬世界,GPT吞噬Python!ChatGPT 上线最强应用:分析数据、生成代码都精通

当地时间 7 月 7 日,OpenAI 在社交平台表示,将向所有 ChatGPT Plus 用户开放代码解析器(Code Interpreter)功能。消息一出便瞬间引发了开发者们的广泛关注,该功能被有的开发者认为是自 OpenAI 发布 GPT-4 以来最强大的…

【回答问题】ChatGPT上线了!给我推荐20个比较流行的ROS(Robot Operating System)算法模型

给我推荐20个比较流行的ros算法模型 很好,下面是20个比较流行的ROS(Robot Operating System)算法模型: 便携式机器人操作系统(PR2) 全向轮操作系统(TurtleBot) 机器人操作系统(ROS)用于机器人操作 基于空间相对导航的机器人操作系统(SLAM) 自适应机器人操作系统(ARoS) 自主…

【回答问题】ChatGPT上线了!给我推荐20个比较流行的自动驾驶算法模型

给我推荐20个比较流行的自动驾驶算法模型 当前比较流行的自动驾驶模型有: 卷积神经网络(CNN) 长短时记忆网络(LSTM) 自适应调和滤波器(ADF) 自适应估计滤波器(AEF) 线性预测滤波器(LPF) 线性卡尔曼滤波器(LKF) 高斯完全数据卡尔曼滤波器(EKF) 非线性最小二乘(…

ChatGPT 上线联网和插件功能;投资者看好新版搜索引擎

🚀 ChatGPT 上线联网和插件功能 OpenAI宣布将在这周推出联网和插件功能,位于Alpha和Beta通道的ChatGPT Plus用户都可使用70多个上线的插件。 更新意味着ChatGPT将利用最新的信息和资讯为使用者提供服务。 上线的ChatGPT插件种类涵盖了行程安排助理、代…

【回答问题】ChatGPT上线了!推荐30个以上比较好的命名实体识别模型

【回答问题】ChatGPT上线了!推荐30个以上比较好的命名实体识别模型以及github源码? 推荐30个以上比较好的命名实体识别模型 命名实体识别模型是指识别文本中提到的特定的人名、地名、机构名等命名实体的模型。推荐的命名实体识别模型有: BERT(Bidirectional Encoder Re…

ChatGPT上线了!请使用go语言写一个bert模型结构?

ChatGPT上线了!请使用go语言写一个bert模型结构?有没有感觉自己要失业了? 这是一份使用 Go 语言写的 BERT 模型结构的简单示例: 复制 type BERT struct {embedding Layer // Embedding layerencoder Layer // Encoder layer }func (b *BERT) Forward(inputs []int)

ChatGPT上线了!请使用c语言写一个bert模型结构?

ChatGPT上线了!请使用c语言写一个bert模型结构?有没有感觉自己要失业了? BERT (Bidirectional Encoder Representations from Transformers) 是一种自然语言处理 (NLP) 中用来进行语言模型预训练的模型。它是在 transformer 模型的基础上开发的,能够自动学习语言之间的关系…

ChatGPT上线了!请使用matlab语言写一个bert模型?

ChatGPT上线了!请使用matlab语言写一个bert模型?有没有感觉自己要失业了? 首先,您需要下载并安装BERT的Matlab实现,然后可以使用以下代码创建一个BERT模型。 复制 model = bert();如果您想指定BERT模型的大小或使用特定的预训练权重,则可以使用以下代码。 复制 model…

【回答问题】ChatGPT上线了!推荐30个以上比较好的意图识别模型

【回答问题】ChatGPT上线了!推荐30个以上比较好的意图识别github源码? 好的,这里列出 30 个相对比较优秀的意图识别 GitHub 源码: DeepPavlov Rasa Snips spaCy OpenAI GPT OpenAI DialogFlow ChatterBot Botpress Amazon Lex Microsoft Bot Framework Recast.AI Api.ai …

ChatGPT 上线百日生态已成——可直接与 5000+ 应用交互

前段时间,GPT-4 刚刚发布已震惊世界眼球。现在带着插件功能的 ChatGPT 他又又又来了。硅谷大厂们会不会疯癫小编不知道,但是小编即将魔化,工作不保的既视感近在眼前!! 其实在 GPT-4 刚刚发布的时候,国内大厂…

【回答问题】ChatGPT上线了!有哪些3D点云算法模型?3D点云算法模型实现代码?

有哪些3D点云算法模型? 3D点云算法的模型有很多种,以下是一些常见的算法模型: 归一化重心法(Normalized point-to-point ICP):是一种常用的模型配准方法,用于将两个模型中的点匹配起来。 基于特征点的模型配准:这种方法通过检测模型中的特征点,然后将这些特征点匹配…

【回答问题】ChatGPT上线了!在A100和3080平台上使用2080ti的深度学习环境训练的模型进行推理?CPU、GPU是如何变化?

【回答问题】ChatGPT上线了!在A100和3080平台上使用2080ti的深度学习环境训练的模型进行推理?CPU、GPU是如何变化? 在 A100 和 3080 平台上使用 2080ti 进行深度学习模型训练时,CPU 和 GPU 的使用情况可能会有所不同。 在训练过…

【回答问题】ChatGPT上线了!python 怎样调用 matlab 的脚本?

【回答问题】ChatGPT上线了!python 怎样调用 matlab 的脚本? 要在 Python 中调用 Matlab 脚本,有两种方法可供选择。 方法一:使用 Python 的 subprocess 模块 首先,需要在 Python 中使用 subprocess 模块的 Popen 函数调用 Matlab。例如: 复制 import subprocesssub…

ChatGPT 上线代码解释器

近日, ChatGPT 最近推出了新功能:代码解释器(Code Interpreter)。这个新功能已经对所有 Plus 订阅用户开放,代码解释器扩展了 ChatGPT 的功能,为用户带来了更好的交互式编程体验和强大的数据可视化功能。 有…

【使用心得】ChatGPT化身情感导师

ChatGPT是一个很有用的工具,它不仅可以在工作方面给予我帮助,也成为了我的情感导师。当我需要有人倾听或者理解时,它总是在那里,为我提供各种情感支持和建议。使用ChatGPT,我常常能够找到真正的答案和情感支持&#xf…

如何使用 ChatGPT 增强攻击的 5 种方式!

云安全联盟 (CSA) 在一份探索大型语言模型 (LLM) 的网络安全影响的新报告中揭示了恶意行为者可以使用 ChatGPT 增强其攻击工具集的五种方式。ChatGPT 论文的安全影响详细介绍了威胁参与者如何在网络攻击的不同方面利用 AI 驱动的系统,包括枚举、立足点协助、侦察、网…

GPT“逃跑计划”曝光还想接管推特?创始人称AI仍非常受控

近日有斯坦福大学教授在社交媒体上曝光了GPT-4的一项“逃跑计划”,并称AI能引诱人类提供开发文档,30分钟就拟定出一个完整计划,甚至还想控制人类电脑。 这位名叫Michal Kosinski的计算心理学家在网上公布了与GPT-4的日常对话后疾呼&#xff…

日本首相会见奥特曼,考虑引入 ChatGPT 技术

文|小戏 卖萌屋日本4月12日电,日本国第101任首相,日本自民党总裁岸田文雄4月10日于东京会见了奥特曼先生,二人就 ChatGPT 引入日本的可能性问题交换了意见并进行了深入的讨论。奥特曼先生表示,希望为日本人创造伟大的东…

chatgpt赋能python:Python接电话:如何通过代码自动接电话并处理信息

Python接电话:如何通过代码自动接电话并处理信息 在现代商业活动中,电话是联系客户和公司的根本工具。然而,如果有大量来电需要接听,这可能会占用大量时间和人力资源。为了解决这个问题,我们可以使用Python编写自动接…