特斯拉机器人发布！马斯克：最快明年量产，价格不到14万，搬砖送货都能干...

特斯拉机器人发布！马斯克：最快明年量产，价格不到14万，搬砖送货都能干...

news/2024/11/24 3:18:29/文章来源:https://blog.csdn.net/QbitAI/article/details/127139030

梦晨詹士发自凹非寺
量子位 | 公众号 QbitAI

一年一度特斯拉AI DAY，开场就王炸！

马斯克只用3分钟简短热场，人形机器人擎天柱 （Optimus）直接登台亮相。

不同于去年概念PPT上光滑圆润的外形，今年的擎天柱金属与线缆裸露在外，就像是电影中的终结者。

现场这台擎天柱，展示了稳步行走、转体俯身、挥手与台下观众打招呼。

录像中的一台还真正走入特斯拉办公室，浇花、帮员工搬运快递。

换到汽车工厂，也有模有样地搬起了砖。

然鹅，马斯克表示这还不是擎天柱机器人的完全形态，只是试做版原型机。

舞台大幕再次拉开，更接近最终产品的“带皮肤”机器人也被搬了上来（这台还要几周时间才能才能下地走路）。

早在特斯拉今年第一季度的财报电话会议上，马斯克就曾表示“擎天柱的价值将超过汽车业务，超过FSD”。

今天他更是直言，达到预计数百万量产规模后，机器人每台售价会大大低于汽车，预计低于2万美元。

接下来，马斯克解释了举办这场活动的目的：

用最酷的技术演示，吸引最有才华的工程师，一起把成果量产，帮助千百万人。

在马斯克眼中，自动驾驶的未来可改善人类交通效率至少半个数量级。

而他对人形机器的野心更大，改善经济生产至少两个数量级。

为啥适合来特斯拉干事业？

马斯克认为，特斯拉作为上市公司，如果公众不认可特斯拉所作所为可以用股权投票。

如果我不合适，甚至可以投票把我开除。
我并不能随心所欲，尽管很多人是这么想的。

现场招聘工程师环节结束后，马斯克本人不再是这场发布会的主角。

而是由机器人各个环节的技术负责人轮番上阵，介绍自己的工作成果。

擎天柱一年，有何进展？

去年8月擎天柱概念首次公开，前面看到的开发平台版与今年2月完成，最新一代成果仍在持续改进中。

不变的是对模仿人类的追求，包括身高体重要与人类相仿，全身关节特别是手部高度自由，以及尽量向生物的低能耗靠拢。

最新版本的特斯拉擎天柱，大脑用的是特斯拉SoC芯片，能源靠的是2.3千瓦时电池组，全身28个执行器（Actuator）。另外手部11个自由度，五指可以独立运动。

不过这个“大脑”是装在胸口的，因为这里更安全，同时集中摆放也更省电。

执行器共设计了6种，旋转执行器与线性执行器各3种规格。

线性执行器中最高规格的一款可以提起一台三角钢琴。

这些执行器装配到机器人全身不同关节，还需要做细致的参数调整。

对双足形态机器人来说，行走是行业公认的第一大难关。

行走对人类是毫无难度的一件事，千百万年进化让你无需思考便能自动执行。

但对双足形态机器人来说，想用完全不同于生物的一套材料、靠人为设计去模仿逼近，工程难度可见一斑。

特斯拉工程师介绍，需要关注有四点：

物理上的自我感知，节省能源的步态、保持平衡不摔倒、全身协调运动。

特斯拉的方法与造车流程如出一辙，设计、仿真、验证。

拿膝盖举例，灵感从人类身上来，但因机械结构材料等问题不能完全模仿人类。除了屈膝迈步以外，还要考虑下蹲拣取物体等情况的受力。

结构设计好后，可以先到模拟环境中规划动作。

一旦来到现实世界的复杂性中，还是走不出三步就会倒。

通过传感器测量，将真实世界的复杂性引入训练环境成了解决问题的关键。

最终特斯拉擎天柱也像波士顿动力Atlus一样，反复训练，甚至适应了人类干扰后才学会在步行中保持稳定。

从迈出缓慢第一步到学会用脚趾离地，总共花费6个月。

而手部运动亦是如此流程，先捕捉人类搬箱子时的运动轨迹，再结合机器人自身特点规划。

特斯拉工程师介绍，双电机版特斯拉汽车只需要考虑有限几种速度和路况。

机器人则要完成行走、上台阶、蹲起、转身等更多身体动作，以及从拧螺丝到提重物等多样任务。

据马斯克此前所透露，擎天柱正式生产最早于明年开始，

不过既然是特斯拉AI DAY，除了机器人以外，自动驾驶和自研超算进展也不能少，下面一起来看看。

自动驾驶

自动驾驶作为特斯拉一块招牌，他们的FSD（Beta）用户数在一年内就从2000飙升到16万。

在AI Day现场篇幅自然不小，核心强调更面向复杂场景将技术做深做精。

比如在没有人行横道的路口左转，对面道路有直行车辆行驶，还得面对个把拉着孩子横穿马路的行人，如若让车从行人面前快速通过也会给对方带来惊吓，造成更多难以预判的行为。

特斯拉称，他们加入安全与舒适性等维度分析，通过树搜索算法并提供人类示范，让系统能找到「合适」通过的时机和路线，最终，从横穿马路的行人身后通过。

再比如六个方向的交叉路口，即便车上配8个摄像头，如遇到其他车遮挡，预测难度也不小。

基于种种复杂场景，特斯拉方公布一个详细架构，让各路摄像头信号通过RegNets，却不同摄像头使用不同RegNet，再进入Special attention层，该架构同样适用于车辆、行人行为预测等场景。

视觉路线一直在圈内质疑不断，现场特斯拉以一个案例作为回应。

他们公布了一种通过语义识别预测周边车辆的方式，即便高速路上，前车捡起雪花挡住视线，使摄像头无法「看见」前车，但算法仍能通过语义预测前车的存在并做出适当决策。

此外，为支撑种种复杂场景的模型训练，其全栈式开发平台已能做到每8分钟生产一路算法模型，以1.4万个GPU组成阵列提供计算支持，此外他们还使用了Accelerated Video Library，增加了30%训练速度。

在边缘端，他们还进行了轻量化处理，让系统降低延迟，8个摄像头通过神经网络快速实时识别建筑及不同路面场景，更快完成3D场景生成。

指的一提的是，在今年4月奥斯汀超级工厂开业庆祝活动及Q1财报电话会上，马斯克都提及了不带方向盘和踏板的自动驾驶出租车产品，不少人预测他会在今天聊聊RoboTaxi，但在现场特斯拉并未提及。

芯片与超算

去年AI Day上，特斯拉公布了D1芯片及超级计算机平台DOJO，用以加速自动驾驶模型训练，一时吸引不少眼球——

后续提问中，有人质疑了他们如何将芯片组合并实现高效编译，今年，他们拿出了具体的答案。

首先关于芯片连接上，他们考虑到芯片连接处热膨胀系数(CTE)问题，于是，干脆做了个外部「骨架」将一个个芯片放入其中，底部配备高速记忆模块，搞了个「铁锁连环阵」：

然后整体封装，放进机柜里：

那么一通操作下来成绩如何？

按特斯拉的说法，他们在经典项目RESNET-50上的计算能力击败了A100：

在替代性方面，他们以自动标注为例，宣称4个DOJO机柜可替代72个GPU RACKS：

对未来，他们更是充满自信，认为不仅现在吊打100，到2023年Q1即可实现多倍超越：

在现场，马斯克也强调特斯拉被外部认为是一家自动驾驶和造车公司，但事实远不止于此，他将特斯拉称为前沿人工智能公司，并补充半导体也是技术的一种体现，紧接着他号召更多人才加入公司，画足了技术愿（大）景（饼）。

其实活动之前，马斯克就早早发出预告，称这次活动是为了招募人工智能和机器人工程师/芯片超算工程师，如此看来，种种秀技术肌肉之举，也带着一鱼两吃的盘算。

One More Thing

马斯克本人在今天的活动中戏份并不多，下台后转头就开始高强度网络冲浪

比如宣称未来会有“猫女”版擎天柱机器人。

又或者给网友的梗图点赞。

看了这么多，最后让擎天柱给大家比个心吧。

直播回放：
https://www.youtube.com/watch?v=ODSJsviD_SU

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/70391.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

模型训练系列：1、用清华ChatGLM-6B模型部署自己的本地AI助手

模型训练系列：1、用清华ChatGLM-6B模型部署自己的本地AI助手

最近清华大学开源的ChatGLM-6B语言模型在国际上大出风头，仅仅62亿参数的小模型，能力却很强。很期待他们后续1300亿参数模型130B的发布。为什么一些能力较弱的小模型，这么受追捧？因为ChatGPT、GPT-4虽好，毕竟被国外封锁…

阅读更多...

腾讯云服务器小白保姆级教程

腾讯云服务器小白保姆级教程

现在都是上云服务器，小白拿到一个云服务器怎么办？ 1、选择这里选择的是腾讯云轻量服务器，主要是便宜，另外自己主要是自己练习，对性能什么的也就没有啥要求了。购买云服务器之前要进行实名验证。实名的微信可以和注…

阅读更多...

文科生学大数据分析吃力吗

文科生学大数据分析吃力吗

前段时间来咨询的学员，0基础想报名大大数据分析培训班，但由于自己是文科生，做的是人力资源的工作，所以一直在犹豫该不该转行从事大数据分析行业。文科生可以学大数据分析吗?今天就针对文科生的问题详细的分析一下。在选择大数据…

阅读更多...

文科生比不过理科生，转码IT互联网将成趋势？

文科生比不过理科生，转码IT互联网将成趋势？

今天看到“文科生转码或成趋势”的话题，觉得还是非常有意思哈，所以来聊聊看~ 值得一提的是，虽然现在高中考试改制后，已不再区分文理科生（理化生史地政6选3），但是大学本科及研究生以上&#xff…

阅读更多...

文科妹子都会用 GitHub，你这个工科生还等什么

文科妹子都会用 GitHub，你这个工科生还等什么

在某乎上刷到一条关于 GitHub 的留言，如下： 点赞人数还不少，这说明还真有不少工科生不会用 GitHub，你看大小写都没有区分（手动狗头）。所以我就想写篇文章科普下，“新手如何使用 GitHub&#xff…

阅读更多...

文科生“转码农“风继续理科生慌吗？Phyon最热

文科生“转码农“风继续理科生慌吗？Phyon最热

程序员是一个很热门的职业，至少对于文科生而言，这两年持续“转码农”风在继续，这会不会给理科生们带来压力呢？ 其实，“转码”，即转行成为程序员，由于其高就业率、高薪资而在求职市场上大受欢迎&…

阅读更多...

chatgpt赋能python：Python操作数据库：连接、查询和更新

chatgpt赋能python：Python操作数据库：连接、查询和更新

Python操作数据库：连接、查询和更新在开发Web应用或者处理数据时，操作数据库是必不可少的步骤。Python提供了许多标准库和第三方库来连接和操作数据库，如sqlite3、MySQLdb、psycopg2等。在本文中，我们将介绍如何使用Python连接、…

阅读更多...

AI算力碎片化：矩阵乘法的启示

尽管AI的发展取得了巨大进步，但编译器LLVM之父Chris Lattner认为，AI技术应用并不深入，远远没有发挥出已有机器学习研究的所有潜力。而AI系统和工具的单一化和碎片化正是造成这一问题的根源。为了让AI发挥其真正的潜力，计算碎片化…

阅读更多...

APP后台以及用户数据被泄露该如何防护

APP后台以及用户数据被泄露该如何防护

近期我们接到许多DK平台反馈APP里的用户信息数据被泄露，导致用户经常受到境外香港电话推广骚扰，有些用户甚至被网络诈骗，而且用户当天申请填写表单里的手机号，没过多久就泄露了，紧接着香港电话就会打过来，询…

阅读更多...

ap计算机科学5分率,AP考试5分率及难度分析

ap计算机科学5分率,AP考试5分率及难度分析

2019年的AP报名窗口已经开启，AP选考究竟要注意些什么？如何结合科目难度和自身情况，申请的时候尽可能地凸显的优势呢？今天老师从AP各科的难度和5分率进行分析，让大家了解过往战况，好好制定最适合的选考策略。…

阅读更多...

ALEVEL数学、物理、化学、生物与国内考试的区别

ALEVEL数学、物理、化学、生物与国内考试的区别

A-Level考试中数学、物理、化学、生物是常考热门科目，这些科目在国内高考中也有对应的科目，那么，两者之间有什么区别呢？ 1、A-Level物理与国内高考物理从知识范围广度来看，A-Level物理更胜一筹，涉及的知识…

阅读更多...

PTA L2-046 天梯赛的赛场安排 (25 分)

PTA L2-046 天梯赛的赛场安排 (25 分)

天梯赛使用 OMS 监考系统，需要将参赛队员安排到系统中的虚拟赛场里，并为每个赛场分配一位监考老师。每位监考老师需要联系自己赛场内队员对应的教练们，以便发放比赛账号。为了尽可能减少教练和监考的沟通负担，我们要求赛场的安排满…

阅读更多...

分析数学成绩，尽然我考了0分

分析数学成绩，尽然我考了0分

编程语言:Python 简单的数据分析导入 pygal 废话不多说直接上代码！ import pygal radar_chart pygal.Radar() radar_chart.title 数学考试成绩分析 radar_chart.x_labels [班长, 学委, 体育委员, 学渣, 学霸,我] radar_chart.add(高三(5)班, [86, 96, 69, 49, …

阅读更多...

T06 成绩排序

T06 成绩排序

查找和排序题目：输入任意（用户，成绩）序列，可以获得成绩从高到低或从低到高的排列,相同成绩都按先录入排列在前的规则处理。示例： jack 70 peter 96 Tom 70 smith 67 从高到低成…

阅读更多...

Quick Request使用教程

Quick Request使用教程

一、基本介绍 Quick Request作为IntelliJ IDEA的插件，提供给开发人员更好的调试体验，当前可支持Spring Mvc、Dubbo框架的所有请求，具有简单易用、自动生成请求参数、项目环境管理、历史请求记录、保存请求及快速搜索的特点，下面给…

阅读更多...

python爬虫二十四：js逆向破解(一)

python爬虫二十四：js逆向破解(一)

1、环境搭建通过python代码模拟js去生成加密数据完成数据破解，需要用到PyExecJS模块 ①安装模块pip install pyexecjs通过模块的方法来读取js代码，也可以用js2py(不更新维护了)、selenium(driver.wxecute_script(js代码))去执行js文件，这里…

阅读更多...

关于ref哪怕在$nextTick()中有时候获取不到节点元素的问题。（较为诡异的bug）

关于ref哪怕在$nextTick()中有时候获取不到节点元素的问题。（较为诡异的bug）

我的需求是用element-ui的messagebox，来实现验证码接受的功能。并将cancel按钮换成刷新功能，在beforeClose中实现验证码刷新。元素都是在$msgbox中生成的，下面是最开始出错的核心代码。 let result await this.$API.reqCaptchaImg();this.ca…

阅读更多...

微信小程序实现分页加载，触底加载下一页，滚动加载

微信小程序实现分页加载，触底加载下一页，滚动加载

这里我就不写wxml了，就是一个列表循环，直接看js代码逻辑，注释都写在代码后面了，这个方法可以实现无限滚动加载，直到加载完最后一条数据，也可以实现触底没数据后，二次触底可以从新加载刷新&#…

阅读更多...

某地刑侦大队对涉及6个嫌疑人的一桩疑案进行分析

某地刑侦大队对涉及6个嫌疑人的一桩疑案进行分析

（1）A、B 至少有一人作案； （2）A、E、F 三人中至少有两人参与作案； （3）A、D 不可能是同案犯； （4）B、C 或同时作案，或与本案无关&#xf…

阅读更多...

今天，微软重新发明搜索引擎：首款ChatGPT搜索来了

今天，微软重新发明搜索引擎：首款ChatGPT搜索来了

从现在起，比 ChatGPT 更强大的语言模型直接进入了你的浏览器。一夜之间，全球最大的科技公司仿佛都回到了自己年轻时的样子。在谷歌宣布「实验性对话式人工智能服务」Bard 之后仅 24 小时，北京时间 2 月 8 日凌晨两点，微软发布了…

阅读更多...

最新文章

推荐文章