特斯拉机器人发布!马斯克:最快明年量产,价格不到14万,搬砖送货都能干...

梦晨 詹士 发自 凹非寺
量子位 | 公众号 QbitAI

一年一度特斯拉AI DAY, 开场就王炸!

马斯克只用3分钟简短热场,人形机器人擎天柱 (Optimus)直接登台亮相。

d31df40b4379de769c09942203be423f.gif

不同于去年概念PPT上光滑圆润的外形,今年的擎天柱金属与线缆裸露在外,就像是电影中的终结者。

现场这台擎天柱,展示了稳步行走、转体俯身、挥手与台下观众打招呼。

9d5e728f76b1c1aac857fafc37c5d0e7.gif

录像中的一台还真正走入特斯拉办公室,浇花、帮员工搬运快递。

933d4ea413159e4e0309590b07ca784a.gif

换到汽车工厂,也有模有样地搬起了砖。

90ffcd73bd9a3b6a8484387483f7ddd5.gif

然鹅,马斯克表示这还不是擎天柱机器人的完全形态,只是试做版原型机。

舞台大幕再次拉开,更接近最终产品的“带皮肤”机器人也被搬了上来(这台还要几周时间才能才能下地走路)。

091403fa984cee19017c041d1e32d581.gif

早在特斯拉今年第一季度的财报电话会议上,马斯克就曾表示“擎天柱的价值将超过汽车业务,超过FSD”。

今天他更是直言,达到预计数百万量产规模后,机器人每台售价会大大低于汽车,预计低于2万美元。

f2308fa5a3321b7633aa7f09fcbe7114.gif

接下来,马斯克解释了举办这场活动的目的:

用最酷的技术演示,吸引最有才华的工程师,一起把成果量产,帮助千百万人。

在马斯克眼中,自动驾驶的未来可改善人类交通效率至少半个数量级。

而他对人形机器的野心更大,改善经济生产至少两个数量级。

为啥适合来特斯拉干事业?

马斯克认为,特斯拉作为上市公司,如果公众不认可特斯拉所作所为可以用股权投票。

如果我不合适,甚至可以投票把我开除。
我并不能随心所欲,尽管很多人是这么想的。

现场招聘工程师环节结束后,马斯克本人不再是这场发布会的主角。

而是由机器人各个环节的技术负责人轮番上阵,介绍自己的工作成果。

擎天柱一年,有何进展?

5e6709da983435b6105feb8aad20e31e.png

去年8月擎天柱概念首次公开,前面看到的开发平台版与今年2月完成,最新一代成果仍在持续改进中。

不变的是对模仿人类的追求,包括身高体重要与人类相仿,全身关节特别是手部高度自由,以及尽量向生物的低能耗靠拢。

64661c45047fcaa53068528d991fa5e4.png

最新版本的特斯拉擎天柱,大脑用的是特斯拉SoC芯片,能源靠的是2.3千瓦时电池组,全身28个执行器(Actuator)。另外手部11个自由度,五指可以独立运动。

不过这个“大脑”是装在胸口的,因为这里更安全,同时集中摆放也更省电。

00092ad6bcda8e3e6a9710ac71c99da3.png

执行器共设计了6种,旋转执行器与线性执行器各3种规格。

a8a4a62c800b3424fcd6a3788ffc187f.png

线性执行器中最高规格的一款可以提起一台三角钢琴。

786905a47d0fd80b0e703d97d4f84f8e.gif

这些执行器装配到机器人全身不同关节,还需要做细致的参数调整。

对双足形态机器人来说,行走是行业公认的第一大难关。

行走对人类是毫无难度的一件事,千百万年进化让你无需思考便能自动执行。

但对双足形态机器人来说,想用完全不同于生物的一套材料、靠人为设计去模仿逼近,工程难度可见一斑。

特斯拉工程师介绍,需要关注有四点:

物理上的自我感知,节省能源的步态、保持平衡不摔倒、全身协调运动。

99b6404e0460108551e16364b2eb7f98.gif

特斯拉的方法与造车流程如出一辙,设计、仿真、验证

拿膝盖举例,灵感从人类身上来,但因机械结构材料等问题不能完全模仿人类。除了屈膝迈步以外,还要考虑下蹲拣取物体等情况的受力。

85007283d1dc3e69566e63a285cbedae.gif

结构设计好后,可以先到模拟环境中规划动作。

8adaaf404880126585e01076cfeb789d.gif

一旦来到现实世界的复杂性中,还是走不出三步就会倒。

27f31886c67fbfe3d9641d8122515bcf.gif

通过传感器测量,将真实世界的复杂性引入训练环境成了解决问题的关键。

77b5545877a3be6c599a630f67d5a95d.gif

最终特斯拉擎天柱也像波士顿动力Atlus一样,反复训练,甚至适应了人类干扰后才学会在步行中保持稳定。

1f8420d4d74ee86a4fb7b62dd95a7519.gif

从迈出缓慢第一步到学会用脚趾离地,总共花费6个月。

59d6a90f6300239fe4d58ce6a36dac42.gif

而手部运动亦是如此流程,先捕捉人类搬箱子时的运动轨迹,再结合机器人自身特点规划。

925a5d5dd262908ee0fbc3ad1899796c.gif

特斯拉工程师介绍,双电机版特斯拉汽车只需要考虑有限几种速度和路况。

机器人则要完成行走、上台阶、蹲起、转身等更多身体动作,以及从拧螺丝到提重物等多样任务。

680d63955248cbd45253bbf2533c52bc.png

据马斯克此前所透露,擎天柱正式生产最早于明年开始,

不过既然是特斯拉AI DAY,除了机器人以外,自动驾驶和自研超算进展也不能少,下面一起来看看。

自动驾驶

自动驾驶作为特斯拉一块招牌,他们的FSD(Beta)用户数在一年内就从2000飙升到16万。

09ec6b96ebba9716643ffc00f943bf5c.png

在AI Day现场篇幅自然不小,核心强调更面向复杂场景将技术做深做精

比如在没有人行横道的路口左转,对面道路有直行车辆行驶,还得面对个把拉着孩子横穿马路的行人,如若让车从行人面前快速通过也会给对方带来惊吓,造成更多难以预判的行为。

特斯拉称,他们加入安全与舒适性等维度分析,通过树搜索算法并提供人类示范,让系统能找到「合适」通过的时机和路线,最终,从横穿马路的行人身后通过。

2e8773c0f537a2d060f8060d8a803afd.png

再比如六个方向的交叉路口,即便车上配8个摄像头,如遇到其他车遮挡,预测难度也不小。

81859cb39bb16df61eb93a661f0b18fe.png

基于种种复杂场景,特斯拉方公布一个详细架构,让各路摄像头信号通过RegNets,却不同摄像头使用不同RegNet,再进入Special attention层,该架构同样适用于车辆、行人行为预测等场景。

b31cac13b2a3115ba0f9298bb9e0aea1.png

视觉路线一直在圈内质疑不断,现场特斯拉以一个案例作为回应。

他们公布了一种通过语义识别预测周边车辆的方式,即便高速路上,前车捡起雪花挡住视线,使摄像头无法「看见」前车,但算法仍能通过语义预测前车的存在并做出适当决策。

22841bcbd31f3f037dab627eac5f4a03.png

此外,为支撑种种复杂场景的模型训练,其全栈式开发平台已能做到每8分钟生产一路算法模型,以1.4万个GPU组成阵列提供计算支持,此外他们还使用了Accelerated Video Library,增加了30%训练速度。

在边缘端,他们还进行了轻量化处理,让系统降低延迟,8个摄像头通过神经网络快速实时识别建筑及不同路面场景,更快完成3D场景生成。

指的一提的是,在今年4月奥斯汀超级工厂开业庆祝活动及Q1财报电话会上,马斯克都提及了不带方向盘和踏板的自动驾驶出租车产品,不少人预测他会在今天聊聊RoboTaxi,但在现场特斯拉并未提及。

芯片与超算

去年AI Day上,特斯拉公布了D1芯片及超级计算机平台DOJO,用以加速自动驾驶模型训练,一时吸引不少眼球——

后续提问中,有人质疑了他们如何将芯片组合并实现高效编译,今年,他们拿出了具体的答案。

首先关于芯片连接上,他们考虑到芯片连接处热膨胀系数(CTE)问题,于是,干脆做了个外部「骨架」将一个个芯片放入其中,底部配备高速记忆模块,搞了个「铁锁连环阵」:

a5a334dfb31a061fd3b904d13beef09c.png

然后整体封装,放进机柜里:

7ce0d5ffb2ce11385f0ee15e365ae0b3.png

那么一通操作下来成绩如何?

按特斯拉的说法,他们在经典项目RESNET-50上的计算能力击败了A100:

0e26086fc31823b6c8cf85a62d10d366.png

在替代性方面,他们以自动标注为例,宣称4个DOJO机柜可替代72个GPU RACKS:

547214a3d88808c40f1f743b571b9f27.png

对未来,他们更是充满自信,认为不仅现在吊打100,到2023年Q1即可实现多倍超越:

f433d21ad28d8510f29a53fb7f29ab4d.png

在现场,马斯克也强调特斯拉被外部认为是一家自动驾驶和造车公司,但事实远不止于此,他将特斯拉称为前沿人工智能公司,并补充半导体也是技术的一种体现,紧接着他号召更多人才加入公司,画足了技术愿(大)景(饼)。

其实活动之前,马斯克就早早发出预告,称这次活动是为了招募人工智能和机器人工程师/芯片超算工程师,如此看来,种种秀技术肌肉之举,也带着一鱼两吃的盘算。

One More Thing

马斯克本人在今天的活动中戏份并不多,下台后转头就开始高强度网络冲浪

比如宣称未来会有“猫女”版擎天柱机器人。

40c9238462168676c1dd96ddc4e5ffff.png

又或者给网友的梗图点赞。

efdc16c3a0da0e59ece6b03d7a4b5a49.png

看了这么多,最后让擎天柱给大家比个心吧。

5c8627eb8cf71ad7e0de08173620f605.gif

直播回放:
https://www.youtube.com/watch?v=ODSJsviD_SU

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/70391.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

模型训练系列:1、用清华ChatGLM-6B模型部署自己的本地AI助手

最近清华大学开源的ChatGLM-6B语言模型在国际上大出风头,仅仅62亿参数的小模型,能力却很强。很期待他们后续1300亿参数模型130B的发布。 为什么一些能力较弱的小模型,这么受追捧?因为ChatGPT、GPT-4虽好,毕竟被国外封锁…

腾讯云服务器小白保姆级教程

现在都是上云服务器,小白拿到一个云服务器怎么办? 1、选择 这里选择的是腾讯云轻量服务器,主要是便宜,另外自己主要是自己练习,对性能什么的也就没有啥要求了。 购买云服务器之前要进行实名验证。实名的微信可以和注…

文科生学大数据分析吃力吗

前段时间来咨询的学员,0基础想报名大大数据分析培训班,但由于自己是文科生,做的是人力资源的工作,所以一直在犹豫该不该转行从事大数据分析行业。文科生可以学大数据分析吗?今天就针对文科生的问题详细的分析一下。 在选择大数据…

文科生比不过理科生,转码IT互联网将成趋势?

今天看到“文科生转码或成趋势”的话题,觉得还是非常有意思哈,所以来聊聊看~ 值得一提的是,虽然现在高中考试改制后,已不再区分文理科生(理化生史地政6选3),但是大学本科及研究生以上&#xff…

文科妹子都会用 GitHub,你这个工科生还等什么

在某乎上刷到一条关于 GitHub 的留言,如下: 点赞人数还不少,这说明还真有不少工科生不会用 GitHub,你看大小写都没有区分(手动狗头)。所以我就想写篇文章科普下,“新手如何使用 GitHub&#xff…

文科生“转码农“风继续 理科生慌吗?Phyon最热

程序员是一个很热门的职业,至少对于文科生而言,这两年持续“转码农”风在继续,这会不会给理科生们带来压力呢? 其实,“转码”,即转行成为程序员,由于其高就业率、高薪资而在求职市场上大受欢迎&…

chatgpt赋能python:Python操作数据库:连接、查询和更新

Python操作数据库:连接、查询和更新 在开发Web应用或者处理数据时,操作数据库是必不可少的步骤。Python提供了许多标准库和第三方库来连接和操作数据库,如sqlite3、MySQLdb、psycopg2等。在本文中,我们将介绍如何使用Python连接、…

AI算力碎片化:矩阵乘法的启示

尽管AI的发展取得了巨大进步,但编译器LLVM之父Chris Lattner认为,AI技术应用并不深入,远远没有发挥出已有机器学习研究的所有潜力。而AI系统和工具的单一化和碎片化正是造成这一问题的根源。 为了让AI发挥其真正的潜力,计算碎片化…

APP后台以及用户数据被泄露 该如何防护

近期我们接到许多DK平台反馈APP里的用户信息数据被泄露,导致用户经常受到境外香港电话推广骚扰,有些用户甚至被网络诈骗,而且用户当天申请填写表单里的手机号,没过多久就泄露了,紧接着香港电话就会打过来,询…

ap计算机科学5分率,AP考试5分率及难度分析

2019年的AP报名窗口已经开启,AP选考究竟要注意些什么?如何结合科目难度和自身情况,申请的时候尽可能地凸显的优势呢?今天老师从AP各科的难度和5分率进行分析,让大家了解过往战况,好好制定最适合的选考策略。…

ALEVEL数学、物理、化学、生物与国内考试的区别

A-Level考试中数学、物理、化学、生物是常考热门科目,这些科目在国内高考中也有对应的科目,那么,两者之间有什么区别呢? 1、A-Level物理与国内高考物理 从知识范围广度来看,A-Level物理更胜一筹,涉及的知识…

PTA L2-046 天梯赛的赛场安排 (25 分)

天梯赛使用 OMS 监考系统,需要将参赛队员安排到系统中的虚拟赛场里,并为每个赛场分配一位监考老师。每位监考老师需要联系自己赛场内队员对应的教练们,以便发放比赛账号。为了尽可能减少教练和监考的沟通负担,我们要求赛场的安排满…

分析数学成绩,尽然我考了0分

编程语言:Python 简单的数据分析 导入 pygal 废话不多说直接上代码! import pygal radar_chart pygal.Radar() radar_chart.title 数学考试成绩分析 radar_chart.x_labels [班长, 学委, 体育委员, 学渣, 学霸,我] radar_chart.add(高三(5)班, [86, 96, 69, 49, …

T06 成绩排序

查找和排序 题目:输入任意(用户,成绩)序列,可以获得成绩从高到低或从低到高的排列,相同成绩 都按先录入排列在前的规则处理。 示例: jack 70 peter 96 Tom 70 smith 67 从高到低 成…

Quick Request使用教程

一、基本介绍 Quick Request作为IntelliJ IDEA的插件,提供给开发人员更好的调试体验,当前可支持Spring Mvc、Dubbo框架的所有请求,具有简单易用、自动生成请求参数、项目环境管理、历史请求记录、保存请求及快速搜索的特点,下面给…

python爬虫二十四:js逆向破解(一)

1、环境搭建 通过python代码模拟js去生成加密数据完成数据破解,需要用到PyExecJS模块 ①安装模块pip install pyexecjs通过模块的方法来读取js代码,也可以用js2py(不更新维护了)、selenium(driver.wxecute_script(js代码))去执行js文件,这里…

关于ref哪怕在$nextTick()中有时候获取不到节点元素的问题。(较为诡异的bug)

我的需求是用element-ui的messagebox,来实现验证码接受的功能。并将cancel按钮换成刷新功能,在beforeClose中实现验证码刷新。元素都是在$msgbox中生成的,下面是最开始出错的核心代码。 let result await this.$API.reqCaptchaImg();this.ca…

微信小程序实现分页加载,触底加载下一页,滚动加载

这里我就不写wxml了,就是一个列表循环,直接看js代码逻辑,注释都写在代码后面了,这个方法可以实现无限滚动加载,直到加载完最后一条数据,也可以实现触底没数据后,二次触底可以从新加载刷新&#…

某地刑侦大队对涉及6个嫌疑人的一桩疑案进行分析

(1)A、B 至少有一人作案; (2)A、E、F 三人中至少有两人参与作案; (3)A、D 不可能是同案犯; (4)B、C 或同时作案,或与本案无关&#xf…

今天,微软重新发明搜索引擎:首款ChatGPT搜索来了

从现在起,比 ChatGPT 更强大的语言模型直接进入了你的浏览器。 一夜之间,全球最大的科技公司仿佛都回到了自己年轻时的样子。 在谷歌宣布「实验性对话式人工智能服务」Bard 之后仅 24 小时,北京时间 2 月 8 日凌晨两点,微软发布了…