【AI学习】地平线首席架构师苏箐关于自动驾驶的演讲

在地平线智驾科技畅想日上,地平线副总裁兼首席架构师苏箐(前华为智驾负责人)做了即兴演讲,以下是其演讲的主要内容:
对自动驾驶行业的看法
自动驾驶的难度与挑战:苏箐表示自动驾驶非常难,他做自动驾驶到现在已经快抑郁了,很多优秀的同学都改行了,去做具身智能机器人。他认为自动驾驶是第一个在物理世界跟人交互的机器人,是在一个半规则和半非规则的场景里面的东西,如果连自动驾驶都搞不定,去做完全是非结构化的机器人是不可能的。
自动驾驶的价值拐点:苏箐认为自动驾驶系统的竞争对手是人类本身,其价值是一个拐点式的价值。当自动驾驶比不过人的时候,它就是高科技的玩具;当有一天比人好的时候,其价值立刻就会跳上去。到目前为止,还没有一个系统真正达到了这个拐点。
对行业现状的批评:苏箐直言不讳地表示,他不太喜欢中国智能驾驶行业这几年的氛围。他认为智驾行业应该做一点正确的产品,解决一些正确的问题,而不是天天活在营销里面。
对特斯拉的评价
苏箐坦率地表示,如果抛开跟人类的比较,今天一定要让他找个对标对象,他还是会选特斯拉FSD。他认为特斯拉在技术方面有很多独到之处,甚至在某些地方有断代式的领先。他从特斯拉身上学到了很多新的思想和思路。
地平线的目标与技术路线
2025年的目标:苏箐透露,地平线今年的目标有两个,一个是用一段式的端到端把类人做上去,第二是把车辆紧急接管安全性至少要提升100倍。他们相信,只有解决了这些问题,才能打造出与众不同的产品。
技术路线的选择:地平线在自动驾驶系统的内核上采用了完全的端到端数据驱动方法。但在数据稀疏、难以快速收敛的情况下,也会制定相应的规则来确保系统的便利性和有效性。此外,地平线还推出了最新的智能驾驶解决方案HSD,这套方案能够应对各种复杂的交通场景,包括在狭窄城区道路掉头等难例场景。
对中国自动驾驶市场的理解
苏箐认为,中国自动驾驶面临特殊挑战,如基建随意性、外卖行为不守规矩等。因此,地平线选择了一条务实的道路,根据中国国情进行自主研发。他强调,一个真正有价值的自动驾驶系统,应该能够在用户感到疲劳或不安全时,提供可靠的驾驶辅助,让用户能够放心地将驾驶任务交给系统。

备注

转微博@高飞的文章,作为参考
#模型时代# 地平线首席架构师苏箐关于自动驾驶的“苦涩的教训”

昨天我参加了一下地平线智驾科技畅想日的活动,地平线副总裁兼首席架构师苏箐(前华为智驾负责人)首次在媒体面前公开露面,并做了一段即兴演讲。讲的时间不长,但非常诚恳深刻。

他说“谈到(完美的自动驾驶),十多年过去了,全世界最聪明的人投入了这么多资金,还是没有突破这个点,确实会感到有些绝望”;而谈到解决方案,又讲“我干了这么多年,对每年出现的新概念和时髦词已经完全没感觉了。因为像这样的复杂系统,既没有捷径,也不存在一蹴而就的方法。明天有个新模型,搞个新工具就能解决所有问题,这种想法是不现实的;所以,结论是:”复杂系统的正确打开方式是:你要有一个非常强大的工程团队,要建立一个非常稳固的系统。在此基础上,不断地在一个嘈杂的环境中,将新的方法持续集成进去,然后不断前进“。

他讲到结论的时候,我就突然想到了Rich Sutton在2019年3月发表的名篇《The Bitter Lesson》,这篇文章的核心论点可以概括为一个深刻而"苦涩"的历史教训:在AI研究历史上,基于通用方法(利用计算能力的搜索和学习)的方案,最终总是战胜基于人类知识和智慧的特定方法。这个模式在计算机视觉、围棋、语音识别、机器翻译等多个领域反复上演。

所以,Rich Sutton说,“科学家的专业知识和智慧似乎不如简单的暴力计算更有价值”。虽然苏箐的看法是,国内的现实情况让业界无法用存粹的暴力算力数据堆叠,但两者都提到了这个领域没有“灵丹妙药”。既然如此,苏这句“一个强大的工程团队敢于干一些苦活累活优化前进”,某种程度上,也是一种苦涩的教训吧。

文字是现场记录,未经本人确认,仅供参考(其实我认为地平线的算法实际上有非常重要的优势,几年前的芯片架构设计就考虑了Transformer,苏的观点就有一些自谦的成分在):


1、说到今天的感受,我是既乐观又困惑。自动驾驶确实非常难,我有很多优秀的朋友已经改行去做别的事情了。

自动驾驶不是什么新东西了。自动驾驶的整个发展应该是从2004年的DARPA Project开始,从那个时候我们就看到了自动驾驶的可能性。我自己开始做这个是在2012年、2013年左右。

有不少人问我要不要去做机器人,但我想,我们连自动驾驶都还没搞定,怎么去做机器人呢?其实自动驾驶应该是第一个在物理世界中与人交互的机器人,它存在于一个半规则化的环境中。如果连这个都搞不定,去做一个完全非结构化环境下的机器人是不可能的。

2、自动驾驶的真正比较对象不是竞争对手,不是国内的蔚小鹏、华为或其他公司,而是人类本身。

它的价值是一个拐点式的价值:在比不过人的时候,它就是一个高科技的玩具;只有在某一天比人好的时候,它才会形成一个质变式的价值。但可惜的是,到目前为止还没有一个系统真正达到了这个拐点。

3、十多年过去了,看着全世界最聪明的人投入了这么多资金,还是没有突破这个点,确实会感到有些绝望。但是在绝望中依然能看到希望,因为经过五到六代核心技术的演进,整个系统确实能看到曙光。

说到我们的优势和理念,其实很简单,我并不打算去跟任何人比较。我干了这么多年,对每年出现的新概念和时髦词已经完全没感觉了。因为像这样的复杂系统,既没有捷径,也不存在一蹴而就的方法。明天有个新模型,搞个新工具就能解决所有问题,这种想法是不现实的。

4、复杂系统的正确打开方式是:你要有一个非常强大的工程团队,要建立一个非常稳固的系统。在此基础上,不断地在一个嘈杂的环境中,将新的方法持续集成进去,然后不断前进。我觉得这是做大型工程的一个经验之谈。

"说到自动驾驶的竞争,坦白说如果今天让我选择一个竞争对手的话,我还是会选择特斯拉FSD。因为美国团队的整体素质和创新经验确实值得敬佩。我自己实践后发现,他们在技术上确实存在一些不足,但这只是暂时的。我们也从中学到了很多新的思想和思路,至少他们已经证明了一些技术路线是可持续的,甚至在某些部分有断代式的领先。

5、但是说到中国的自动驾驶要跟美国做一样的事情,这是不现实的。

首先,在目前状况下,中国不可能投入像特斯拉那样的算力,无论是从经济还是政策角度都不可能。其次,中国的基建和道路条件与美国有很大差异。更重要的是,中国还面临着电动车不遵守交通规则等特殊问题,这导致了大量需要处理的博弈问题,而这些是现在的深度学习还不能完全解决的。

6、所以我们选择了一条比较务实的道路。我们的系统采用完全端到端的深度学习方法,但在一些数据比较稀疏、比较难处理,或者因为混杂数据难以收敛的情况下,我们也会让有经验的工程师去做一些规则设计,就是采用两种技术并行的方式。这在目前来看是最有效的方案。

当然,在做市场营销时,我们可以讲得天花乱坠,但对于普通消费者来说很简单,他上车后能够感觉到这个系统是可靠的,这才是最重要的。我到现在最推崇的产品仍然是Steve Jobs时代的iPhone,它在所有细节上都做到了极致,没有明显的弱点。目前这一代产品还没有看到谁能达到那个高度。我希望在我们这个产品中,能专注于解决真正的问题,而不是一味追求营销效果。

7、如果要谈自动驾驶的价值演进,我觉得可以分为三个阶段:第一个阶段是高科技的玩具,仅仅是噱头;第二个阶段是在高速公路上好用,虽然在城市道路上还不太理想,但起码在高速上开车时不用那么累了,只需要让它自己行驶就可以。虽然这个价值还不够高,但已经有一定意义了。不过这里要注意中美的差异:美国人上下班基本都走高速,而中国不是,中国的城市交通问题更复杂,是一个网格化的问题。

8、自动驾驶系统的本质问题是:到底是系统依赖人,还是人依赖系统?如果你想让这个系统真正产生价值,就要考虑这样的场景:当人们加班很累,感觉自己开车不太安全的时候,能否完全信任这个系统来接管驾驶?这才是系统真正的价值所在,它超越了单纯的功能价值。这也是我们正在努力要做到的方向。

9、说到底,我认为有两个关键点:第一是类人性,不好意思我提到这个词。但类人性的目的不是为了模仿人类,因为人开车时本来就不是预防性驾驶。比如今天我们看到一个系统在处理车辆变道时,你会观察到它’在思考要不要变道’,然后才做出动作,这其实已经不太对了。如果你完全感觉不到这个车辆在你的预判之前就已经把动作做完了,这个系统才是真正做对了。这是我们追求的目标。

第二个是要提升整个车辆的紧急避险安全性。这件事情非常难,但随着自动驾驶技术的推进,我们也发现了一些新的方法和线索。只有这两件事情都做到位了,我相信我们的产品才能在市场上真正与众不同。

10、坦白说,这么多人辛苦了这么多年,如果只是去做一个用来营销的东西,这不是我们应该做的事情。我们应该去解决实际的问题,而不是天天活在营销中。我个人不太喜欢中国这几年的氛围,我觉得我们应该做一些真正有价值的产品,尽管这很难。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3163.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【机器学习实战入门】使用 Pandas 和 OpenCV 进行颜色检测

Python 颜色检测项目 今天的项目将非常有趣和令人兴奋。我们将与颜色打交道,并在项目过程中学习许多概念。颜色检测对于识别物体来说是必要的,它也被用作各种图像编辑和绘图应用的工具。 什么是颜色检测? 颜色检测是检测任何颜色名称的过程…

【k8s面试题2025】3、练气中期

体内灵气的量和纯度在逐渐增加。 文章目录 在 Kubernetes 中自定义 Service端口报错常用控制器Kubernetes 中拉伸收缩副本失效设置节点容忍异常时间Deployment 控制器的升级和回滚日志收集资源监控监控 Docker将 Master 节点设置为可调度 在 Kubernetes 中自定义 Service端口报…

数智化转型 | 星环科技Defensor 助力某银行数据分类分级

在数据驱动的金融时代,数据安全和隐私保护的重要性日益凸显。某银行作为数字化转型的先行者,面临着一项艰巨的任务:如何高效、准确地对分布在多个业务系统、业务库与数仓数湖中的约80万个字段进行数据分类和分级。该银行借助星环科技数据安全…

mac配置 iTerm2 使用lrzsz与服务器传输文件

mac配置 1. 安装支持rz和sz命令的lrzsz brew install lrzsz2. 下载iterm2-send-zmodem.sh和iterm2-recv-zmodem.sh两个脚本 # 克隆仓库 git clone https://github.com/aikuyun/iterm2-zmodem ~/iterm2-zmodem# 进入到仓库目录 cd ~/iterm2-zmodem# 设置脚本文件可执行权限 c…

redis 分布式重入锁

文章目录 前言一、分布式重入锁1、单机重入锁2、redis重入锁 二、redisson实现重入锁1、 添加依赖2、 配置 Redisson 客户端3、 使用 Redisson 实现重入锁4、 验证5、运行项目 三、redisson分布式锁分析1、获取锁对象2、 加锁3、订阅4、锁续期5、释放锁6、流程图 前言 通过前篇…

【git】如何删除本地分支和远程分支?

1.如何在 Git 中删除本地分支 本地分支是您本地机器上的分支,不会影响任何远程分支。 (1)在 Git 中删除本地分支 git branch -d local_branch_name git branch 是在本地删除分支的命令。-d是一个标志,是命令的一个选项&#x…

关于 Cursor 的一些学习记录

文章目录 1. 写在最前面2. Prompt Design2.1 Priompt v0.1:提示设计库的首次尝试2.2 注意事项 3. 了解 Cursor 的 AI 功能3.1 问题3.2 答案 4. cursor 免费功能体验5. 写在最后面6. 参考资料 1. 写在最前面 本文整理了一些学习 Cursor 过程中读到的或者发现的感兴趣…

使用python+pytest+requests完成自动化接口测试(包括html报告的生成和日志记录以及层级的封装(包括调用Json文件))

一、API的选择 我们进行接口测试需要API文档和系统,我们选择JSONPlaceholder免费API,因为它是一个非常适合进行接口测试、API 测试和学习的工具。它免费、易于使用、无需认证,能够快速帮助开发者模拟常见的接口操作(增、删、改、…

【Rust自学】13.2. 闭包 Pt.2:闭包的类型推断和标注

13.2.0. 写在正文之前 Rust语言在设计过程中收到了很多语言的启发,而函数式编程对Rust产生了非常显著的影响。函数式编程通常包括通过将函数作为值传递给参数、从其他函数返回它们、将它们分配给变量以供以后执行等等。 在本章中,我们会讨论 Rust 的一…

无人机技术架构剖析!

一、飞机平台系统 飞机平台系统是无人机飞行的主体平台,主要提供飞行能力和装载功能。它由机体结构、动力装置、电气设备等组成。 机体结构:无人机的机身是其核心结构,承载着其他各个组件并提供稳定性。常见的机身材料包括碳纤维、铝合金、…

Axios封装一款前端项目网络请求实用插件

前端项目开发非常经典的插件axios大家都很熟悉,它是一个Promise网络请求库,可以用于浏览器和 node.js 支持的项目中。像一直以来比较火的Vue.js开发的几乎所有项目网络请求用的都是axios。那么我们在实际的项目中,有时候为了便于维护、请求头…

【c++继承篇】--继承之道:在C++的世界中编织血脉与传承

目录 引言 一、定义二、继承定义格式2.1定义格式2.2继承关系和访问限定符2.3继承后子类访问权限 三、基类和派生类赋值转换四、继承的作用域4.1同名变量4.2同名函数 五、派生类的默认成员构造函数5.1**构造函数调用顺序:**5.2**析构函数调用顺序:**5.3调…

LDD3学习8--linux的设备模型(TODO)

在LDD3的十四章,是Linux设备模型,其中也有说到这个部分。 我的理解是自动在应用层也就是用户空间实现设备管理,处理内核的设备事件。 事件来自sysfs和/sbin/hotplug。在驱动中,只要是使用了新版的函数,相应的事件就会…

Python基于Django的图像去雾算法研究和系统实现(附源码,文档说明)

博主介绍:✌IT徐师兄、7年大厂程序员经历。全网粉丝15W、csdn博客专家、掘金/华为云//InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇&#x1f3…

Python爬虫(5) --爬取网页视频

文章目录 爬虫爬取视频 指定url发送请求 UA伪装请求页面 获取想要的数据 解析定位定位音视频位置 存放视频完整代码实现总结 爬虫 Python 爬虫是一种自动化工具,用于从互联网上抓取网页数据并提取有用的信息。Python 因其简洁的语法和丰富的库支持(如…

从AI原理到模型演进及代码实践 的学习二

参考:全面解析:从AI原理到模型演进及代码实践-CSDN博客 训练过程 Transformer仅一个Encoder模块就可以工作,可以处理信息抽取、识别、主体识别等任务,比如 BERT(Bidirectional Encoder Representations from Transfor…

利用EXCEL进行XXE攻击

0X00 前言 CTF 选手都清楚我们像 word 文档格式改成 zip 格式后,再解压缩可以发现其中多数是描述工作簿数据、元数据、文档信息的 XML 文件。实际上,与所有 post-Office 2007 文件格式一样,现代 Excel 文件实际上只是 XML 文档的 zip 文件。…

在Mac mini上实现本地话部署AI和知识库

在Mac mini上实现本地话部署AI和知识库 硬件要求:大模型AI,也叫LLM,需要硬件支持,常见的方式有2种:一种是采用英伟达之类支持CUDA库的GPU芯片或者专用AI芯片;第二种是采用苹果M系列芯片架构的支持统一内存架…

鸿蒙UI(ArkUI-方舟UI框架)-开发布局

文章目录 开发布局1、布局概述1)布局结构2)布局元素组成3)如何选择布局4)布局位置5)对子元素的约束 2、构建布局1)线性布局 (Row/Column)概述布局子元素在排列方向上的间距布局子元素在交叉轴上的对齐方式(…

指针的进阶

指针的主题,我们在初级阶段的《指针》章节已经接触过了,我们知道了指针的概念: 1. 指针就是个变量,用来存放地址,地址唯一标识一块内存空间。 2. 指针的大小是固定的4/8个字节(32位平台/64位平台&#xff0…