地平线SuperDrive首秀:千人研发投入,出场即「比肩第一梯队」

作者 |德新

编辑 |王博

0889b063e20045a53f268e446d076fcf.jpeg

8月底,地平线在北京开放了第一批面向媒体的高阶智驾方案SuperDrive体验。

预计到明年第三季度,SuperDrive将伴随主机厂客户的第一款量产车交付。

目前在国内,仅有英伟达和华为两家的平台基础上,有车企向用户成功交付了带有城区功能的高阶智驾方案。地平线「J6P + SuperDrive」的组合,希望成为日益火热的高阶市场中有力的竞争者。

这次SuperDrive开放体验有两个背景:

  • 第一是今年4月在北京车展前夕,地平线发布了征程6系列产品,J6P是征程6系列最高阶的计算平台;
  • 第二是据媒体报道,去年10月地平线内部针对智驾软件的研发做了战略调整。其将中阶的方案全部交由Tier 1合作伙伴来做,内部聚焦高阶,并且整合了原有内部中阶的团队。

从去年10月开始,地平线投入了超过1000人的团队,专门开发基于J6P软硬结合的高阶方案——SuperDrive

招股书显示,截止2023年底,地平线约有雇员2066人,这意味着地平线将近一半的精锐部队都投到了SuperDrive的开发上。

招股书同时也披露,2023年地平线的研发投入是23.66亿元。

地平线希望通过「饱和式」的投入,打造出一套高度产品化的智驾方案SuperDrive,来拔高地平线整个商业生态的天花板。

如果SuperDrive大获成功,这也将大幅拔高国内智驾系统产品力的天花板。毕竟当前虽然中低阶的市场杀成红海,但真正能做高阶方案、开放的供应商仍然寥寥。

作为一套「初出茅庐」的高阶智驾系统,SuperDrive在地平线的积累和投入之上,以及车辆目前在北京、上海闹市区所展示出的能力,可以说一出场就有「比肩第一梯队」的实力。

对于SuperDrive当前的进展,余凯在沟通会上评价:超过预期。

不少国内和国际车企客户,也在体验SuperDrive之后给出了颇高的评价。

一、按照3A游戏标准打造的智驾HMI

过去很长一段时间,行业内都是将智能驾驶作为技术来开发,而SuperDrive立项的出发点就是「用产品思维做高阶智驾」,向车企和用户交付完整的高阶智驾产品体验。

我们可以先从智驾的HMI,来管窥一下地平线在SuperDrive上的产品探索。

SuperDrive的SR,对物理世界进行了高度还原。

从界面上可以看到丰富的细节:

f3d253d691687a36a8bbe8a57bd3b15c.jpeg

SR界面与导航地图做了深度融合,它的底色是一层类似战争迷雾的效果,随着本车的行驶,呈现模拟探索认知的视角。

除了常见的车道、车辆目标之外,这套SR还会渲染道路两旁的树木以及天桥这样的建筑物。

由于采用的是无高精地图的方案,SuperDrive使用了世界模型来做实时的感知识别,再叠加激光雷达点云,来还原树木以及一些大的建筑。这样做可以让用户更容易对齐真实世界和虚拟世界的坐标,增加安全感。

由于在测试中经常会遇到遛狗的行人,地平线把包括小猫、小狗在内的小目标,也做到了SR上。

针对常见重叠的目标,比如等待过路口的行人、路边停放的车辆也专门做了感知优化,SR上被遮挡的目标仍能稳定追踪,物体结构清晰完整。

整个SR,无论动静态的目标,尤其路边的行人、两轮车,包括朝向、姿态在内都非常稳定,很少有「跳变」。

这些都展示了扎实的算法和工程功底。

e7160bc113595dbb4caf9f8704ca7d30.jpeg

一位地平线工程师告诉我们:这套SR,内部对于审美和产品细节有很高的标准。

首先,从元素展示上,作为深度研发智驾系统的供应商,他们最了解哪些信息对于用户理解智驾系统的行为、建立安全感是必要的。

过去,一些智驾系统的HMI开发由车企与供应商分开主导,智驾供应商缺乏对用户交互的理解,而车企则缺少智驾系统开发的经验,因此有时整个交互体验的一致性不够好,信息也不够完整。

地平线的这套SR希望帮助车企树立起一套高阶智驾交互的「标杆」。

实际上,内部还有一项目标是将这套SR,做到3A级游戏的标准

二、世界模型 + 数据驱动的交互博弈

作为地平线最新一代的智驾方案,SuperDrive用上了时下最流行的大模型驱动的技术栈,也就是炙手可热的「端到端」技术。

并且,J6这代的BPU也对运行大参数模型做了底层优化。

d80194fa417a53a04492566160325fdb.jpege07964f6a9ac425303ec489cd192c51c.jpeg

它的前端以异构传感器与导航地图的信息作为输入,进入到一个「静态环境 + 动态目标 + 占用格栅」三网合一的感知世界模型。

世界模型向下游同时输出动静态的目标信息,这些目标信息同时用于SR的显示,并且世界模型同步向下游传输更丰富的无损高纬度特征信息。

而下游的决策规划,则包含了模型驱动和规则兜底的两套系统。

整套系统追求拟人化的驾驶体验,希望做到「优雅不怂」。

模型驱动的决策规划,是系统能做到「优雅不怂」的其中一个原因。

55ad37a2040e970de2922aebdd6c3cbe.jpeg

在开发的初期,地平线采集了一些国宾司机标准的驾驶数据来启动模型的训练;目前这套系统,已经学习了超过1万小时的高质量驾驶数据。

不过,余凯认为,端到端并不是智驾系统的终局解决方案,智驾产品也不存在一招鲜。

「真正的门槛来自千锤百炼的工程能力,在干脏活累活攒下的积累。」

比如地平线600万套征程家族的出货积累下的车辆纵向控制算法,「地平线拥有业界最丰富的纵向控制的数据库」。

在这批SuperDrive的试验车上,由于没有原厂开放的底盘控制信号,地平线是通过工程方法独立做的底盘控制。

在体验完SuperDrive后,这套系统在控制上的细腻程度让不少主机厂客户折服,评价地平线的团队是「懂车、懂底盘的」。

三、产品、技术、工程化,高阶智驾的铁人三项赛

在相当长一段时间内,智能驾驶都是作为先进技术被行业所研发推进。

而智驾的关键构成,比如计算机视觉、深度学习,都来自于学界的前沿研究。大家长期视最新的算法突破为瑰宝,而忽略了工程化的重要性。

工程化短板是后来很多年智驾科技公司在尝试商业落地时遇到的挑战,至今仍然如此。

至于产品化,则是非常稀缺的经验。

如果从高速NOA量产开始计算,智能驾驶真正开始被产品化并开始被用户大量使用,只有四五年时间。

而到了2024年,当智能驾驶的装配率开始快速上升,而智驾供应的格局开始急剧收敛时,高阶智驾的已经是「技术 + 工程 + 产品」全面的铁人三项赛事。

这也是余凯所说的,智能驾驶不可能做到一招鲜。

SuperDrive是以深度定制优化的硬件为基础,高度软硬协同的方案。

征程6系列最高阶的计算平台J6P,单片算力达到560 Tops;在地平线前3代计算平台的设计经验基础上,J6P集成了BPU、CPU、GPU、MCU、ISP和Codec等丰富的异构计算资源。

并且第三代BPU架构Nash,专门针对大参数模型进行优化,运行Transformer类算法相比于主流的竞品平台有9 - 11倍的FPS性能(每秒处理的图片帧数)提升。

在城区NOA加速普及的阶段,头部厂商都已经深刻意识到深度软硬结合的必要性。

比如英伟达在DRIVE计算平台的基础上,由吴新宙带领正在开发全栈的高阶智驾软件;而Momenta则是从软件算法的背景出发,正在快速推进自研芯片,核心目标也是针对大模型的底层硬件优化。

深度优化的计算硬件,600万套出货的工程积累和产品化思考,使SuperDrive一出场就站在了一个高起点上。

这一批的SuperDrive体验,地平线专门选择了在北京、上海闹市区,在高峰时段甚至夹杂着恶劣天气下,系统依然可以顺滑地完成路线的体验。

地平线希望这样的场景设置,能够尽可能地打磨出系统的上限,同时也在开展大规模的泛化测试。

预计最快到明年第三季度,我们将看到搭载SuperDrive的量产车上市

2024年,中国市场L2辅助驾驶的新车装配率已经超过了50%,但大部分仍以基础辅助驾驶为主。

根据灼识咨询的预测,到2030年,中国智能汽车的销量将增加到815万台,而高阶智驾将成为主流的前装解决方案,其渗透占比预计将超过60%。

而SuperDrive就是要加速这样的目标普及,余凯预计在3 - 5年内,十几万级的车型搭载SuperDrive这样的系统,完全是可以预期的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/417880.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

webm转换mp4怎么转?分享6种简单好用的转换方法

在日常的视频处理中,将WebM视频转换为MP4格式是一个常见的需求。无论是为了兼容性、分享还是编辑,MP4格式都因其广泛的支持和良好的性能而备受欢迎。本文将为大家介绍6种高效方法,有需要的小伙伴快来学习下吧。 方法一:口袋视频转…

暴力数据结构之优先级队列的解析及其模拟实现(C++)

1.认识优先级队列 如果我们给每个元素都分配一个数字来标记其优先级,不妨设较小的数字具有较高的优先级,这样我们就可以在一个集合中访问优先级最高的元素并对其进行查找和删除操作了。 优先级队列(priority queue) 是0个或多个元…

Spring-容器:IOC-基于注解管理Bean

目录 一、基于注解管理Bean(重点)1.1、概述1.2、开启组件扫描1.2.1、指定要排除的组件1.2.2、仅扫描指定组件 1.3、使用注解定义Bean1.4、使用Autowired注入1.4.1、属性注入1.4.2、set注入1.4.3、构造方法注入1.4.4、形参注入1.4.5、无注解注入1.4.6、联…

第十周:机器学习笔记

第十周机器学习周报 摘要Abstract机器学习——self-attention(注意力机制)1. 为什么要用self-attention2. self-attention 工作原理2.1 求α的两种方式2.2 attention-score(关联程度) Pytorch学习1. 损失函数代码实战1.1 L1loss&a…

传统CV算法——边缘算子与图像金字塔算法介绍

边缘算子 图像梯度算子 - Sobel Sobel算子是一种用于边缘检测的图像梯度算子,它通过计算图像亮度的空间梯度来突出显示图像中的边缘。Sobel算子主要识别图像中亮度变化快的区域,这些区域通常对应于边缘。它是通过对图像进行水平和垂直方向的差分运算来…

Robotics: computational motion planning 部分笔记—— week 1 graph-based

grassfire algorithm 四周扩散性;从终点开始按照相邻最小距离格子移动 Dijkstra’s Algorithm 标明从起点开始的所有点的最短距离(从上一节点继承),直到终点 A* Algorithm 带有启发性的,给出距离估计&#xff0c…

小杨的H字矩阵小杨的日字矩阵 c++

小杨的H字矩阵 题目描述 小杨想要构造一个NxN的H字矩阵(N为奇数),具体来说,这个矩阵共有N行,每行N个字符,其中最左列、最右列都是 | (键盘右侧删除键下回车键上,shift\),而中间一行…

国内领先线上运动平台:如何借助AI技术实现业务腾飞与用户体验升级

“ 从智能训练到身体分析,再到辅助判决,AI技术正以惊人的速度渗透进体育和健身领域,为运动员和健身爱好者提供了前所未有的个性化体验。 ” AI,运动的智能伴侣 在巴黎奥运会上,AI技术的运用成为了焦点。它不仅为运动…

Java并发编程实战 03 | Java线程状态

在本文中,我们将深入探讨 Java 线程的六种状态以及它们之间的转换过程。其实线程状态之间的转换就如同生物生命从诞生、成长到最终死亡的过程一样。也是一个完整的生命周期。 首先我们来看看操作系统中线程的生命周期是如何转换的。 操作系统中的线程状态转换 线…

STM32F4按键状态机--单击、双击、长按

STM32F4按键状态机--单击、双击、长按 一、状态机的三要素二、使用状态机原因2.1资源占用方面2.2 执行效率方面:2.3 按键抖动方面: 三、状态机实现3.1 状态机分析3.1 程序实现 百度解析的状态机概念如下 状态机由状态寄存器和组合逻辑电路构成&#xff0…

深度学习 --- VGG16能让某个指定的feature map激活值最大化图片的可视化(JupyterNotebook实战)

VGG16能让某个指定的feature map激活值最大化图片的可视化 在前面的文章中,我用jupyter notebook分别实现了,预训练好的VGG16模型各层filter权重的可视化和给VGG16输入了一张图像,可视化VGG16各层的feature map。深度学习 --- VGG16卷积核的可…

Python 优雅编程:会报恩的代码(五)

文章目录 引言从文本搜索指定单词,不区分单词的大小写使用 str.lower()使用 re 模块 从文本搜索多个单词,依旧不区分单词的大小写使用 str.lower() 和循环使用 re 模块 反复执行 re.compile,re 是否会缓存编译结果?结语 引言 在 …

day47——面向对象特征之继承

一、继承(inhert) 面向对象三大特征:封装、继承、多态 继承:所谓继承,是类与类之间的关系。就是基于一个已有的类,来创建出一个新类的过程叫做继承。主要提高代码的复用性。 1.1 继承的作用 1> 实现…

【一嗨租车-注册安全分析报告-滑动验证加载不正常导致安全隐患】

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…

UE4_后期处理_后期处理材质及后期处理体积三—遮挡物体描边显示

一、效果: 在很多游戏中为了玩家能看到墙面背后是否有敌人,会给被遮挡的敌人增加描边显示,效果如下: 参考: https://zhuanlan.zhihu.com/p/81310476 https://zhuanlan.zhihu.com/p/358140547 二、所需知识 知识点…

Java笔试面试题AI答之JDBC(3)

文章目录 13. 编写JDBC连Oracle的程序?14. 简述JDBC的主要组件有哪些 ?15. JDBC中如何防止SQL注入攻击?1. 使用预处理语句(PreparedStatement)2. 避免在SQL查询中直接拼接用户输入的数据总结 16. JDBC的脏读是什么?哪…

Spring01——Spring简介、Spring Framework架构、Spring核心概念、IOC入门案例、DI入门案例

为什么要学 spring技术是JavaEE开发必备技能,企业开发技术选型命中率>90%专业角度 简化开发:降低企业开发的复杂度框架整合:高效整合其他技术,提高开发与运行效率 学什么 简化开发 IOCAOP 事务处理 框架整合 MyBatis 怎…

深度学习的基础_多层感知机的手动实现

多层感知机(Multilayer Perceptron,简称MLP)是一种前馈人工神经网络。它包含至少三层节点:一个输入层、一个或多个隐藏层以及一个输出层。除输入节点外,每个节点都是一个带有非线性激活函数的神经元(或称为…

Word快速重复上一步操作的三种高效方法

在日常工作、学习和生活中,我们经常需要执行一系列重复性的操作。这些操作可能简单如复制粘贴、调整图片大小,也可能复杂如编辑文档、处理数据等。为了提高效率,掌握快速重复上一步操作的方法显得尤为重要。本文将介绍三种高效的方法&#xf…

给力!Python配置文件,这一篇就够了!

在开发过程中,我们常常会用到一些固定参数或者是常量。对于这些较为固定且常用到的部分,往往会将其写到一个固定文件中,避免在不同的模块代码中重复出现从而保持核心代码整洁。 这里插播一条粉丝福利,如果你在学习Python或者有计划…