DriveGPT自动驾驶大模型中国玩家首发!1200亿参数,毫末智行出品

贾浩楠 发自 凹非寺
量子位 | 公众号 QbitAI

早知道会有这一天,但没想到如此快:

GPT技术,“上车”!

DriveGPT,首个应用GPT模型和技术逻辑的自动驾驶算法模型,正式官宣,中文名雪湖·海若

a8c6d64ea64ed60a3370b0ea87bb7af1.gif

可能你已经猜到背后的玩家:毫末智行

国内第一个将Transformer大模型引入自动驾驶、第一个自建超算、辅助驾驶量产落地进展第一…

尤其在自动驾驶研发端,毫末总是抢先别人一大步实践最前沿技术。而事后的进展又证明,毫末总是对的。

那么这次——掀起新一轮AI行业革命,震动圈内圈外的大模型GPT,毫末到底如何把它用在自动驾驶上?

DriveGPT是什么?“上车”有什么用?

ChatGPT的震撼之处,在于它对现今人类涉足过的几乎各个领域都有基本正确的认知理解 ,针对简单的议题,还能给出比普通人更全面更恰当的回答。

赋予ChatGPT能力的的根源,从名字上就可以拆解出来。首先是Chat,说明它本身是面向自然语言处理任务开发的,它目前的训练数据、方式、输出等等都是基于文本。

而真正把数据价值发挥出来,是GPT,全称Generative Pre-trained Transformer,生成式预训练大模型。

1d61675037a1bac8e1e010aea936a38b.png

“大”的基础上,生成才是关键。

对应到自动驾驶上,DriveGPT同样应用这样的思路,只不过训练的数据从语言文本,变成了图片、视频等等自动驾驶数据。

毫末智行的雪湖·海若,实现过程分为3步:

首先在预训练阶段引入量产智能驾驶数据,训练出一个初始模型,相当于一个具备基本驾驶技能的AI司机。
然后再引入量产数据中高价值的用户接管片段(Clips形式),训练反馈模型。而不同Corner Case的依次迭代,相当于针对不同驾驶任务挑战分别强化AI司机的技能。
接下来就是通过强化学习的方法,使用反馈模型不断优化迭代初始模型。

所谓“生成”,反馈模型能够实时根据当前交通流情况,生成不同的针对性场景,训练初始模型。而完成迭代后,模型也能对同一任务目标生成不同的策略方案。

441b0a92874f7a8494102c114292c0f2.jpeg

比如如果本车目标是通过拥堵路口,雪湖·海若能够给出三种方案供系统决策。

在打造DriveGPT时,毫末在雪湖·海若的几个过程中分别做了独特的工作。

首先初始模型预训练的数据,来自毫末已经量产积累的4000万公里实际道路数据,使得模型一开始就具有明显的量产实用价值,这是雪湖·海若得天独厚的条件。

ChatGPT中使用自然语言单字作为token输入,根据模型根据概率分布来生成下一个字符。而在雪湖·海若这里,毫末重新定义了50万个新的token,包括障碍物、车道线、行人等等,作为一种全新的“自动驾驶语言”。

DriveGPT输入是感知融合后的文本序列,输出是自动驾驶场景文本序列。

d6937ddf247dffb483a5be47820e2767.png

其次,大模型对计算能力提出很高的要求,包括算力资源的弹性调度、底层算子性能、训练稳定性等等,毫末与火山引擎一同在算力端做了大量优化。

59d53fc4ba7dce31c3659274c76b2d64.jpeg

最后,还会根据输入端的提示语以及毫末CSS自动驾驶场景库的决策样本去训练模型,让模型学习推理关系,从而将完整驾驶策略拆分为自动驾驶场景的动态识别过程,完成可理解、可解释的推理逻辑链生成。

雪湖·海若目前共有1200亿参数量,据毫末初步估计,在RLHF加持下,困难场景通过率提升48%左右。

a048278fcfd70802c0623d8e7753ad60.jpeg

ChatGPT自动驾驶版——雪湖·海若的“上车”,其实是一个类比,模型本身始终部署在云端。

对于车端用户,雪湖·海若的价值却是能够快速兑现的。

519c286ad6215abaa4559de3119ede06.png

比如具体功能上,生成式模型能够做到智能捷径推荐、困难场景自主脱困、智能陪练等等。

而中长期来看,它首先能够加速城市领航辅助功能(毫末NOH)落地,而且是重感知不依赖高精地图量产方案,领先业内一年以上。

GPT上车,为什么是毫末?

大模型在自动驾驶上的应用,其实早已有之。

尤其是毫末,最早认识到源自NLP领域的大模型在视觉领域同样具有巨大的潜力,通过超大规模模型、超大算力实现自动驾驶系统的快速迭代。

顾维灏2021年提出Transformer的应用,一直踏实于技术。毫末智行可以算是中国的自动驾驶大模型先驱。

大模型的应用,自然要求大算力,于是,毫末又成为国内第一个选择自建超算中心的自动驾驶公司。

毫末从来不是一个循规蹈矩的AI公司,总是在追逐技术最前沿,甚至有些“赶时髦”。

dfebbbd3976e21d048e9438c4b9380a4.png

去年毫末发布的中国首个自动驾驶数据智能体系MANA,经过一年多时间的应用迭代,现在到了全面升级,开放赋能行业的阶段。

另外,毫末从创立之初就坚定走数据驱动的技术路线,并建设了智算中心OASIS,基于L2辅助驾驶系统的大规模前装量产形成了数据智能闭环体系,在迭代速度和成本优化上实现良性循环。

具体到技术理念,大模型层面的Transformer和这次的雪湖·海若,而自动驾驶感知和数据层面,毫末也是最早应用BEV以及Clips的团队。

而每一个毫末率先实践的技术理念,随后很快就在技术、商业进展上兑现了价值。

221b1fe360492ca3a608297107ad77c3.png

毫末的野心绝不是Tier1,而是一家人工智能公司。

量产落地方面,毫末智行的智能驾驶系统已经累计了超过4000万公里的用户实际使用里程。

另外除了大股东长城汽车之外,毫末智行还另外获得了2家主要主机厂的项目定点。

66be31beafb3cb0292a7634daa811b98.png

研发层面,除了4000万公里的实际里程,毫末的MANA数据智能体系学习时长已经超过56万小时,相当于6.8万年驾龄的老司机。

在无人物流赛道,毫末自研的小魔驼已经完成配送超过16万单。

14daa8583d01269ec8203a665c28d792.png

根据毫末智行董事长张凯判断:“2023年智驾产品进入全线爆发期,大模型开启在车端的落地应用,车主的使用频率和满意度成为产品竞争力的重要衡量标准。毫末不断进步的数据驱动的六大闭环能力将进一步加速毫末进入自动驾驶3.0时代的步伐并形成相应的护城河。”

8c09f2f39eaa719cc1ac25bd7b582a63.png毫末智行董事长张凯

毫末执行展现出来的,是自动驾驶公司里最懂如何量产落地的、Tier1里最懂自动驾驶技术的、在有量产数据积累的公司中最懂如何真正数据闭环的。

所以毫末“追时髦”的背后,其实是对AI本质的认知,以及对自动驾驶量产的理解在驱动。

Transformer、BEV、Clips等等技术理念,行业内现在几乎所有玩家都在跟进,已经成为没有争议的主流。

所以历次毫末AI Day,也成了自动驾驶重要风向标。这次第八届大咖云集,包括董扬、朱西产、田奇...影响力越来越大.

毫末智行的三年,可以看成是自动驾驶落地最快的三年。

自动驾驶新希望

GPT“上车”,不是毫末这次唯一的“率先”。

除雪湖·海若之外,毫末智行在感知智能环节也做了新的探索。

在特斯拉之后,毫末智行在中国开始验证能否使用鱼眼相机代替超声波雷达进行测距,以及如何使用纯视觉NeRF网络重建高精度3维模型,并同时完成自动标注。

MANA感知模块,一方面可同时学习三维空间结构和图片纹理,并将纯视觉测距精度超过了超声波雷达,BEV方案也拥有了更强的通用性和适配性。

76369d0383cc9f526fa99ccdad7ec13a.png

另一方面可实现单趟和多趟纯视觉NeRF三维重建,道路场景更逼真,肉眼几乎看不出差异。通过NeRF进行场景重建后,可以编辑合成真实环境难以收集到的Corner Case。

0159b81e4a0ae8f26413b006a46e9fc2.png

目前行业里最难的视觉任务之一——单目视觉测量,特斯拉后,毫末把视觉BEV感知框架引入到了车端鱼眼相机,做到了在15米范围内达到30cm的测量精度,2米内精度高于10cm的视觉精度效果。

毫末在视觉感知能力上的进步,落到量产阶段最直观的体现是同等能力前提下,智能驾驶硬件成本更低(取消各种雷达),功能进一步下放主流价位车型。

dae6de0bc2a95eb5f6aba018f91b8d02.png

其实除了毫末,业内几乎所有玩家都走上了这样一条道路。这也是自动驾驶行业对去年以来遇到的“瓶颈”最直白的回答——

技术换时间,规模化部署和成本下探加速再加速。

谁能率先掌握低成本高效率的数据利用能力,谁就能最快看到全无人驾驶的曙光。

245e109aa55392d6f0162d7be5316f05.png毫末智行CEO顾维灏

毫末智行CEO顾维灏认为:“基于真实用户场景的反馈数据能够让我们更好的优化产品,让产品进步的更快。所有技术都要转化为对人有用的产品才最有价值。”

智能驾驶规模化普及更加明明朗,带来的自然是数据收集从量变跃迁到质变,而这需要的正是类似DrivieGPT的能力。

所以毫末智行率先把GPT用在自动驾驶,是给自动驾驶大规模普及带来了新的希望。

仅就毫末智行来说,雪湖·海若投入使用给业务带来的提升,至少有三个层面。短期来看,最早上车的长城魏牌车主用户,能享受更加好用强大的智能驾驶功能;中期来看,目前各家争夺的城市领航辅助功能,毫末借助大模型的迭代效率,很有可能在年内实现规模化上线(并非只在一两个城市)。

而长期来看,毫末智行将自动驾驶各个环节接入雪湖·海若之后,会进一步加速纯视觉方案能力的提升和成本下降,实现数据规模从量变到质变,从而最终实现端到端自动驾驶。

这本身具有颠覆性、跨越性的意义,将重塑汽车智能化技术路线。

0e5531f98e6bb79a4de46e8afa75cf0c.png

雪湖·海若上线的同时,毫末还向B端合作伙伴开放系统,共同探索大模型在机器人、芯片等等行业的潜力。

ChatGPT的出现,让人们看到深度学习引领的AI热潮非但没有瓶颈,反而更剧烈的爆发,甚至指向了AGI(通用人工智能)可能的落地前景。

同样,毫末的雪湖·海若,除了加速自身业务,也指向了一条新的通向更高阶全无人自动驾驶的可能之路。

今后对自动驾驶实力的评判参考,除了落地速度、使用体验,最核心的还会加一条:大模型大数据能力。

One more thing

海若,出自《庄子·秋水》。

文中有两个神话人物河伯和海若。河伯请教海若,何谓大小之分,海若教导,不因天地而觉大,不因毫末而觉小。

“海若”,寓意着智慧包容、海纳百川。

“雪湖”又是从何而来,你知道吗?

—  —

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12996.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

写个AI虚拟主播:看懂弹幕,妙语连珠,悲欢形于色,以一种简单的实现

这不是你期望的介绍深度学习大模型的文章。而是使用人人都能理解、编程、运行的简单技术(包括机器学习和非机器学习技术),通过一系列工程进行整合、组装,从而实现一个 AI 虚拟主播的故事。 muvtuber 让 AI 成为虚拟主播&#xff…

chatgpt赋能python:Python遍历-一种高效的数据处理技术

Python 遍历 - 一种高效的数据处理技术 对于程序员来说,数据处理是一个常见的任务。而在处理数据时,遍历是最常用的技术之一。Python 是一种强大的编程语言,它提供了很多用于数据遍历的工具和函数。在本文中,我们将介绍 Python 中…

ChatGpt输出结果时,文字中间有一根长长的删除线标记是什么意思?(ChatGpt删除线标记)

如图,这根删除线的含义是: 表示该文字不可信或是不准确的,建议仔细核实其内容。 这是系统为了提醒用户注意文字中可能存在的错误,避免对实际操作产生误导。

Stack Overflow 临时禁用 ChatGPT 生成内容,网友:人类和AI快打起来!

如果有一天我们查询到的「知识」真假难辨,那这就太可怕了。 要问最近 AI 圈哪个模型最火爆,你不得不把 OpenAI 推出的 ChatGPT 排在前面。自从发布以来,这个对话模型可谓是出尽风头,很多人更是对其产生了一百个新玩法,…

chatgpt开发内核定时器模块的完整过程

描述任务需求后,几乎在同一时刻chatgpt给出响应,开始进入代码刷屏模式,coding过程中还不忘给代码添加注释。 要求它顺便将Makefile文件写好提供给我,刷完代码后,进跟着开始刷Makefie文件: 编译生成的代码时…

MyBatisX插件没有出现蓝色鸟

如题,新版1.5.~的MyBatisX插件下载后,只有xml文件前出现红色鸟,对应的mapper接口中没有蓝色鸟。 解决办法:在idea中卸载掉该插件,加入插件页面中给出的qq群号,去群文件里下载1.4版本的压缩包,并…

新概念2-课文名称和知识点

目录 一、新概念2课文特点 二、新概念2知识点 1、新概念2知识点思维导图 2、简单句的核心 3、简单句的扩展 4、复合句 三、新概念2课文明细 一、新概念2课文特点 1)总计96篇课文,4个单元,每个单元都是逐步加深知识点 2)一…

蓝鸟BIP-1300无线终端解锁未签名程序运行权限

我司有一批BIP-1300,安装WM6系统。因为机器服役时间过长,系统很慢,于是将其中两台机器恢复了出厂设置。(F6Reset) 但是出现了一个问题,重置后的系统拒绝执行未经签名的应用程序,也拒绝Windows …

ChatGPT 成学生“作弊神器”?教授:“我感到极度恐惧”

上线没到一个月,ChatGPT 已经被网友玩出了“花”:写诗、编剧本、写代码、做计算题……在 ChatGPT 获得颇多赞誉的同时,近来一些学术界教授却发现了它另一种令人担忧的用途:学生正在利用 ChatGPT 代写论文。 为此,弗曼…

ChatGPT已死?AutoGPT太强?

今天聊聊 AutoGPT。 OpenAI 的 Andrej Karpathy 都大力宣传,认为 AutoGPT 是 prompt 工程的下一个前沿。 近日,AI 界貌似出现了一种新的趋势:自主人工智能。 这不是空穴来风,最近一个名为 AutoGPT 的研究开始走进大众视野。特斯拉…

Midjourney|文心一格 Prompt:完整参数列表、风格汇总、文生图词典合集

Midjourney|文心一格 Prompt:完整参数列表、风格汇总、文生图词典合集 1.Midjourney 完整参数列表 参数名称 调用方法使用案例注意事项V5V4V3niji版本在关键词后加空格,然后带上版本参数: --v 或者 —v –version 或者 —versionvibrant cali…

AI本地绘画软件(无需联网)+7Glatest模型+10G数据整合包

今年的AI技术实在太强了......AI对话、AI绘画...后面围绕AI演变出的无数产品正在跃跃欲试,颇有种让人跟不上时代的感觉;如果说ChatGPT是AI对话领域的老大哥,那么Midjourney就是全网最强的AI绘画平台,只要关键词描述得够好,它生成的…

元宇宙走进现实,被黑科技普照的生活日常真的来了

开年热播的《三体》,开启了对科技文明的全新想象。今年ChatGPT更是引发热议,人工智能、科技创新成为高频词汇,“元宇宙看两会”系列更是融合了比特数智人形象生成、AR互动技术、定位跟踪等技术,将科技互动感和沉浸感拉满。当下&am…

2023上海车展,智能汽车发烧友逛展攻略

来了,来了!我们来了! 2023上海国际汽车工业展览会,上海国家会展中心,一直持续到4月27日! 各大汽车先锋企业汇聚于此。诸多全球首发/国内首发新车首次展现锋芒,众多领先汽车科技集聚于此。 什…

巴比特 | 元宇宙每日必读:美国网红利用“AI版的自己”和网友谈恋爱,收费每分钟1美元,GPT时代,数字人会变得更加普及吗?...

摘要:据科技新知报道,国外拥有180万粉丝的Snapchat网红Caryn Marjorie,开发AI版本的自己,结合GPT-4,利用不同版本的Caryn AI和粉丝谈恋爱,按分钟收费。除了视频博主,线上讲师、带货主播、导游、…

想成为顶级 AI 绘画师?先让这 7 个平台帮你成为 Prompt 高手

ChatGPT 的流行使得 AI 成为 2023 最大的科技风口,同时驱动了各种类型的 AI 发展。这些 AI 正在改变甚至颠覆很多行业的业务模式。ChatGPT 推动了 生成式 AI 革命的到来,这正在彻底颠覆内容的生产方式。自PGC、UGC 之后,内容生成终于迎来下一…

用Cursor 来提升你的开发效率

背景 随着chatGPT的兴起引起了整个社会对于智能化的关注度,那么它究竟能做什么?对我们日常工作有哪些影响? 前言 作为团队TLor程序开发or测试开发,chatGPT能帮我们干什么事情 (1)代码注释不够阅读困难-…

人工神经网络在肺结核诊断中应用的研究进展

人工神经网络在肺结核诊断中应用的研究进展 作者:胡青云 指导老师:杭诚方、李舰 摘要:结核病是一种全世界致死率极高的传染性疾病,转染性极强,可通过空气传播。该病在亚洲和非洲发病率极高,尤其是在大多数低收入国家。…

女子用ChatGPT交1000+男友,聊天按分钟收费,一周收入50万

量子位 | 公众号 QbitAI 注意看,这个女人叫卡琳,靠着GPT-4,她现在同时谈着1000男朋友。 对,我知道事情听上去有些离谱。就连GPT-4自己,都直呼“我一个AI都觉得非常不常见”。 但是先别急,因为更让人挠头的事…

一个10年符号主义学者的深度讨论:如何理性看待ChatGPT?

大厂技术 坚持周更 精选好文 趣谈前端, 让技术, 更有料 【导读】从ChatGPT来看,符号主义和连接主义该如何发展? 近十年,连接主义者在各种深度学习模型加持下,借着大数据、高算力的东风在人工智能赛道上领跑符号主义。 但每次有新…