自动驾驶数据集的应用与思考

数据作为新型生产要素,是数字化、网络化、智能化的基础,是互联网时代的“石油”“煤炭”,掌握数据对于企业而言是能够持续生存和发展的不竭动力,对于需要大量数据训练自动驾驶系统的企业而言更是如此。

而随着激光雷达、毫米波雷达、摄像机、全球定位系统、惯性测量单元等关键技术上车,一辆智能网联汽车所能够收集到的数据也越发丰富。据英特尔公司预测,一辆智能网联自动驾驶汽车每运行8小时将产生4TB的数据。但面对如此纷繁杂乱的数据,“如何利用、用在何处”成了各大企业面对的问题。基于此,各大研究所开源数据集为自动驾驶发展指明应用方向。

1.发展状况

2009年英国剑桥大学研究团队发布CamVid数据集,这是第一个标注了语义信息的视频数据集,包含激光雷达、相机和IMU三类传感器设备采集到的多段路况环境信息,其中图像包含有像素级的语义标注数据,为早期自动驾驶的研究提供了重要帮助。

2012年德国卡尔斯鲁厄理工学院发布KITTI数据集,它包含的点云、图像和实时定位数据,至今仍活跃在自动驾驶相关研究的科研一线,是自动驾驶和移动机器人定位导航领域最重要的算法验证数据集之一。

随后2014年牛津大学发布Oxford RobotCar数据集,2016年独立团队发布Cityscapes数据集,2018年百度发布ApolloScape数据集,2019年本田研究所发布H3D数据集,同年安波福发布nuScenes数据集等。2020年Waymo公司开展了史上最大的自动驾驶数据集采集计划,其数据采集的时间、地点、路线范围都远超已有的数据集。

这些数据集相比于早期的CamVid与KITTI数据集,在数据容量、数据丰富度和数据质量都有了十分明显的提升。至此,自动驾驶数据集的制作,已由早期的纯科研课题,转化为需要大规模人力、物力和财力支撑的工程化、商业化课题。

图片

2.应用方向及案例

正因采集到的数据丰富而多样,在将其应用到模型训练前,需要将各类数据分类并标注,以便其理解,再通过一代一代的升级,实现自动驾驶系统的完善。从自动驾驶系统的感知、决策、执行三方面出发,采集到的数据可以分为八大应用方向:目标检测数据集、语义分割数据集、车道线检测数据集、光流数据集、立体数据集、定位与地图数据集、驾驶行为数据集、仿真数据集。以下将简要介绍其中个别数据集应用案例。

目标检测数据集:Waymo数据集

目标检测需要识别出图片中目标的类别,并定位到目标的具体位置并用矩形框标。而Waymo数据集是到目前为止最大、最多样化的数据集。相比于以往的数据集,Waymo在传感器质量和数据集大小等方面都有较大提升,场景数量是nuScenes数据集的三倍,包括1950个自动驾驶视频片段(至少20s长);以及汽车、行人、自行车、交通标志四类标签;1260万个3D框,1180万个2D框;采集范围涵盖美国加州的凤凰城、柯克兰、山景城、旧金山等地区的市中心和郊区。同时涉及各种天气条件下的驾驶数据,包括白天、黑夜、黎明、黄昏、雨天、晴天等。

图片

语义分割数据集:Cityscapes数据集

语义分割指的是把图像中的每个像素都划分到某一个类别上。Cityscapes专注于对城市街景的语义理解,包含从50个不同城市的街景中记录的各种立体视频序列,拥有5000张在城市环境中驾驶场景的图片;具有19个类别的密集像素标注,其中8个具有实例级分割;高质量的像素级注释有5000帧,另外还包括20000个弱注释帧;标注类别包括平面、建筑、自然、车辆、天空、物体、人类和空洞等。

图片

 驾驶行为数据集:JAAD数据集

JAAD是用于研究自动驾驶背景下的联合注意力的数据集。重点是行人和驾驶员在交叉路口的行为以及影响它们的因素。为此,JAAD数据集提供了有丰富注释的346个短视频片段(5-10秒长)的集合,代表了北美和东欧不同天气状况下城市驾驶的典型场景,同时为所有行人提供了带有遮挡标签的边界框,使这个数据集适用于行人检测。行为注释说明了与司机互动或需要司机注意的行人的行为,每段视频都有几个标签(天气、地点等)和固定列表中带有时间戳的行为标签,例如停止、行走、寻找等。此外,还提供每一帧的可见交通场景元素列表,如停车标志、交通信号等。

图片

3.相关思考

基于此,数据有着丰富而又广阔的应用场景,对于强化自动驾驶的感知、决策、执行系统大有裨益,能够极大地提升自动驾驶的安全性,为用户的行车安全保驾护航。但是仍面临着一些亟待解决的挑战:

一是车辆数据的归属权。当前对于车辆数据的归属权尚未明确,厂商需要自建数据集以训练自动驾驶系统,成本高昂且效率低下。同时还存在着“数据量不足”和“交通状况覆盖面狭窄”等问题。

面对海量的用户数据,智己汽车提出了解决办法,即用户通过贡献数据换取“原石”。这一方法间接承认了用户的数据权益,明确了数据、用户、企业三者之间的关系,让用户可以利用数据升级车辆软硬件、享受智享服务等。虽然实际效果还有待用户验证,以及更明确的政策层面保障还有待出台,但是这一方法或许值得借鉴。

二是如何开放更深层次的数据集。当前,行业企业的数据由于缺乏统一的格式和标准以及有效的共享协同机制,难以形成完整的数据产业生态。而且对于自动驾驶系统而言,即使开源了数据集,其所需要的数据量是庞大的,一家企业的数据往往难以支撑起复杂的交通状况,需要各企业合力共建,打造从数据采集到数据标注,再到模型训练、数据分析的完整的数据闭环。

清华大学智能产业研究院率先响应,联合北京市高级别自动驾驶示范区、北京车网科技发展有限公司、百度Apollo、北京智源人工智能研究院共同发布了DAIR-V2X,该数据集提供的示范区内真实场景下的数据,覆盖了一些复杂的交通、天气、环境等信息。该数据集开放的目的还在于支持一批车路协同数据标准的制定,从而支撑自动驾驶的模型训练和数据分析,为行业发展降本增效。虽然目前还仅限示范区小范围,但这一系统性思路值得借鉴。

三是基于生成式大模型技术的思考。尽管面临着重重挑战,但随着科技的进步,尤其是大模型的出现给数据集的发展带来了机遇,为数据集的高效利用提供了新方法。业内大模型结合的NeRF技术,不仅能够重建数据集里的场景,还支持编辑天气、路况以及主车的姿态、位置、行驶轨迹等,以数据生成数据,减少了数据的采集需求。此外,对于数据的预处理,大模型能够自动分类驾驶场景,减少人工筛选劳动,据行业观察,其精准率达90%;其在助力数据标注,提升标注效率,降低人工成本方面也被看好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/486986.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LLM - 01_了解LangChain和LangChain4J

文章目录 官网概述LangChainLangChain的核心功能LangChain的应用场景 LangChain4JLangChain4J的特点LangChain4J的应用场景 LangChain vs LangChain4J小结 官网 https://www.langchain.com/langchain https://docs.langchain4j.dev/ 概述 随着人工智能和自然语言处理&#…

文献补充材料怎么查找下载

最近很多同学求助问补充文献怎么查找下载,补充文献一般会在文献的详情页,参考文献的上面。需要注意以下这些词汇:Supplementary data、Supplementary material、Appendix、Supplementary Information、Appendix A. Supplementary data、suppl…

Redis(二)

Redis 事务 什么是 Redis 事务? 你可以将 Redis 中的事务理解为:Redis 事务提供了一种将多个命令请求打包的功能。然后,再按顺序执行打包的所有命令,并且不会被中途打断。 Redis 事务实际开发中使用的非常少,功能比…

Spherical Harmonics (SH)球谐函数的原理及应用【3DGS】

Spherical Harmonics (SH)球谐函数的原理及应用【3DGS】 前言球谐函数(Spherical Harmonics, SH)球谐函数不同阶的表达式以及有什么不同?具体介绍球谐函数基函数球谐函数 前言 高斯泼溅Gaussian Splatting (GS) GS 模…

spring boot之@Import注解的应用

我们知道spring boot会通过ComponentScan定义包扫描路径进行业务定义的bean的加载,但是对于很多不在此包路径下定义的bean怎么办呢?比如其他jar包中定义的。这时候import就发挥作用了,通过它也可以实现bean的定义。具体是怎么做的呢&#xff…

python数据分析之爬虫基础:requests详解

1、requests基本使用 1.1、requests介绍 requests是python中一个常用于发送HTTP请求的第三方库,它极大地简化了web服务交互的过程。它是唯一的一个非转基因的python HTTP库,人类可以安全享用。 1.2、requests库的安装 pip install -i https://pypi.tu…

linux安装docker和mysql

1.下载安装doker 1. 更新系统,确保系统是最新的 sudo yum update -y2.安装 Docker 所需的依赖包: sudo yum install -y yum-utils 2. 设置 Docker 仓库 sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo 3. 安装 Dock…

【MFC】vs2019中使用sqlite3完成学生管理系统

目录 效果图list Contral 控件的简单使用使用sqlite3 效果图 使用sqlite3完成简单的数据库操作。 list Contral 控件的简单使用 本章只介绍基本应用 添加表头:语法: int InsertColumn(int nCol, LPCTSTR lpszColumnHeading, int nFormat LVCFMT_LEFT…

Linx下自动化之路:Redis安装包一键安装脚本实现无网极速部署并注册成服务

目录 简介 安装包下载 安装脚本 服务常用命令 简介 通过一键安装脚本实现 Redis 安装包的无网极速部署,并将其成功注册为系统服务,开机自启。 安装包下载 redis-7.0.8.tar.gzhttp://download.redis.io/releases/redis-7.0.8.tar.gz 安装脚本 修…

mysql笔记——索引

索引 InnoDB采用了B树索引结构。 相比于二叉树,层级更少,搜索效率高。 B树中叶子节点和非叶节点都会存储数据,导致段页式存储中一页存储的键值减少,指针也会减少,要同样保存大量数据,只能增加树的高度&a…

AI大模型赋能医学诊疗与药学服务——课题基金申请辅导项目成功举办

2024年11月23日,北京整合医学学会在线上成功举办了“AI大模型赋能医学诊疗与药学服务——课题基金申请辅导项目”。此次会议吸引了来自全国各地的医学、药学及人工智能领域的专家学者和科研人员积极参与,共同探讨AI大模型在医学诊疗与药学服务中的应用&a…

【C语言】编译和链接总结

系列文章目录 🎈 🎈 我的CSDN主页:OTWOL的主页,欢迎!!!👋🏼👋🏼 🎉🎉我的C语言初阶合集:C语言初阶合集,希望能…

PyQt信号槽实现页面的登录与跳转 #页面进一步优化

将登录框中的取消按钮使用信号和槽的机制,关闭界面。 将登录按钮使用信号和槽连接到自定义的槽函数中,在槽函数中判断ui界面上输入的账号是否为"admin",密码是否为"123456",如果账号密码匹配成功,当前界面关…

安防视频监控平台Liveweb视频汇聚管理系统管理方案

智慧安防监控Liveweb视频管理平台能在复杂的网络环境中,将前端设备统一集中接入与汇聚管理。国标GB28181协议视频监控/视频汇聚Liveweb平台可以提供实时远程视频监控、视频录像、录像回放与存储、告警、语音对讲、云台控制、平台级联、磁盘阵列存储、视频集中存储、…

Ubuntu中配置交叉编译工具的三条命令的详细研究

关于该把下面的三条交叉编译配置语句加到哪里,详情见 https://blog.csdn.net/wenhao_ir/article/details/144326545 的第2点。 现在试解释下面三条交叉编译配置语句: export ARCHarm export CROSS_COMPILEarm-buildroot-linux-gnueabihf- export PATH$…

C#实时监控指定文件夹中的动态,并将文件夹中生成的新图片显示在界面上(相机采图,并且从本地拿图)

结果展示 此类原理适用于文件夹中自动生成图片,并提取最新生成的图片将其显示, 如果你是相机采图将其保存到本地,可以用这中方法可视化,并将检测的结果和图片匹配 理论上任何文件都是可以监视并显示的,我这里只是做了…

计算机毕业设计SpringBoot+Vue.js知识图谱课程推荐系统 课程预测系统 mooc慕课课程爬虫 课程大数据 课程数据分析大屏 大数据毕业设计 大

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…

day05-开发接口-学习记录和学习计划

1. 查询用户的课程学习记录 1.1 代码实现 Controller层: package com.tianji.learning.controller;import com.tianji.api.dto.leanring.LearningLessonDTO; import com.tianji.learning.service.ILearningLessonService; import com.tianji.learning.service.IL…

【C++】指针与智慧的邂逅:C++内存管理的诗意

文章目录 RAII 智能指针auto_ptrunique_ptr shared_ptr模拟实现定制删除器循环引用 和 weak_ptr RAII RAII(Resource Acquisition Is Initialization)是一种广泛应用于 C 等编程语言中的编程范式,它的核心思想是:资源的获取和释放…

Elasticsearch vs 向量数据库:寻找最佳混合检索方案

图片来自Shutterstock上的Bakhtiar Zein 多年来,以Elasticsearch为代表的基于全文检索的搜索方案,一直是搜索和推荐引擎等信息检索系统的默认选择。但传统的全文搜索只能提供基于关键字匹配的精确结果,例如找到包含特殊名词“Python3.9”的文…