BEV感知:BEVDet

自动驾驶:BEVDet

  • Introduction
  • Methodolo
    • Data Augmentation
    • Network Structure
    • Scale-NMS
  • 实验

Introduction

作者通过现有的算法(LSS)、独特的数据增强方案与新的NMS方案整合了一个BEV框架(BEVDet)。
如下图:
在这里插入图片描述
这个框架分为四部分:

  1. Image-view-Encoder(Backbone + neck)。
  2. View Transformer(这就是LSS的lift与splat)。
  3. BEV Encoder (得到BEV特征在通过CNN或者attention提取bev特征)。
  4. Head。

在实验中,BEVDet很好的权衡了检测准确度和时间效率。在nuScenes val集上时,作为快速版本的BEVDet-Tiny的得分为31.2% mAP和39.2% NDS。与FCOS3D相比,BEVDet只需要215.3 GFLOPs 的计算开销, 是FCOS3D11%);运行速度每秒15.6帧,比FCOS3D快9.2倍。另一个高精度版本 BEVDet-Base评分为39.3% mAP和47.2% NDS, 显著地超过所有已发表的结果。在一个相当快的推理速度下,它与FCOS3D相比,mAP 提升了9.8%, NDS 提升了10.0%。

Methodolo

Data Augmentation

坐标转换公式:
在这里插入图片描述

作者在训练途中遇到了严重的over- fitting ,因为在nusuense 数据集下每个场景有6个cam组成,这六个中必然会有交叉的场景重复出现。

另一方面,基于图像视图编码器的批处理大小是子序列模块的N倍。训练数据的不足也是导致在基于BEV空间中学习过拟合的一部分原因。

作者起初想用一些数据增强的方法来缓解过拟合,但是这种方法只在没有bev的时候很work,因为假如我所有的2d image 都做了翻转(所有image做了相同角度的倾斜),由于后面需要把feature融入视锥,而视锥没有倾斜,这样会导致空间分布不一致,造成不必要的噪声。

公式表示如下:
假设本来的pixel 坐标为:
在这里插入图片描述

本来的 3d voxel 坐标为:

在这里插入图片描述

image 数据增强后:
在这里插入图片描述
但是这是3d voxel坐标他是没发生变化的,因为它是在生成视锥是根据原图确定的,而数据增强是在训练阶段进行的,他们没有做到同步。

于是我们需要对它3d voxel 进行逆矩阵变换使得2d 3d 空间分布一致(也就是还是符合通过内外参数的光学成像对应关系), 公式如下:
在这里插入图片描述

Network Structure

这里大家直接看图,简单明了。

在这里插入图片描述

Scale-NMS

在这里插入图片描述

BEV空间中不同类别的空间分布与图像视图空间中的空间分布截然不同。在图像视图空间中,由于相机的透视成像机制,所有类别共享相似的空间分布。因此,对于经典的NMS策略对于不同的类别都采用相同的阈值来来筛选预测结果。(例如在2D目标检测中,任何两个实例的bounding box的IOU值总是低于0.5)

然而,在BEV空间中,各个类的占用面积本质上是不同的,实例之间的重叠应接近于零。因此,预测结果之间的IOU分布因类别而异。

比如行人和锥型交通路标在接地面上占用很小的面积,这总是小于算法的输出分辨率。常见的对象检测范式冗余地生成预测。每个物体的占地面积小,可能使冗余结果与真正结果没有交集。这将使依赖正样本和负样本之间空间关系(IOU)的经典NMS失效。

解决方法:
Scale-NMS在执行经典NMS算法之前,**根据每个对象的类别缩放其大小。**通过这种方式,调整正样例和冗余结果之间的IOU分布,以与经典NMS匹配。缩放因子是特定于类别的。它们是通过对验证集进行超参数搜索生成的。

实验

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/46516.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【自动驾驶】高级辅助驾驶系统与车联网

【自动驾驶】高级辅助驾驶系统与车联网 Note:本文是对刘春晖教授的 高级辅助驾驶系统与车联网(上),高级辅助驾驶系统与车联网(下) 论文进行排版整理,由于论文中插图较多,并没有全部整理进来,用能力的小伙伴请看原文 文…

自动驾驶技术

高精地图(HD Maps):支持其他模块 定位(Localization):讨论汽车如何确定他所处的位置,汽车利用激光和雷达数据,将这些传感器感知内容与高分辨地图进行对比,这种对比使得汽…

自动驾驶仿真软件简介----CARLAGazeboLGSVLOthers

CARLA CARLA 是一个开源模拟器,它使自主驾驶研究领域平民化。模拟器是开源的,是基于虚幻引擎开发的。它是一个模块化和灵活的工具,配备了强大的API来支持ADAS系统的培训和验证。因此,CARLA试图满足ADAS各种用例的要求&#xff0c…

自动驾驶概述

自动驾驶概述 邱辉俊(少隆) 高德技术 2021-09-28 11:37 导读 汽车行业处在一个变革的时代,自动驾驶相关技术发展应用如火如荼。关注或者想了解这个领域的人也越来越多。本文的目标在于帮助大家对自动驾驶技术有一个全局的基础认识。文章分别…

Google 悄悄更新:你发布的内容都将被用于 AI 训练

世上没有绝对的垃圾,只有放错位置的资源。在数字原住民的 Z 世代的口口相传中,「互联网时代 99%的公开信息都是垃圾」的粗略定义早已见怪不怪了,而有趣的是,彼之砒霜,我之蜜糖,以 Google 为代表的 AI巨头却…

文案智能改写-AI智能文章改写软件

随着人工智能技术的不断发展,越来越多的智能写作软件相继面世,其中,AI智能改写工具是一款非常有实用价值的工具。本文将从全自动批量改写、没有错别字和标准语法、支持图文模式改写、支持各种语言改写以及严格按照标准格式结构改写几个方面&a…

AIGC产生内容的版权到底归属于谁?

随着ChatGPT的火热,AIGC(人工智能生成内容)产生的内容越来越被大众使用,但是,有一个问题一直困扰着大家,包括放牛娃。那就是:AIGC产生的内容,有版权吗?版权到底归属于谁&…

33款可用来抓数据的开源爬虫软件工具

要玩大数据,没有数据怎么玩?这里推荐一些33款开源爬虫软件给大家。 爬虫,即网络爬虫,是一种自动获取网页内容的程序。是搜索引擎的重要组成部分,因此搜索引擎优化很大程度上就是针对爬虫而做出的优化。 网络爬虫是一个…

IntelliJ IDEA,真有你的!

因公众号更改推送规则,请点“在看”并加“星标”第一时间获取精彩技术分享 点击关注#互联网架构师公众号,领取架构师全套资料 都在这里 0、2T架构师学习资料干货分 上一篇:ChatGPT研究框架(80页PPT,附下载)…

盘点一个Jupyter显示的细节问题

点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 弦弦掩抑声声思,似诉平生不得志。 大家好,我是皮皮。 一、前言 前几天在Python白银群【小王子】问了一个Python基础的问题&…

5.1劳动节,Cocos社区年度精品大盘点!幸运抽奖,周边好礼送送送~

Cocos 引擎的生态建设与繁荣,离不开社区开发者的辛勤付出。 2022.5 ~ 2023.5 年度期间,有这样一批 Cocos 社区开发者,他们使用 Cocos Creaor 引擎创作内容与产品、分享技术和经验,为 Cocos 社区默默贡献自己的一份力量&#xff0c…

5.1劳动节,致敬最可爱的人!Cocos社区杰出贡献者出炉

Cocos 引擎的生态建设与繁荣,离不开社区开发者的辛勤付出。 2022.5 ~ 2023.5 年度期间,有这样一批 Cocos 社区开发者,他们使用 Cocos Creaor 引擎创作内容与产品、分享技术和经验,为 Cocos 社区默默贡献自己的一份力量&#xff0c…

都说今年高考作文很难?AI花5秒写了几篇,专家给满分,引爆全网热议!

来源 | 浙江新闻 每一年高考作文题目公布起 社交网络上就会掀起 “一年一度高考作文写作大赛” 今年,浙江语文采用新课标I卷 作文题目与“故事”有关 我们分别请ChatGPT、 文心一言、通义千问等大模型 来写了写今年的高考作文 ↓↓↓ ChatGPT 故事的力量&am…

AI聊天机器人,你更爱哪个?

嗨,各位同学,最近这几个人工智能助手可是火得很啊! 叮咚~AI哥们儿ChatGPT已经很强了,轻松应对各种问题,文笔挺不错的! 咻~Anthropic公司的Claude也很给力,聊天能力十分强大! 嗖~Google新出的Bard看着也很厉害,刚一出世就引起不小轰动! 面对这三个AI大佬,我们该如何抉择呢?今天…

浅尝ChatGPT使用之Python字典嵌套排序

一、背景 所负责的项目从v1.0升级到v2.0之后,发送到kafka的Json数据字段顺序和内容有所改变, v1.0版本推送数据样例: {"name": "小王子","author": "安托万德圣-埃克苏佩里(1900-1944&#…

Smart Client 高级开发(微软讲座下载)

出处: http://www.microsoft.com/china/msdn/events/featureevents/2004/SmartClientSeminar/index.aspx 经过设计,智能客户端应用程序可以将胖客户端应用程序的优点与瘦客户端应用程序的部署和可管理性优点结合起来,然而,要完全实现智能客户…

一文读懂微软转型秘诀

关注ITValue,看企业级最新鲜、最价值报道! 新眸出品 作者|叶静 编辑|桑明强 微软一直在试图转化新的角色。 相较云服务、生产力和个人计算三驾主力马车,游戏业务对微软的营收贡献并不大,但年初以687亿美元全…

Adtributor: Revenue Debugging in Advertising Systems 微软论文翻译

前言 毕设在做异常点检测与根因分析,就拿微软14年的文章作为主要参考文献了,这里把中文的翻译以及一些整理一起放在博客里,以作分享交流。 Adtributor: 广告系统中的收入调试 作者:Ranjita Bhagwan, Rahul Kumar, Ramachandran…

一起谈.NET技术,微软 Share Point 2010 企业应用解决方案

SharePoint 2010功能及改进 SharePoint 2010分为两个版本SharePoint Foundation 2010和SharePoint Server 2010,其中SharePoint Foundation 2010是WSS 3.0的升级,而SharePoint Server 2010则是MOSS 2007的升级(文中如无特别说明则SharePoint 2010是二者统…

免费ChatPPT来了/ 首例数字人侵权案判了/ 微软总裁炮轰英国...今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是4月28日星期五,终于,终于到了这一天。 还是照例送上科技圈新鲜事与最新AI工具推荐。 首例涉虚拟数字人侵权案 杭州互联网法院公众号披露了首例涉虚拟数字人侵权案判决结果。 由魔珐公…