3D视觉感知新SOTA BEVFormer复现nuscenes数据集测试demo

0 写在前面

分享最近在BEV感知方面的工作,欢迎自动驾驶同行交流学习,助力自动驾驶早日落地。

1.概述

对于自动驾驶而言,BEV(鸟瞰图)下的目标检测是一项十分重要的任务。尽管这项任务已经吸引了大量的研究投入,但灵活处理自动驾驶车辆上安装的任意相机配置(单个或多个摄像头),仍旧是一个不小的挑战。

为此提出BEVFormer,利用了Transformer强大的特征提取能力以及Timestamp结构的时序特征的查询映射能力,在时间维度和空间维度对两个模态的特征信息进行聚合,增强整体感知系统的检测效果。

论文连接:https://arxiv.org/pdf/2203.17270v1.pdf

代码链接:GitHub - zhiqi-li/BEVFormer

关于BEVFormer

BEVFormer通过预定义的网格状BEV查询,将时间和空间进行交互,从而挖掘空间和时间信息。为了聚合空间信息,我们设计了一个空间交叉注意( spatial cross-attention),每个BEV查询都从摄像机视图的感兴趣区域提取空间特征。对于时间信息,我们提出了一种时间自我注意( temporal self-attentio),以反复融合历史BEV信息。在nuScenes数据集上,NDS评估值指标达到了SOTA : 56.9%,比之前基于激光雷达的SOTA方法性能高9个点。我们进一步表明,BEVFormer显著提高了低能见度条件下目标速度估计和调用的精度。

 图1

2.结构框架

 图2

BEVFormer的编码层包含网格状的BEV查询、时间自我注意和空间交叉注意。

在空间交叉注意中,每个BEV查询只与感兴趣区域的图像特征交互。

在时间自注意力中,每个BEV查询都与两个功能交互:当前时间戳的BEV查询和前一个时间戳的BEV功能。

3.配置环境详细参考源码,这里不一一阐述,在这里分享我配置过程中的问题及解决方法

  • 报错:No module named 'tools'  分析:绝对路径没有识别到 
  • 解决:export PYTHONPATH=${PYTHONPATH}:/home/mnt/mmdetection3d/BEVFormer/tools
  • source ~/.profile

在终端执行:python tools/create_data.py nuscenes --root-path ./data/nuscenes --out-dir ./data/nuscenes --extra-tag nuscenes --version v1.0 --canbus ./data

若生成下图所示结果表明数据处理正确

4.实验结果,demo展示

nuScense包含1000个,每个约20s的数据,标注2Hz,每个样本包含6个摄像机具有360度的水平场景。对于目标检测任务有标注了1.4M个3D框,共包含10个类别。5种评价标准:ATE, ASE, AEO, AVE, AAE,另外,nuScense还提出了NDS来计算综合评分。

BEV特征能够被用于3D目标检测和地图语义分割任务上。 常用的2D检测网络,都可以通过很小的修改迁移到3D检测上。实验验证了使用相同的BEV特征同时支持3D目标检测和地图语义分割,实验表明多任务学习能够提升在3D检测上的效果。

连续帧的视频demo:

3D视觉感知新SOTA BEVFormer复现nuscenes数据集测试demo_哔哩哔哩_bilibili3D视觉感知新SOTA BEVFormer复现nuscenes数据集测试demo, 视频播放量 1、弹幕量 0、点赞数 0、投硬币枚数 0、收藏人数 0、转发人数 0, 视频作者 小张做CV, 作者简介 一个做自动驾驶感知的码农,独角兽实习生,相关视频:讲师亲授!《深度学习实战》课纲解读与学习指导,0基础直达论文发水平,就业&毕设&竞赛一步到位!,终于找到了!这绝对是全B站最详细(没有之一)OpenCV入门到精通全套视频,整整150集(建议收藏慢慢看),最全!Transformer最新顶会论文100篇合集,语义SLAM(ORBSLAM2+FCAF3D),震撼!AI自动写程序,CVPR2022车道线检测SOTA工作CLRNet在Tusimple数据集训练测试demo,助力自动驾驶早日落地,【YOLO目标检测】不愧是清华教授,3小时就把导师三年没让我搞明白的YOLOv7/v6/v5/v4/v3/v2/v1讲明白了!简直让我茅塞顿开!,ChatGPT VScode 插件已上线。,ECCV2022 SimpleRecon 无需 3D 卷积的高质量三维重建方案,终于找到了!这绝对是全B站最详细(没有之一)OpenCV入门到精通全套视频,整整130集(建议收藏慢慢看)https://www.bilibili.com/video/BV16P411K7rp/

写在最后:由于我的设施有限,训练数据有所减少,推荐大家最好在8个GPU上训练

回答:从视觉算法的角度来说,识别物体是否存在更多是语义层面的问题,这一过程依赖于训练数据,必然存在漏检、误检等错误。而通过 LiDAR 等设备从物理层面上识别物体的存在则更为可靠。此外,多尺度、小物体检测等视觉算法中存在的传统问题也会制约系统的性能。

具体流程大家可通过bilibili评论区询问,我会在评论区给大家解答,更多优质资料分享可通过本人CSDN公主号,大家关注后留言即可

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/24067.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CCF认证202305-1重复局面

题目背景 国际象棋在对局时,同一局面连续或间断出现3次或3次以上,可由任意一方提出和棋。 问题描述 国际象棋每一个局面可以用大小为 的字符数组来表示,其中每一位对应棋盘上的一个格子。六种棋子王、后、车、象、马、兵分别用字母 k、q、…

地鼠君黑盒测试--小白如何梳理需求,告别听不懂

没有需求文档的痛苦 刚开始作黑盒(功能)测试时,小白难免会遇到这种情况,就是需求梳理不清晰,没有需求文档或者需求文档太简单。这种一开始没人带时,不容易发觉后续测试多痛苦。 笔者一开始时,就…

记一次购买海外服务器的经历和python包管理小记

概述 最近在研究ChatGPT,需要有个服务器一直挂着,刚好看到raksmart在搞活动; 可以关注下,他们的活动页面 https://billing.raksmart.com/whmcs/index.php?rp%2Fannouncements&languagechinese-cn 刚好四月,有便…

No signature of method: build_*.android() is applicable for argument types

意思很直观:就是build的时候,android()的参数错误。 更新android studio 后出现这种问题,主要是新版本的生成的app和module模版有所变化引起的。 Android Studio Electric Eel | 2022.1.1 Patch 1 Build #AI-221.6008.13.2211.9514443, built…

01 Faster R-CNN系列

目录 一、 R-CNN 1. R-CNN流程(4个步骤 ) 2. RP的确定 3. 预训练模型微调(backbone) 4. SVM的分类 5. bbox regression的训练 6. NMS 二、 Fast R-CNN 1. Fast R-CNN算法流程 2. 候选区域生成 3. 预训练模型微调&#…

ChatGPT API 遇见 Tistory:自动化英语学习博客

这是通过集成 ChatGPT API 创建自动化英语学习内容系列中的第三部分。 转发: ChatGPT API Meets Tistory: The Automated English Learning Blogs 项目介绍 介绍 这是通过集成 ChatGPT API 创建自动化英语学习内容系列中的第三部分。 我正在尝试整合各种平台。 第一个是 Se…

cahtgpt算法压力测试(丁真版,更新gpt4(暴风哭泣了已经))

更新 补充了gpt-4版本的答案,只能说牛逼,我收回之前的替代不了高级科研工作者的结论,话不多说上答案: 可以看到这里已经吊打got3.5了,它能把这个问题解释的很清楚了 那么关于GPF算法和varimax的关系呢 可以看到gpt3…

连音乐都可以创作!Google AI部门推出交互式体验

机器学习也能应用在音乐上吗?Google AI部门的Magenta研究项目PAIR计划团队打造出第一个由AI驱动的Doodle服务,Doodle为一项交互式体验,让用户自行创造一段旋律,按下和声演奏(Harmonized)的按钮后&#xff0…

现在程序员的工资是不是被高估了?

图片来源:AIGC 文章来源:www.zhihu.com/question/295009798 韩冬 不是程序员的工资被高估了。而是在中国,IT行业是少有的劳动者议价能力强,能够比较公平的和资方分配公司收入的行业。 最近三十年我国经济突飞猛进,GDP从…

im即时通讯开发/聊天软件系统/社交APP源码搭建/私有化部署聊天原生开发源码快速搭建

由IM技术专家打造的基于 Java 实现的即时通讯(IM)项目 我们提供私有化即时通讯解决方案,独立部署在您自己的服务器上、代码可以开源、支持二次开发、苹果端上线指导,源码出售,提供远程技术指导,全程指导服务…

微分销机制设计_免费快速搭建微信分销商城_OctShop源码

现在微信的流量以及用户基数的庞大,让很多企业或商家都想在微信里面分一杯羹。搭建一个微信分销商城是一个很明智的选择, 而一个比较完善的商城系统,它的设计与开发是庞大复杂的系统工程,比较耗时耗财。 如何快速免费搭建一个大型专业级的微信…

全新开源微商城源码带分销 支持多端+搭建部署教程

分享一个全新版开源微商城源码带分销功能,支持10终端合一,功能强大,含完整代码程序包和搭建部署教程。 系统特色功能一览: 1、一个后台管理所有设备端,支持:电脑H5手机微信ipad微信小程序支付宝小程序百度…

股票左侧交易策略

文章目录 1.散户炒股常见问题1.1.满仓、重仓操作1.2.一买就跌一卖就涨-反复被洗1.3.追高被套1.4.持股数量过多1.5.过分迷恋技术分析1.6.不会逆向思考1.7.没有自己成型的操作策略 2.认识市场、认识主力、认识自己2.1.认识市场2.1.1.A股的本质是政策市 2.1.2.A股的本质是圈钱市2.…

外汇经典交易策略,最基本的趋势跟踪策略

在所有的经典交易策略中,趋势跟随策略可以说是非常主流的策略,趋势跟随策略一直是盈利能力非常强的交易的策略,往往可以出现较大盈利的策略一般都有趋势跟随的影子,毕竟交易的一条基本准则就是:顺势而为。下面我们介绍…

股票打板策略分析

股票打板策略分析 这里我们只分析一件事情,就是如何打板才能最大概率赚到钱,就是我们可以分析过去一天涨停今天还涨停、分析过去两天涨停今天涨的概率,一直到过去10天涨停今天涨的概率,其实很多人都喜欢打板,但是可能…

我的股票交易策略

投资股市已经成为我们进行资产配置的一个重要选择。在这个市场中主流的投资方式无外乎 价值投资 和 趋势投资 两种。价值投资需要了解各种财务指标来评价各支股票,在被市场低估时买入,在被市场高估时卖出。这对于非财务背景的人来说门槛偏高。趋势投资需…

【汇正财经】沪深创集体收涨

盘面回顾: 今日沪深创午盘均有反弹,收盘沪指涨0.54%,深成指涨0.02%,创业板指涨0.16%。中字头板块集中走强;午后银行板块领涨大金融,助力大盘V型反弹;ChatGPT、算力概念股午后跌幅收窄&#xff…

快讯|山东大学仿生两栖软体机器人; 男子用 ChatGPT 编假新闻赚流量牟利,被警方采取刑事强制措施

一分钟速览新闻点 男子用 ChatGPT 编假新闻赚流量牟利,被警方采取刑事强制措施山东大学仿生两栖软体机器人中国科研团队让机器人通过“看一看”“摸一摸”识别地形OpenAI 不再使用 API 客户数据训练 ChatGPT高通芯片被发现用于收集和传输用户信息,全球约…

巴比特 | 元宇宙每日必读:微软将于下周发布大语言模型GPT-4,多模态成为最大亮点,专家称可为大客户每天节省 500 个工时...

摘要:据德国新闻媒体 Heise 报道,微软德国公司首席技术官 Andreas Braun 在一场活动中宣布GPT-4 将在下周发布,拥有多模态(multimodal)模型将提供完全不同的可能性。多模态 AI不仅可以将文本相应地翻译成图像&#xff…

提高AI算力,异构优化也是关键

近期,劲爆亮相的ChatGPT着实让人们眼前一亮,让普罗大众也“亲密”体验了人工智能(AI)的神奇魔力,窥见了智能未来的璀璨前景之一斑。 然而,就在这离生活愈来愈近的AI让人们对未来充满无限憧憬、满怀激动的同…