本文首发于微信公众号 CVHub,未经授权不得以任何形式售卖或私自转载到其它平台,仅供学习,违者必究!
导读
欢迎来到CVHub
技术文章年中总结专区!本篇文章将为您呈现CVHub
平台上的一系列优质技术文章,这些文章包含了各种计算机视觉相关的主题,从科普软文、算法原理到工程实战等。今天,我们将对这些文章进行了归类和整理,以帮助您更好地了解目前各种技术领域的发展和最新趋势。希望这篇总结可以为您提供有益的信息和思路,以便您在计算机视觉领域的学习和研究中取得更多的进展。
领域总结
- 万字长文带你入门计算机视觉
- 万字长文带你入门目标检测
- 万字长文带你入门语义分割
- 万字长文带你入门增量学习
- 万字长文带你入门Transformer
- 万字长文带你入门变分自编码器
- 万字长文带你入门半监督语义分割
- 一文看尽深度学习中的各种卷积模块
- 一文看尽深度学习中的各种池化方法
- 一文看尽深度学习中的各种数据增强
- 一文看尽深度学习中的各种经典GAN
- 一文看尽深度学习中的各种损失函数
- 一文看尽深度学习中的各种注意力机制
- 一文看尽深度学习中的各种目标检测器
神经网络架构
- CVPR2023 | 清华黄高团队提出适配边端和云端的即插即用型高效神经网络网络架构——Slide-Transformer
- 清华提出最新移动端高效网络架构 CloFormer: 注意力机制与卷积的完美融合!
- 苹果推出新型网络架构 FastViT: 又快又强又稳,端侧一键部署毫无压力!
- 卷麻了! nnUNet 研究团队重磅新作 | MedNeXt: 新一代分割架构之王,刷新多项榜单记录!
- CVPR2023 | BiFormer: 基于动态稀疏注意力构建高效金字塔网络架构
- CVPR2023 | SparseViT:一种有效处理高分辨率图像的Transformer
- Facebook团队新作 | Rev-ViT: 一种即插即用且对内存友好的Transformer架构
- ICLR 2023 | SLaK: 将 ConvNeXt 稀疏化是一种怎样的体验?
- 高效神经网络架构的正确打开方式! | EMO:结合 CNN 和 Transformer 的现代倒残差移动模块设计
- CVPR 2023 | PA&DA:联合优化路径和数据采样的超网一致性NAS
- CoTNet | 性能超越BoTNet、Swin!Transformer+CNN=奠定CV模型新格局(附代码解读)
- 超越MobileNet V3,高质量轻量化模型SkipNet+Bias Loss详解
检测跟踪
- 现代目标检测集合
- CVPR 2023 | LoGoNet:优于所有最先进的 3D 目标检测方法!
- 港科大 Arxiv 2023 | DA-BEV: 3D目标检测新 SOTA,一种强大的深度信息挖掘方法
- Beyond YOLOv8! | YOLOv6 v3.0 is coming!
- 厦大纪荣嵘团队新作 | OneTeacher: 解锁 YOLOv5 的正确打开方式
- 阿里新作 | 探讨 YOLOv5 的高效进阶之路
- 如何用YOLOv5玩转半监督(附源码实现)
- 华中科大、百度&港大联合出品 | ByteTrackV2: 一种简单且强大的 2D/3D 多目标跟踪框架,横扫多项任务SOTA!
分割识别
自然图像
- CVPR’2023 | PIDNet: 基于注意力机制引导的实时语义分割网络架构,完美解决空间细节、上下文和边界信息!
- CVPR’2023 | MP-Former: 精度高&收敛快-Mask2Former全能图像分割的进阶之路
- CMNEXT: 基于编解码架构的强大语义分割基线,解锁多模态语义分割的正确姿势!
- 上交大马利庄团队 CVPR 力作 I ISDNet: 探索超高分辨率图像分割的高效之道
- 高通AI研究院-CVPR2022 | FFNet:高效语义分割极简架构之神
- ICLR 2023 | PatchDCT: 传承 Mask R-CNN 经典,延续 DCT-Mask,开启精细化实例分割新篇章!
- ICLR 2023 | SeaFormer: 轻量高效的注意力模块助力高分辨率语义分割端侧应用!
- 阿里团队新作 | AFFormer:利用图像频率信息构建轻量化Transformer语义分割架构
- UN-EPT | 一种用于语义分割任务的统一高效金字塔Transformer网络
医学图像
- 2023 港科大医学图像分割新作 | PHNet: 当MLP与CNN巧妙结合会擦出什么火花?
- CVPR2023 | 节省67%计算成本,高精度视频语义分割再下一城!
- 大连理工卢湖川团队TMI顶刊新作 | M^2SNet: 新颖多尺度模块 + 智能损失函数 = 通用图像分割SOTA网络
- MICCAI 2022 | VT-UNet: 基于 3D UNet 架构的 Transformer 医学图像分割开篇之作!
- 集简单、高效、轻量化于一体 | ICLR 2023 新鲜出炉医学图像分割之王: 3D UX-NET
图像识别
- 中科大团队新作 | 全新“扫描全能王”通用框架(附在线体验DEMO,赶紧来玩吧!)
- CVPR2023 | 结合二进制编码器的人脸年龄估计模型
即插即用
- 顶刊TIP 2023 | CFP:即插即用的多尺度融合模块,助力检测分割任务有效涨点!
- SPM: 一种即插即用的形状先验模块,可轻松嵌入任意编解码架构,助力涨点并显著改善分割效果!
- 即插即用系列|Make FCN Great Again: 全局感受野助力全卷积神经网络涅槃重生!
- 即插即用! | 国防科大联合慕尼黑工业大学提出新型解耦头 TSCODE: 助力目标检测器轻松涨点!
- 即插即用系列!| Spatial Bias: 一种简单有效的超轻量全局编码方法
- 即插即用系列!| CFNet:一种新颖的多尺度融合方法,显著提升检测和分割性能!
- 即插即用系列!| Skip-Attention:一种能显著降低Transformer计算量的模型轻量化方法
- 即插即用系列! | 中山大学团队最新无参注意力模块,拳打SE脚踢CBAM(附代码解读)
大语言模型
- 南洋理工开源海外中文大语言模型Panda LLM | 探索数据因素和训练策略如何影响大模型性能表现
- 上海人工智能实验室发布LLaMA-Adapter | 如何1小时训练你的多模态大模型用于下游任务
- 哈工大团队开源医学智能问诊大模型 | 华佗: 基于中文医学知识的LLaMa指令微调模型
- 视觉大模型系列 | MSA:一种简单强大的医学 SAM 适配器,轻松强化 SAM 到指定领域
- 中文LLaMa和Alpaca大语言模型开源方案 | 扩充中文词表 & 针对中文语料进行高效编码
- 视觉大模型系列 | STU-Net:超越 nnU-Net,探讨大模型在医学图像分割领域的可能性
- 视觉大模型系列 | SEEM : 一种比 SAM 交互能力更强,且具有语义感知的分割大模型
- 视觉GPT | SegGPT:大通用分割模型登场!利用视觉 prompt 分割万物
- ChatGPT怎么微调?MIT韩松新作告诉你!
- 《万字长文带你解读AIGC》系列之任务篇
- 《万字长文带你解读AIGC》系列之技术篇
- 《万字长文带你解读AIGC》系列之入门篇
实战教程
- 超强目标检测器 RT-DETR | Python/C++ 保姆级部署教程,从入门到精通
- Github 3k+!南科大 VIP Lab 近期开源 Track-Anything | SAM + VOS: 一键视频标注
- 告别手动标注时代 | SAM 助力 Label-Studio 形成 SOTA 级半自动标注工具!
- TensorRT模型部署系列-Linux环境配置安装TensorRT保姆级教程
- LibMTL:用于多任务学习的 PyTorch 库
- 实战教程!| ECCV 2022 Out Of Distribution 分类赛道冠军方案解读
- 2023年最全VSCode远程Linux搭建C++工程开发利器
- 2023年最全 Windows + VSCode 配置 OpenCV C++ 一站式开发调试环境教程
- 一劳永逸|高效神经网络部署的正确打开方式
- OOM?教你如何在PyTorch更高效地利用显存
自监督学习
- 全网最详细的 DINOv2 论文解读来啦!
- 重塑自监督学习: DINO 网络如何颠覆视觉特征表示的常规方法
- CVPR 2023 | iTPNs: 谁说 Linear probing 不适用 MIM 任务?
- CVPR 2023 | FACEBOOK 新作 | CutLER:无需标签也能玩转检测和分割
- MoCo | 无监督胜有监督,新型迁移学习,刷新7项检测分割任务(代码解读)
弱监督/半监督/无监督
- 2023最新半监督语义分割综述 | 技术总结与展望!
- 以CVPR2023的半监督语义分割工作UniMatch为例,聊聊一篇顶会论文的idea是如何获得并实现大幅超越以往方法的性能!
- 半监督医学图像分割方法新SOTA | 校正对比伪监督学习
- CVPR’2023 超高分论文 | Consistent-Teacher: 高效目标检测超强 SOTA!
小样本/增量学习
-
IJCAI 2023 | 腾讯优图新作 CECNet: 提升小样本学习在分类、检测和分割任务上的性能
-
小样本学习新SOTA | FECANet-特征增强的上下文感知网络
-
2023港科大新作 | 新颖注意力机制有效提升医学图像小样本语义分割精度!
-
万字长文带你入门增量学习
-
R2AU-Net: 基于循环残差注意力和半监督学习范式的道路裂缝分割算法
Low-Level
复原
- CVPR2023 即插即用系列 | 一种高效轻量的自注意力机制助力图像恢复网络问鼎SOTA!
- CVPR 2022 | 特征优化法:一种无需训练即可大幅提高高分辨率图像修复质量的方法
- Github 4.8k Stars! | CodeFormer: 地表最强AI马赛克去除神器! (附实战教程)
超分
- 北大&港大 CVPR 力作 | ESRT: 集轻量高效于一体的单图超分网络
- SRCNN | 开启超分的大深度学习时代
编辑
- PhotoGuard:如何提高图像恶意编辑的成本?
- 视觉词袋模型缓解图像篡改检测算法的语义鸿沟
去雾/去雨
- 致敬何凯明的暗通道去雾算法 | NAS-Net: 基于非对齐监督的图像去雾框架
VAE/Diffusion
- 深度理解变分自编码器(VAE)|从入门到精通
- GLAZE: Protecting Artists from Style Mimicry by Text-to-Image Models
- 一文探讨如何从扩散模型中反向提取出训练数据
- 超越DALL·E!| OpenAI 年度最新力作 GLIDE:新生代文本引导扩散模型
数据增强/损失函数/对抗攻击
- 一文看尽深度学习中的各种数据增强
- Google Brain 新作 | diffusion合成数据集来提升ImageNet分类效果
- 解锁扩散模型新玩法 | 数据不够怎么办?扩散模型来助力!
- ICLR 2023 | 高效视频分割涨点神器之集群对抗损失!
- Focal Loss 后继之秀 | LMFLOSS:用于解决不平衡医学图像分类的新型混合损失函数
- 中科大刘淇教授团队CVPR’2023作品 | 基于因果启发的后门攻击防御
深度估计/立体匹配
- 利用BEV辅助的立体匹配,助力3D语义场景补全
- CVPR2023 | 无需动态区域分割!多帧深度估计新进展:跨线索注意力机制提升动态区域精度
- Intel 开源新作 | ZoeDepth: 第一个结合相对和绝对深度的多模态单目深度估计网络
- CVPR 2023 | Lite-Mono: 一种新的轻量级自监督单目深度估计方
- CVPR 2023 | IGEV-Stereo & IGEV-MVS:双目立体匹配网络新SOTA!
- 英伟达 CVPR 2023 新作 I VoxFromer: 单目3D语义场景补全新SOTA!
- ICRA 2023 | STEPS:夜间深度估计新SOTA!
- 为什么你的手机后置摄像头越来越丑?ECCV2022这篇论文告诉你
3D 视觉
- CV工程师进阶必备 | 用于自动驾驶感知的多传感器融合综述
- 中科院&清华联合新作 | ADAPT:让自动驾驶系统“开口说话”!
点云/bev/占据栅格
- CVPR’2023 Highlight | Point-NN: 即插即用,无需训练的非参数点云分析网络!
- 图像预训练权重也能应用在点云数据上?| RangeViT:最新应用于自动驾驶的3D点云语义分割模型
- 即插即用系列!| Hierarchical Attention: 轻松助力点云Transformer解决小目标和局部特征问题
- 传感器失效怎么办?MetaBEV:一种新颖且鲁棒感知网络架构,专治各自传感器疑难杂症
- NeurIPS 2022 | Fast-BEV:一种基于CNN的实时车载鸟瞰图感知方法
- 清华&天津大学新作 | SurroundOcc: 面向自动驾驶场景的纯视觉 3D 语义占据预测 (已开源)
- 纵目科技&复旦新作 | MVFusion:一种新颖的多视角雷达-相机融合方法,通过语义对齐实现跨模态特征交互!
三维重建/nerf/slam
- ICLR 2023 | SDF-Former: 首个基于 TSDF 的3D Transformer 场景重建算法
- FAIR新作! | MCC:面向三维重建的多视压缩编码
- CVPR’2023 | 港科大 & 腾讯 AI Lab & 港大联合出品:有趣的动态 3D 场景重建
- Text2Room:第一个从文本生成室内三维场景的方法!
- 一网打尽!光流估计/立体匹配/深度估计大一统!Unimatch:3D场景理解新范式!
- CVPR’2023 | Nerf-Stereo: 利用NeRF来训练双目立体匹配网络的新范式!
- NICER-SLAM: 密集 RGB SLAM 的超级缝合怪!
经验分享
- 我的实验要跑很久,你们忍一下 | GPU 空闲自动邮件通知
- 为什么你的显卡利用率总是0%?
- 关于顶会论文写作的一些经验之谈
- Diffusion Model 通俗理解
- 爆火的ChatGPT背后坎坷的商业化之路
- Meta AI & UC Berkeley 新作 | Early Dropout: Make Hinton’s Drouout Great Again!
- 医学图像分割十项全能比赛(MSD)回顾
求职招聘
- 博士申请 | IEEE Fellow香港理工大学Lap-pui Chau教授招收人工智能CV方向全奖博士
- 北京/深圳/上海 | 微信大语言模型岗位招聘算法/开发工程师
- 博士招聘 | 香港浸会大学CS系助理教授周锴阳老师课题组招收计算机视觉和机器学习方向博士
- 实习招聘 | 法国斯特拉斯堡招收计算机视觉和深度学习研究实习生
- 招聘 RA | 大湾区大学余梓彤课题组招聘AI和CV方向研究助理
- 博士招生 | 南丹麦大学方承副教授招生博士生1名
- 秘塔科技招聘⽬标检测/图像分割/文本图像生成/视频生成等视觉算法工程师(社招/校招/可转正实习)
- 实习招聘 | 地平线视觉生成方向研究实习生招聘
- 实习招聘 | 美团招聘视觉感知算法方向实习生
- 实习招聘 | 阿里招聘AI视觉算法方向实习生
- 博士&博后实习招聘 | 苏黎世联邦理工学院CS系SIPLAB实验室招收计算机视觉方向实习生
- 实习招聘 | 轻舟智航招聘感知算法实习生: 检测/分类/分割/跟踪/关键点检测等方向
- RA招聘 | 香港中文大学陈冠英博士课题组招收三维视觉研究助理
- 科研招聘 | 华为中央研究院招聘科研实习生
- 实习招聘 | 北大王选所IGCL(智能图形计算实验室)诚招实习生/保研实习生
- 科研实习 | 微软亚洲研究院招聘研究实习生
- 科研招聘 | 西湖大学机器智能实验室
- 科研实习 | 阿里达摩院计算机视觉实习生
- 科研实习 | 腾讯优图(深圳)实验室实习生招聘
关注我们
CVHub
是一家专注于计算机视觉领域的高质量知识分享平台:
- 全站技术文章原创率达99%!
- 每日为您呈献全方位、多领域、有深度的前沿AI论文解决及配套的行业级应用解决方案,提供科研 | 技术 | 就业一站式服务!
- 涵盖有监督/半监督/无监督/自监督的各类2D/3D的检测/分类/分割/跟踪/姿态/超分/重建等全栈领域以及最新的AIGC等生成式模型!
关注微信公众号,欢迎参与实时的学术&技术互动交流,领取学习大礼包,及时订阅最新的国内外大厂校招&社招资讯!
即日起,CVHub
正式开通知识星球,首期提供以下服务:
- 本星球主打知识问答服务,包括但不仅限于算法原理、项目实战、职业规划、科研思想等。
- 本星球秉持高质量AI技术分享,涵盖:每日优质论文速递,优质论文解读与知识点总结等。
- 本星球力邀各行业AI大佬,提供各行业经验分享,星球内部成员可深度了解各行业学术/产业最新进展。
- 本星球不定期分享学术论文思路,包括但不限于
Challenge
分析,创新点挖掘,实验配置,写作经验等。 - 本星球提供大量 AI 岗位就业招聘资源,包括但不限于
CV
,NLP
,AIGC
等;同时不定期分享各类实用工具、干货资料等。