一、背景
底层视觉的发展是否能够让我们真正地看清这个世界呢?
在单图超分中,非盲超分已经发展得较为成熟了,而盲超分和真实超分仍然有很多问题尚未解决。在我看来,盲超分只是真实超分的一个过渡,由于真实世界中退化多而复杂,现有的方法不可能穷尽所有退化,那么必然会带来一系列问题,因此真实超分的路还很长。
封面与该图均选自RealBasicVSR(CVPR 2022)
二、整理盲超分辨率数据集
数据集:DIV2K
-
发布时间:2017-07
-
数据集内容:DIV2K数据集是一个用于图像超分辨率研究的高质量图像数据集,包含800张高分辨率图像,分为800张训练图像和100张验证图像。该数据集主要用于训练和评估超分辨率算法,特别是用于提升图像分辨率的技术。
-
数据集地址:DIV2K|图像超分辨率数据集|机器视觉数据集
数据集:Flickr2K
-
发布时间:2016-09
-
数据集内容:Flickr2K数据集是一个用于超分辨率任务的图像数据集,包含2650张高分辨率图像。这些图像主要用于训练和评估超分辨率算法,特别是用于将低分辨率图像转换为高分辨率图像的研究。
-
数据集地址:Flickr2K|图像处理数据集|计算机视觉数据集
数据集:Set5
-
发布时间:2013-01
-
数据集内容:Set5是一个用于超分辨率图像处理的小型基准数据集,包含5张自然图像,常用于评估超分辨率算法的效果。
-
数据集地址:Set5|图像超分辨率数据集|机器视觉数据集
数据集:Manga109
-
发布时间:2017-09
-
数据集内容:Manga109是一个包含109部日本漫画的数据集,每部漫画包含多个章节,每个章节包含多页图像。数据集还包括每页图像的标注信息,如人物边界框、人物属性等。
-
数据集地址:Manga109|漫画研究数据集|图像处理数据集
数据集:VOC2012
-
发布时间:2012-01
-
数据集内容:VOC2012数据集是一个用于图像识别和分类的基准数据集,包含超过11,000张标注图像,涵盖20个不同的对象类别。该数据集主要用于训练和评估计算机视觉模型,特别是目标检测和图像分割任务。
-
数据集地址:VOC2012|图像处理数据集|计算机视觉数据集
数据集:ImageNet
-
发布时间:2009-01
-
数据集内容:ImageNet是一个大规模的图像数据库,包含超过1400万张标注图像,涵盖超过2万个类别。该数据集主要用于计算机视觉研究,特别是图像分类和物体识别任务。
-
数据集地址:ImageNet|计算机视觉数据集|图像识别数据集
数据集:COCO
-
发布时间:2014-09
-
数据集内容:COCO(Common Objects in Context)数据集是一个大规模的对象检测、分割和字幕生成数据集。它包含了超过33万张图片,其中20万张图片带有标注,涵盖了80个常见对象类别。数据集还包括了图片的实例分割、语义分割和关键点检测信息。
-
数据集地址:COCO|对象检测数据集|图像分割数据集
数据集:CelebA
-
发布时间:2015-04
-
数据集内容:CelebA(CelebFaces Attributes Dataset)是一个大规模的人脸属性数据集,包含超过20万张名人图片,每张图片标注了40种不同的面部属性,如性别、年龄、表情等。该数据集广泛用于人脸识别、属性预测和图像生成等研究领域。
-
数据集地址:CelebA|人脸识别数据集|计算机视觉数据集
数据集:Places365
-
发布时间:2016-03
-
数据集内容:Places365数据集是一个大规模的场景识别数据集,包含超过1000万张图片,涵盖365个不同的场景类别。该数据集旨在推动场景识别和理解的研究,适用于计算机视觉和机器学习任务。
-
数据集地址:Places365|计算机视觉数据集|图像识别数据集
数据集:OpenImages
-
发布时间:2018-04
-
数据集内容:OpenImages是一个大规模的图像数据集,包含超过900万张图像,每张图像都用边界框标注了对象实例,并且提供了丰富的元数据。数据集还包括图像级别的标签、视觉关系和分割掩码。
-
数据集地址:OpenImages|计算机视觉数据集|图像识别数据集
数据集:ADE20K
-
发布时间:2017-01
-
数据集内容:ADE20K是一个用于场景感知、分割和物体识别的图像数据集。它包含了超过20,000张图像,每张图像都进行了详细的语义分割标注,涵盖了150个不同的语义类别。
-
数据集地址:ADE20K|计算机视觉数据集|图像分割数据集
数据集:NYU Depth V2
-
发布时间:2012-04
-
数据集内容:NYU Depth V2数据集包含1449张RGB-D图像,这些图像来自464个不同的室内场景,每张图像都配有深度信息。该数据集广泛用于计算机视觉和深度学习研究,特别是在场景理解、物体识别和深度估计等领域。
-
数据集地址:NYU Depth V2|计算机视觉数据集|室内导航数据集
数据集:KITTI
-
发布时间:2012-09
-
数据集内容:KITTI数据集是一个广泛用于自动驾驶和计算机视觉研究的数据集,包含多种传感器数据,如立体摄像头、激光雷达和GPS/IMU数据。它提供了丰富的标注信息,包括物体检测、跟踪、语义分割等任务的标注。
-
数据集地址:KITTI|自动驾驶数据集|计算机视觉数据集
数据集:Cityscapes
-
发布时间:2016-04
-
数据集内容:Cityscapes数据集是一个用于语义城市街景分割的大规模数据集,包含50个城市的街景图像。数据集主要用于训练和评估计算机视觉模型,特别是用于自动驾驶和机器人导航的模型。数据集包含高分辨率图像,并标注了30个语义类别,包括道路、行人、车辆等。
-
数据集地址:Cityscapes|自动驾驶数据集|实时语义分割数据集
数据集:DAVIS
-
发布时间:2017-04
-
数据集内容:DAVIS(Densely Annotated VIdeo Segmentation)数据集是一个用于视频对象分割任务的数据集。它包含了50个高质量的视频序列,每个视频序列都带有密集的对象分割注释,涵盖了多种动态场景和对象类别。该数据集旨在推动视频对象分割技术的发展,特别是在处理复杂和动态场景中的对象分割问题。
-
数据集地址:DAVIS