V4L2 摄像头应用编程

目录

  • V4L2 简介
  • V4L2 摄像头应用程序
    • 打开摄像头
    • 查询设备的属性/能力/功能
    • 设置帧格式、帧率
    • 申请帧缓冲、内存映射
    • 入队
    • 开启视频采集

ALPHA/Mini I.MX6U 开发板配套支持多种不同的摄像头,包括正点原子的ov5640(500W 像素)、
ov2640(200W 像素)以及ov7725(不带FIFO、30W 像素)这三款摄像头,在开发板出厂系统上,可以使用这些摄像头;当然,除此之外我们还可以使用USB 摄像头,直接将USB 摄像头插入到开发板上的USB
接口即可!本章我们就来学习Linux 下的摄像头应用编程。

V4L2 简介

大家可以看到我们本章的标题叫做“V4L2 摄像头应用编程”,那什么是V4L2 呢?对Linux 下摄像头驱动程序开发有过了解的读者,应该知道这是什么意思。
V4L2 是Video for linux two 的简称,是Linux 内核中视频类设备的一套驱动框架,为视频类设备驱动开发和应用层提供了一套统一的接口规范,那什么是视频类设备呢?一个非常典型的视频类设备就是视频采集设备,譬如各种摄像头;当然还包括其它类型视频类设备,这里就不再给介绍了。
使用V4L2 设备驱动框架注册的设备会在Linux 系统/dev/目录下生成对应的设备节点文件,设备节点的名称通常为videoX(X 标准一个数字编号,0、1、2、3……),每一个videoX 设备文件就代表一个视频类设备。应用程序通过对videoX 设备文件进行I/O 操作来配置、使用设备类设备,下小节将向大家详细介绍!
图25.1.1 video 类设备节点

V4L2 摄像头应用程序

V4L2 设备驱动框架向应用层提供了一套统一、标准的接口规范,应用程序按照该接口规范来进行应用编程,从而使用摄像头。对于摄像头设备来说,其编程模式如下所示:

  1. 首先是打开摄像头设备;
  2. 查询设备的属性或功能;
  3. 设置设备的参数,譬如像素格式、帧大小、帧率;
  4. 申请帧缓冲、内存映射;
  5. 帧缓冲入队;
  6. 开启视频采集;
  7. 帧缓冲出队、对采集的数据进行处理;
  8. 处理完后,再次将帧缓冲入队,往复;
  9. 结束采集。
    流程图如下所示:
    在这里插入图片描述
    从流程图中可以看到,几乎对摄像头的所有操作都是通过ioctl()来完成,搭配不同的V4L2 指令(request
    参数)请求不同的操作,这些指令定义在头文件linux/videodev2.h 中,在摄像头应用程序代码中,需要包含头文件linux/videodev2.h,该头文件中申明了很多与摄像头应用编程相关的数据结构以及宏定义,大家可以打开这个头文件看看。
    在videodev2.h 头文件中,定义了很多ioctl()的指令,以宏定义的形式提供(VIDIOC_XXX),如下所示:
/** I O C T L C O D E S F O R V I D E O D E V I C E S**/
#define VIDIOC_QUERYCAP _IOR('V', 0, struct v4l2_capability)
#define VIDIOC_RESERVED _IO('V', 1)
#define VIDIOC_ENUM_FMT _IOWR('V', 2, struct v4l2_fmtdesc)
#define VIDIOC_G_FMT _IOWR('V', 4, struct v4l2_format)
#define VIDIOC_S_FMT _IOWR('V', 5, struct v4l2_format)
#define VIDIOC_REQBUFS _IOWR('V', 8, struct v4l2_requestbuffers)
#define VIDIOC_QUERYBUF _IOWR('V', 9, struct v4l2_buffer)
#define VIDIOC_G_FBUF _IOR('V', 10, struct v4l2_framebuffer)
#define VIDIOC_S_FBUF _IOW('V', 11, struct v4l2_framebuffer)
#define VIDIOC_OVERLAY _IOW('V', 14, int)
#define VIDIOC_QBUF _IOWR('V', 15, struct v4l2_buffer)
#define VIDIOC_EXPBUF _IOWR('V', 16, struct v4l2_exportbuffer)
#define VIDIOC_DQBUF _IOWR('V', 17, struct v4l2_buffer)
#define VIDIOC_STREAMON _IOW('V', 18, int)
#define VIDIOC_STREAMOFF _IOW('V', 19, int)
#define VIDIOC_G_PARM _IOWR('V', 21, struct v4l2_streamparm)
#define VIDIOC_S_PARM _IOWR('V', 22, struct v4l2_streamparm)
#define VIDIOC_G_STD _IOR('V', 23, v4l2_std_id)
#define VIDIOC_S_STD _IOW('V', 24, v4l2_std_id)
#define VIDIOC_ENUMSTD _IOWR('V', 25, struct v4l2_standard)
#define VIDIOC_ENUMINPUT _IOWR('V', 26, struct v4l2_input)
#define VIDIOC_G_CTRL _IOWR('V', 27, struct v4l2_control)
#define VIDIOC_S_CTRL _IOWR('V', 28, struct v4l2_control)
#define VIDIOC_G_TUNER _IOWR('V', 29, struct v4l2_tuner)
#define VIDIOC_S_TUNER _IOW('V', 30, struct v4l2_tuner)
#define VIDIOC_G_AUDIO _IOR('V', 33, struct v4l2_audio)
#define VIDIOC_S_AUDIO _IOW('V', 34, struct v4l2_audio)
#define VIDIOC_QUERYCTRL _IOWR('V', 36, struct v4l2_queryctrl)
#define VIDIOC_QUERYMENU _IOWR('V', 37, struct v4l2_querymenu)
#define VIDIOC_G_INPUT _IOR('V', 38, int)
#define VIDIOC_S_INPUT _IOWR('V', 39, int)
#define VIDIOC_G_EDID _IOWR('V', 40, struct v4l2_edid)
#define VIDIOC_S_EDID _IOWR('V', 41, struct v4l2_edid)
#define VIDIOC_G_OUTPUT _IOR('V', 46, int)
#define VIDIOC_S_OUTPUT _IOWR('V', 47, int)
#define VIDIOC_ENUMOUTPUT _IOWR('V', 48, struct v4l2_output)
#define VIDIOC_G_AUDOUT _IOR('V', 49, struct v4l2_audioout)
#define VIDIOC_S_AUDOUT _IOW('V', 50, struct v4l2_audioout)
#define VIDIOC_G_MODULATOR _IOWR('V', 54, struct v4l2_modulator)
#define VIDIOC_S_MODULATOR _IOW('V', 55, struct v4l2_modulator)
#define VIDIOC_G_FREQUENCY _IOWR('V', 56, struct v4l2_frequency)
#define VIDIOC_S_FREQUENCY _IOW('V', 57, struct v4l2_frequency)
#define VIDIOC_CROPCAP _IOWR('V', 58, struct v4l2_cropcap)
#define VIDIOC_G_CROP _IOWR('V', 59, struct v4l2_crop)
#define VIDIOC_S_CROP _IOW('V', 60, struct v4l2_crop)
#define VIDIOC_G_JPEGCOMP _IOR('V', 61, struct v4l2_jpegcompression)
#define VIDIOC_S_JPEGCOMP _IOW('V', 62, struct v4l2_jpegcompression)
#define VIDIOC_QUERYSTD _IOR('V', 63, v4l2_std_id)
#define VIDIOC_TRY_FMT _IOWR('V', 64, struct v4l2_format)
#define VIDIOC_ENUMAUDIO _IOWR('V', 65, struct v4l2_audio)
#define VIDIOC_ENUMAUDOUT _IOWR('V', 66, struct v4l2_audioout)
#define VIDIOC_G_PRIORITY _IOR('V', 67, __u32) /* enum v4l2_priority */
#define VIDIOC_S_PRIORITY _IOW('V', 68, __u32) /* enum v4l2_priority */
#define VIDIOC_G_SLICED_VBI_CAP _IOWR('V', 69, struct v4l2_sliced_vbi_cap)
#define VIDIOC_LOG_STATUS _IO('V', 70)
#define VIDIOC_G_EXT_CTRLS _IOWR('V', 71, struct v4l2_ext_controls)
#define VIDIOC_S_EXT_CTRLS _IOWR('V', 72, struct v4l2_ext_controls)
#define VIDIOC_TRY_EXT_CTRLS _IOWR('V', 73, struct v4l2_ext_controls)
#define VIDIOC_ENUM_FRAMESIZES _IOWR('V', 74, struct v4l2_frmsizeenum)
#define VIDIOC_ENUM_FRAMEINTERVALS _IOWR('V', 75, struct v4l2_frmivalenum)
#define VIDIOC_G_ENC_INDEX _IOR('V', 76, struct v4l2_enc_idx)
#define VIDIOC_ENCODER_CMD _IOWR('V', 77, struct v4l2_encoder_cmd)
#define VIDIOC_TRY_ENCODER_CMD _IOWR('V', 78, struct v4l2_encoder_cmd)

每一个不同的指令宏就表示向设备请求不同的操作,从上面可以看到,每一个宏后面(_IOWR/_IOR/_IOW)还携带了一个struct 数据结构体,譬如struct v4l2_capability、struct v4l2_fmtdesc,这就是调用ioctl()时需要传入的第三个参数的类型;调用ioctl()前,定义一个该类型变量,调用ioctl()时、将变量的指针作为ioctl()的第三个参数传入,譬如:

struct v4l2_capability cap;
……
ioctl(fd, VIDIOC_QUERYCAP, &cap);

在实际的应用编程中,并不是所有的指令都会用到,针对视频采集类设备,以下笔者列出了一些常用的指令:
在这里插入图片描述

打开摄像头

视频类设备对应的设备节点为/dev/videoX,X 为数字编号,通常从0 开始;摄像头应用编程的第一步便是打开设备,调用open 打开,得到文件描述符fd,如下所示:

int fd = -1;
/* 打开摄像头*/
fd = open("/dev/video0", O_RDWR);
if (0 > fd)
{fprintf(stderr, "open error: %s: %s\n", "/dev/video0", strerror(errno));return -1;
}

打开设备文件时,需要使用O_RDWR 指定读权限和写权限。

查询设备的属性/能力/功能

打开设备之后,接着需要查询设备的属性,确定该设备是否是一个视频采集类设备、以及其它一些属性,怎么查询呢?自然是通过ioctl()函数来实现,ioctl()对于设备文件来说是一个非常重要的系统调用,凡是涉及到配置设备、获取设备配置等操作都会使用ioctl 来完成,在前面章节内容中我们就已经见识过了;但对于普通文件来说,ioctl()几乎没什么用。
查询设备的属性,使用的指令为VIDIOC_QUERYCAP,如下所示:
ioctl(int fd, VIDIOC_QUERYCAP, struct v4l2_capability *cap);
此时通过ioctl()将获取到一个struct v4l2_capability 类型数据,struct v4l2_capability 数据结构描述了设备的一些属性,结构体定义如下所示:

struct v4l2_capability
{__u8 driver[16];    /* 驱动的名字*/__u8 card[32];      /* 设备的名字*/__u8 bus_info[32];  /* 总线的名字*/__u32 version;      /* 版本信息*/__u32 capabilities; /* 设备拥有的能力*/__u32 device_caps;__u32 reserved[3]; /* 保留字段*/
};

我们重点关注的是capabilities 字段,该字段描述了设备拥有的能力,该字段的值如下(可以是以下任意一个值或多个值的位或关系):

/* Values for 'capabilities' field */
#define V4L2_CAP_VIDEO_CAPTURE 0x00000001        /* Is a video capture device */
#define V4L2_CAP_VIDEO_OUTPUT 0x00000002         /* Is a video output device */
#define V4L2_CAP_VIDEO_OVERLAY 0x00000004        /* Can do video overlay */
#define V4L2_CAP_VBI_CAPTURE 0x00000010          /* Is a raw VBI capture device */
#define V4L2_CAP_VBI_OUTPUT 0x00000020           /* Is a raw VBI output device */
#define V4L2_CAP_SLICED_VBI_CAPTURE 0x00000040   /* Is a sliced VBI capture device */
#define V4L2_CAP_SLICED_VBI_OUTPUT 0x00000080    /* Is a sliced VBI output device */
#define V4L2_CAP_RDS_CAPTURE 0x00000100          /* RDS data capture */
#define V4L2_CAP_VIDEO_OUTPUT_OVERLAY 0x00000200 /* Can do video output overlay */
#define V4L2_CAP_HW_FREQ_SEEK 0x00000400         /* Can do hardware frequency seek */
#define V4L2_CAP_RDS_OUTPUT 0x00000800           /* Is an RDS encoder */
/* Is a video capture device that supports multiplanar formats */
#define V4L2_CAP_VIDEO_CAPTURE_MPLANE 0x00001000
/* Is a video output device that supports multiplanar formats */
#define V4L2_CAP_VIDEO_OUTPUT_MPLANE 0x00002000
/* Is a video mem-to-mem device that supports multiplanar formats */
#define V4L2_CAP_VIDEO_M2M_MPLANE 0x00004000
/* Is a video mem-to-mem device */
#define V4L2_CAP_VIDEO_M2M 0x00008000
#define V4L2_CAP_TUNER 0x00010000          /* has a tuner */
#define V4L2_CAP_AUDIO 0x00020000          /* has audio support */
#define V4L2_CAP_RADIO 0x00040000          /* is a radio device */
#define V4L2_CAP_MODULATOR 0x00080000      /* has a modulator */
#define V4L2_CAP_SDR_CAPTURE 0x00100000    /* Is a SDR capture device */
#define V4L2_CAP_EXT_PIX_FORMAT 0x00200000 /* Supports the extended pixel format */
#define V4L2_CAP_SDR_OUTPUT 0x00400000     /* Is a SDR output device */
#define V4L2_CAP_META_CAPTURE 0x00800000   /* Is a metadata capture device */
#define V4L2_CAP_READWRITE 0x01000000      /* read/write systemcalls */
#define V4L2_CAP_ASYNCIO 0x02000000        /* async I/O */
#define V4L2_CAP_STREAMING 0x04000000      /* streaming I/O ioctls */
#define V4L2_CAP_TOUCH 0x10000000          /* Is a touch device */
#define V4L2_CAP_DEVICE_CAPS 0x80000000    /* sets device capabilities field */

这些宏都是在videodev2.h 头文件中所定义的,大家可以自己去看。对于摄像头设备来说,它的capabilities
字段必须包含V4L2_CAP_VIDEO_CAPTURE,表示它支持视频采集功能。所以我们可以通过判断capabilities
字段是否包含V4L2_CAP_VIDEO_CAPTURE、来确定它是否是一个摄像头设备,譬如:

/* 查询设备功能*/
ioctl(fd, VIDIOC_QUERYCAP, &vcap);
/* 判断是否是视频采集设备*/
if (!(V4L2_CAP_VIDEO_CAPTURE & vcap.capabilities))
{fprintf(stderr, "Error: No capture video device!\n");return -1;
}

设置帧格式、帧率

一个摄像头通常会支持多种不同的像素格式,譬如RGB、YUYV 以及压缩格式MJPEG 等,并且还支持多种不同的视频采集分辨率,譬如640480、320240、1280*720 等,除此之外,同一分辨率可能还支持多种不同的视频采集帧率(15fps、30fps)。所以,通常在进行视频采集之前、需要在应用程序中去设置这些参数。
a)枚举出摄像头支持的所有像素格式:VIDIOC_ENUM_FMT
要设置像素格式,首先得知道该设备支持哪些像素格式,如何得知呢?使用VIDIOC_ENUM_FMT 指令:
ioctl(int fd, VIDIOC_ENUM_FMT, struct v4l2_fmtdesc *fmtdesc);
使用VIDIOC_ENUM_FMT 可以枚举出设备所支持的所有像素格式,调用ioctl()需要传入一个struct v4l2_fmtdesc *指针,ioctl()会将获取到的数据写入到fmtdesc 指针所指向的对象中。struct v4l2_fmtdesc 结构体描述了像素格式相关的信息,我们来看看struct v4l2_fmtdesc 结构体的定义:

/** F O R M A T E N U M E R A T I O N*/
struct v4l2_fmtdesc
{__u32 index; /* Format number */__u32 type;  /* enum v4l2_buf_type */__u32 flags;__u8 description[32]; /* Description string */__u32 pixelformat;    /* Format fourcc */__u32 reserved[4];
};

index 表示编号,在枚举之前,需将其设置为0,然后每次ioctl()调用之后将其值加1。一次ioctl()调用只能得到一种像素格式的信息,如果设备支持多种像素格式,则需要循环调用多次,通过index 来控制,
index 从0 开始,调用一次ioctl()之后加1,直到ioctl()调用失败,表示已经将所有像素格式都枚举出来了;所以index 就是一个编号,获取index 编号指定的像素格式。
description 字段是一个简单地描述性字符串,简单描述pixelformat 像素格式。
pixelformat 字段则是对应的像素格式编号,这是一个无符号32 位数据,每一种像素格式都会使用一个
u32 类型数据来表示,如下所示:

/* RGB formats */
#define V4L2_PIX_FMT_RGB332 v4l2_fourcc('R', 'G', 'B', '1')  /* 8 RGB-3-3-2 */
#define V4L2_PIX_FMT_RGB444 v4l2_fourcc('R', '4', '4', '4')  /* 16 xxxxrrrr ggggbbbb */
#define V4L2_PIX_FMT_ARGB444 v4l2_fourcc('A', 'R', '1', '2') /* 16 aaaarrrr ggggbbbb */
#define V4L2_PIX_FMT_XRGB444 v4l2_fourcc('X', 'R', '1', '2') /* 16 xxxxrrrr ggggbbbb */
#define V4L2_PIX_FMT_RGB555 v4l2_fourcc('R', 'G', 'B', 'O')  /* 16 RGB-5-5-5 */
#define V4L2_PIX_FMT_ARGB555 v4l2_fourcc('A', 'R', '1', '5') /* 16 ARGB-1-5-5-5 */
#define V4L2_PIX_FMT_XRGB555 v4l2_fourcc('X', 'R', '1', '5') /* 16 XRGB-1-5-5-5 */
#define V4L2_PIX_FMT_RGB565 v4l2_fourcc('R', 'G', 'B', 'P')  /* 16 RGB-5-6-5 */
......
/* Grey formats */
#define V4L2_PIX_FMT_GREY v4l2_fourcc('G', 'R', 'E', 'Y') /* 8 Greyscale */
#define V4L2_PIX_FMT_Y4 v4l2_fourcc('Y', '0', '4', ' ')   /* 4 Greyscale */
#define V4L2_PIX_FMT_Y6 v4l2_fourcc('Y', '0', '6', ' ')   /* 6 Greyscale */
#define V4L2_PIX_FMT_Y10 v4l2_fourcc('Y', '1', '0', ' ')  /* 10 Greyscale */......
/* Luminance+Chrominance formats */
#define V4L2_PIX_FMT_YUYV v4l2_fourcc('Y', 'U', 'Y', 'V') /* 16 YUV 4:2:2 */
#define V4L2_PIX_FMT_YYUV v4l2_fourcc('Y', 'Y', 'U', 'V') /* 16 YUV 4:2:2 */
#define V4L2_PIX_FMT_YVYU v4l2_fourcc('Y', 'V', 'Y', 'U') /* 16 YVU 4:2:2 */
#define V4L2_PIX_FMT_UYVY v4l2_fourcc('U', 'Y', 'V', 'Y') /* 16 YUV 4:2:2 */......
/* compressed formats */
#define V4L2_PIX_FMT_MJPEG v4l2_fourcc('M', 'J', 'P', 'G') /* Motion-JPEG */
#define V4L2_PIX_FMT_JPEG v4l2_fourcc('J', 'P', 'E', 'G')  /* JFIF JPEG */
#define V4L2_PIX_FMT_DV v4l2_fourcc('d', 'v', 's', 'd')    /* 1394 */
#define V4L2_PIX_FMT_MPEG v4l2_fourcc('M', 'P', 'E', 'G')  /* MPEG-1/2/4 Multiplexed */

以上列举出来的只是其中一部分,篇幅有限、不能将所有的像素格式都列举出来,大家可以自己查看
videodev2.h 头文件。可以看到后面有一个v4l2_fourcc 宏,其实就是通过这个宏以及对应的参数合成的一个
u32 类型数据。
type 字段指定类型,表示我们要获取设备的哪种功能对应的像素格式,因为有些设备它可能即支持视频采集功能、又支持视频输出等其它的功能;type 字段可取值如下:

enum v4l2_buf_type
{V4L2_BUF_TYPE_VIDEO_CAPTURE = 1, // 视频采集V4L2_BUF_TYPE_VIDEO_OUTPUT = 2,  // 视频输出V4L2_BUF_TYPE_VIDEO_OVERLAY = 3,V4L2_BUF_TYPE_VBI_CAPTURE = 4,V4L2_BUF_TYPE_VBI_OUTPUT = 5,V4L2_BUF_TYPE_SLICED_VBI_CAPTURE = 6,V4L2_BUF_TYPE_SLICED_VBI_OUTPUT = 7,V4L2_BUF_TYPE_VIDEO_OUTPUT_OVERLAY = 8,V4L2_BUF_TYPE_VIDEO_CAPTURE_MPLANE = 9,V4L2_BUF_TYPE_VIDEO_OUTPUT_MPLANE = 10,V4L2_BUF_TYPE_SDR_CAPTURE = 11,V4L2_BUF_TYPE_SDR_OUTPUT = 12,V4L2_BUF_TYPE_META_CAPTURE = 13,/* Deprecated, do not use */V4L2_BUF_TYPE_PRIVATE = 0x80,
};

type 字段需要在调用ioctl() 之前设置它的值,对于摄像头,需要将type 字段设置为
V4L2_BUF_TYPE_VIDEO_CAPTURE,指定我们将要获取的是视频采集的像素格式。
使用示例如下所示:

struct v4l2_fmtdesc fmtdesc;
/* 枚举出摄像头所支持的所有像素格式以及描述信息*/
fmtdesc.index = 0;
fmtdesc.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
while (0 == ioctl(fd, VIDIOC_ENUM_FMT, &fmtdesc))
{printf("fmt: %s <0x%x>\n", fmtdesc.description, fmtdesc.pixelformat);fmtdesc.index++;
}

b)枚举摄像头所支持的所有视频采集分辨率:VIDIOC_ENUM_FRAMESIZES
使用VIDIOC_ENUM_FRAMESIZES 指令可以枚举出设备所支持的所有视频采集分辨率,用法如下所示:

ioctl(int fd, VIDIOC_ENUM_FRAMESIZES, struct v4l2_frmsizeenum *frmsize);

调用ioctl()需要传入一个struct v4l2_frmsizeenum *指针,ioctl()会将获取到的数据写入到frmsize 指针所指向的对象中。struct v4l2_frmsizeenum 结构体描述了视频帧大小相关的信息,我们来看看struct v4l2_frmsizeenum 结构体的定义:

struct v4l2_frmsizeenum
{__u32 index;        /* Frame size number */__u32 pixel_format; /* 像素格式*/__u32 type;         /* type */union{ /* Frame size */struct v4l2_frmsize_discrete discrete;struct v4l2_frmsize_stepwise stepwise;};__u32 reserved[2]; /* Reserved space for future use */
};
struct v4l2_frmsize_discrete
{__u32 width;  /* Frame width [pixel] */__u32 height; /* Frame height [pixel] */
};

index 字段与struct v4l2_fmtdesc 结构体的index 字段意义相同,一个摄像头通常支持多种不同的视频采集分辨率,一次ioctl()调用只能得到一种视频帧大小信息,如果设备支持多种视频帧大小,则需要循环调用多次,通过index 来控制。
pixel_format 字段指定像素格式,而type 字段与struct v4l2_fmtdesc 结构体的type 字段意义相同;在调用ioctl()之前,需要先设置type 字段与pixel_format 字段,确定我们将要枚举的是:设备的哪种功能、哪种像素格式支持的视频帧大小。
可以看到struct v4l2_frmsizeenum 结构体中有一个union 共用体,type= V4L2_BUF_TYPE_VIDEO_CAPTURE 情况下,discrete 生效,这是一个struct v4l2_frmsize_discrete 类型变量,描述了视频帧大小信息(包括视频帧的宽度和高度),也就是视频采集分辨率大小。
譬如我们要枚举出摄像头RGB565 像素格式所支持的所有视频帧大小:

struct v4l2_frmsizeenum frmsize;
frmsize.index = 0;
frmsize.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
frmsize.pixel_format = V4L2_PIX_FMT_RGB565;
while (0 == ioctl(fd, VIDIOC_ENUM_FRAMESIZES, &frmsize))
{printf("frame_size<%d*%d>\n", frmsize.discrete.width, frmsize.discrete.height);frmsize.index++;
}

c)枚举摄像头所支持的所有视频采集帧率:VIDIOC_ENUM_FRAMEINTERVALS
同一种视频帧大小,摄像头可能会支持多种不同的视频采集帧率,譬如常见的15fps、30fps、45fps 以及60fps 等;使用VIDIOC_ENUM_FRAMEINTERVALS 指令可以枚举出设备所支持的所有帧率,使用方式如下:

ioctl(int fd, VIDIOC_ENUM_FRAMEINTERVALS, struct v4l2_frmivalenum *frmival);

调用ioctl()需要传入一个struct v4l2_frmivalenum *指针,ioctl()会将获取到的数据写入到frmival 指针所指向的对象中。struct v4l2_frmivalenum 结构体描述了视频帧率相关的信息,我们来看看struct v4l2_frmivalenum 结构体的定义:

struct v4l2_frmivalenum
{__u32 index;        /* Frame format index */__u32 pixel_format; /* Pixel format */__u32 width;        /* Frame width */__u32 height;       /* Frame height */__u32 type;         /* type */union{ /* Frame interval */struct v4l2_fract discrete;struct v4l2_frmival_stepwise stepwise;};__u32 reserved[2]; /* Reserved space for future use */
};
struct v4l2_fract
{__u32 numerator;   // 分子__u32 denominator; // 分母
};

index、type 字段与struct v4l2_frmsizeenum 结构体的index、type 字段意义相同。
width、height 字段用于指定视频帧大小,pixel_format 字段指定像素格式。
以上这些字段都是需要在调用ioctl()之前设置它的值。
可以看到struct v4l2_frmivalenum 结构体也有一个union 共用体,当type= V4L2_BUF_TYPE_VIDEO_CAPTURE 时,discrete 生效,这是一个struct v4l2_fract 类型变量,描述了视频帧率信息(一秒钟采集图像的次数);struct v4l2_fract 结构体中,numerator 表示分子、denominator 表示分母,使用numerator / denominator 来表示图像采集的周期(采集一幅图像需要多少秒),所以视频帧率便等于denominator / numerator。
使用示例,譬如,我们要枚举出RGB565 像素格式下640*480 帧大小所支持的所有视频采集帧率:

struct v4l2_frmivalenum frmival;
frmival.index = 0;
frmival.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
frmival.pixel_format = V4L2_PIX_FMT_RGB565;
frmival.width = 640;
frmival.height = 480;
while (0 == ioctl(fd, VIDIOC_ENUM_FRAMEINTERVALS, &frmival))
{printf("Frame interval<%ffps> ", frmival.discrete.denominator / frmival.discrete.numerator);frmival.index++;
}

d)查看或设置当前的格式:VIDIOC_G_FMT、VIDIOC_S_FMT
前面介绍的指令只是枚举设备支持的像素格式、视频帧大小以及视频采集帧率等这些信息,将下来我们将介绍如何设置这些参数。
首先可以使用VIDIOC_G_FMT 指令查看设备当期的格式,用法如下所示

int ioctl(int fd, VIDIOC_G_FMT, struct v4l2_format *fmt);

调用ioctl()需要传入一个struct v4l2_format *指针,ioctl()会将获取到的数据写入到fmt 指针所指向的对象中,struct v4l2_format 结构体描述了格式相关的信息。
使用VIDIOC_S_FMT 指令设置设备的格式,用法如下所示:

int ioctl(int fd, VIDIOC_S_FMT, struct v4l2_format *fmt);

ioctl()会使用fmt 所指对象的数据去设置设备的格式。我们来看看v4l2_format 结构体的定义:

struct v4l2_format
{__u32 type;union{struct v4l2_pix_format pix;           /* V4L2_BUF_TYPE_VIDEO_CAPTURE */struct v4l2_pix_format_mplane pix_mp; /* V4L2_BUF_TYPE_VIDEO_CAPTURE_MPLANE */struct v4l2_window win;               /* V4L2_BUF_TYPE_VIDEO_OVERLAY */struct v4l2_vbi_format vbi;           /* V4L2_BUF_TYPE_VBI_CAPTURE */struct v4l2_sliced_vbi_format sliced; /* V4L2_BUF_TYPE_SLICED_VBI_CAPTURE */struct v4l2_sdr_format sdr;           /* V4L2_BUF_TYPE_SDR_CAPTURE */struct v4l2_meta_format meta;         /* V4L2_BUF_TYPE_META_CAPTURE */__u8 raw_data[200];                   /* user-defined */} fmt;
};

type 字段依然与前面介绍的结构体中的type 字段意义相同,不管是获取格式、还是设置格式都需要在调用ioctl()函数之前设置它的值。
接下来是一个union 共用体,当type 被设置为V4L2_BUF_TYPE_VIDEO_CAPTURE 时,pix 变量生效,它是一个struct v4l2_pix_format 类型变量,记录了视频帧格式相关的信息,如下所示:

struct v4l2_pix_format
{__u32 width;        // 视频帧的宽度(单位:像素)__u32 height;       // 视频帧的高度(单位:像素)__u32 pixelformat;  // 像素格式__u32 field;        /* enum v4l2_field */__u32 bytesperline; /* for padding, zero if unused */__u32 sizeimage;__u32 colorspace; /* enum v4l2_colorspace */__u32 priv;       /* private data, depends on pixelformat */__u32 flags;      /* format flags (V4L2_PIX_FMT_FLAG_*) */union{/* enum v4l2_ycbcr_encoding */__u32 ycbcr_enc;/* enum v4l2_hsv_encoding */__u32 hsv_enc;};__u32 quantization; /* enum v4l2_quantization */__u32 xfer_func;    /* enum v4l2_xfer_func */
};

colorspace 字段描述的是一个颜色空间,可取值如下:

enum v4l2_colorspace
{/** Default colorspace, i.e. let the driver figure it out.* Can only be used with video capture.*/V4L2_COLORSPACE_DEFAULT = 0,/* SMPTE 170M: used for broadcast NTSC/PAL SDTV */V4L2_COLORSPACE_SMPTE170M = 1,/* Obsolete pre-1998 SMPTE 240M HDTV standard, superseded by Rec 709 */V4L2_COLORSPACE_SMPTE240M = 2,/* Rec.709: used for HDTV */V4L2_COLORSPACE_REC709 = 3,/** Deprecated, do not use. No driver will ever return this. This was* based on a misunderstanding of the bt878 datasheet.*/V4L2_COLORSPACE_BT878 = 4,/** NTSC 1953 colorspace. This only makes sense when dealing with* really, really old NTSC recordings. Superseded by SMPTE 170M.*/V4L2_COLORSPACE_470_SYSTEM_M = 5,/** EBU Tech 3213 PAL/SECAM colorspace. This only makes sense when* dealing with really old PAL/SECAM recordings. Superseded by* SMPTE 170M.*/V4L2_COLORSPACE_470_SYSTEM_BG = 6,/** Effectively shorthand for V4L2_COLORSPACE_SRGB, V4L2_YCBCR_ENC_601* and V4L2_QUANTIZATION_FULL_RANGE. To be used for (Motion-)JPEG.*/V4L2_COLORSPACE_JPEG = 7,/* For RGB colorspaces such as produces by most webcams. */V4L2_COLORSPACE_SRGB = 8,/* AdobeRGB colorspace */V4L2_COLORSPACE_ADOBERGB = 9,/* BT.2020 colorspace, used for UHDTV. */V4L2_COLORSPACE_BT2020 = 10,/* Raw colorspace: for RAW unprocessed images */V4L2_COLORSPACE_RAW = 11,/* DCI-P3 colorspace, used by cinema projectors */V4L2_COLORSPACE_DCI_P3 = 12,
};

使用VIDIOC_S_FMT 指令设置格式时,通常不需要用户指定colorspace,底层驱动会根据像素格式
pixelformat 来确定对应的colorspace。
例子:获取当前的格式、并设置格式

struct v4l2_format fmt;
fmt.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
if (0 > ioctl(fd, VIDIOC_G_FMT, &fmt))
{ // 获取格式信息perror("ioctl error");return -1;
}
printf("width:%d, height:%d format:%d\n", fmt.fmt.pix.width, fmt.fmt.pix.height, fmt.fmt.pix.pixelformat);
fmt.fmt.pix.width = 800;
fmt.fmt.pix.height = 480;
fmt.fmt.pix.pixelformat = V4L2_PIX_FMT_RGB565;
if (0 > ioctl(fd, VIDIOC_S_FMT, &fmt))
{ // 设置格式perror("ioctl error");return -1;
}

使用指令VIDIOC_S_FMT 设置格式时,实际设置的参数并不一定等于我们指定的参数,譬如上面我们指定视频帧宽度为800、高度为480,但这个摄像头不一定支持这种视频帧大小,或者摄像头不支持
V4L2_PIX_FMT_RGB565 这种像素格式;通常在这种情况下,底层驱动程序并不会按照我们指定的参数进行设置,它会对这些参数进行修改,譬如,如果摄像头不支持800480,那么底层驱动可能会将其修改为
640
480(假设摄像头支持这种分辨率);所以,当ioctl()调用返回后,我们还需要检查返回的struct v4l2_format
类型变量,以确定我们指定的参数是否已经生效:

struct v4l2_format fmt;
fmt.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
fmt.fmt.pix.width = 800;
fmt.fmt.pix.height = 480;
fmt.fmt.pix.pixelformat = V4L2_PIX_FMT_RGB565;
if (0 > ioctl(fd, VIDIOC_S_FMT, &fmt))
{ // 设置格式perror("ioctl error");return -1;
}
if (800 != fmt.fmt.pix.width ||480 != fmt.fmt.pix.height)
{do_something();
}
if (V4L2_PIX_FMT_RGB565 != fmt.fmt.pix.pixelformat)
{do_something();
}

e)设置或获取当前的流类型相关参数:VIDIOC_G_PARM、VIDIOC_S_PARM
使用VIDIOC_G_PARM 指令可以获取设备的流类型相关参数(Stream type-dependent parameters),使用方式如下:

ioctl(int fd, VIDIOC_G_PARM, struct v4l2_streamparm *streamparm);

调用ioctl()需要传入一个struct v4l2_streamparm *指针,ioctl()会将获取到的数据写入到streamparm 指针所指向的对象中,struct v4l2_streamparm 结构体描述了流类型相关的信息,具体的内容等会在介绍。
使用VIDIOC_S_PARM 指令设置设备的流类型相关参数,用法如下所示:

ioctl(int fd, VIDIOC_S_PARM, struct v4l2_streamparm *streamparm);

ioctl() 会使用streamparm 所指对象的数据去设置设备的流类型相关参数。我们来看看struct v4l2_streamparm 结构体的定义:

struct v4l2_streamparm
{__u32 type; /* enum v4l2_buf_type */union{struct v4l2_captureparm capture;struct v4l2_outputparm output;__u8 raw_data[200]; /* user-defined */} parm;
};
struct v4l2_captureparm
{__u32 capability;               /* Supported modes */__u32 capturemode;              /* Current mode */struct v4l2_fract timeperframe; /* Time per frame in seconds */__u32 extendedmode;             /* Driver-specific extensions */__u32 readbuffers;              /* # of buffers for read */__u32 reserved[4];
};
struct v4l2_fract
{__u32 numerator;   /* 分子*/__u32 denominator; /* 分母*/
};

type 字段与前面一样,不再介绍,在调用ioctl()之前需先设置它的值。
当type= V4L2_BUF_TYPE_VIDEO_CAPTURE 时,union 共用体中capture 变量生效,它是一个struct v4l2_captureparm 类型变量,struct v4l2_captureparm 结构体描述了摄像头采集相关的一些参数,譬如视频采集帧率,上面已经给出了该结构体的定义。
struct v4l2_captureparm 结构体中,capability 字段表示设备支持的模式有哪些,可取值如下(以下任意一个或多个的位或关系):

/* Flags for 'capability' and 'capturemode' fields */
#define V4L2_MODE_HIGHQUALITY 0x0001 /* High quality imaging mode 高品质成像模式*/
#define V4L2_CAP_TIMEPERFRAME 0x1000 /* timeperframe field is supported 支持设置timeperframe
字段*/

capturemode 则表示当前的模式,与capability 字段的取值相同。
timeperframe 字段是一个struct v4l2_fract 结构体类型变量,描述了设备视频采集的周期,前面已经给大家介绍过。使用VIDIOC_S_PARM 可以设置视频采集的周期,也就是视频采集帧率,但是很多设备并不支持应用层设置timeperframe 字段,只有当capability 字段包含V4L2_CAP_TIMEPERFRAME 时才表示设备支持timeperframe 字段,这样应用层才可以去设置设备的视频采集帧率。
所以,在设置之前,先通过VIDIOC_G_PARM 命令获取到设备的流类型相关参数,判断capability 字段是否包含V4L2_CAP_TIMEPERFRAME,如下所示:

struct v4l2_streamparm streamparm;
streamparm.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
ioctl(v4l2_fd, VIDIOC_G_PARM, &streamparm);
/** 判断是否支持帧率设置**/
if (V4L2_CAP_TIMEPERFRAME & streamparm.parm.capture.capability)
{streamparm.parm.capture.timeperframe.numerator = 1;streamparm.parm.capture.timeperframe.denominator = 30; // 30fpsif (0 > ioctl(v4l2_fd, VIDIOC_S_PARM, &streamparm)){ // 设置参数fprintf(stderr, "ioctl error: VIDIOC_S_PARM: %s\n", strerror(errno));return -1;}
}
elsefprintf(stderr, "不支持帧率设置");

申请帧缓冲、内存映射

读取摄像头数据的方式有两种,一种是read 方式,也就是直接通过read()系统调用读取摄像头采集到的数据;另一种则是streaming 方式;25.2.2 小节中介绍了使用VIDIOC_QUERYCAP 指令查询设备的属性、得到一个struct v4l2_capability 类型数据,其中capabilities 字段记录了设备拥有的能力,当该字段包含
V4L2_CAP_READWRITE 时,表示设备支持read I/O 方式读取数据;当该字段包含V4L2_CAP_STREAMING
时,表示设备支持streaming I/O 方式;事实上,绝大部分设备都支持streaming I/O 方式读取数据,使用
streaming I/O 方式,我们需要向设备申请帧缓冲,并将帧缓冲映射到应用程序进程地址空间中。
当完成对设备的配置之后,接下来就可以去申请帧缓冲了,帧缓冲顾名思义就是用于存储一帧图像数据的缓冲区,使用VIDIOC_REQBUFS 指令可申请帧缓冲,使用方式如下所示:
ioctl(int fd, VIDIOC_REQBUFS, struct v4l2_requestbuffers *reqbuf);
调用ioctl()需要传入一个struct v4l2_requestbuffers *指针,struct v4l2_requestbuffers 结构体描述了申请帧缓冲的信息,ioctl()会根据reqbuf 所指对象填充的信息进行申请。我们来看看struct v4l2_requestbuffers 结构体的定义:

**M E M O R Y - M A P P I N G B U F F E R S* /struct v4l2_requestbuffers
{__u32 count;  // 申请帧缓冲的数量__u32 type;   /* enum v4l2_buf_type */__u32 memory; /* enum v4l2_memory */__u32 reserved[2];
};

type 字段与前面所提及到的type 字段意义相同,不再介绍,在调用ioctl()之前需先设置它的值。
count 字段用于指定申请帧缓冲的数量。
memory 字段可取值如下:

enum v4l2_memory {V4L2_MEMORY_MMAP = 1,V4L2_MEMORY_USERPTR = 2,V4L2_MEMORY_OVERLAY = 3,V4L2_MEMORY_DMABUF = 4,
};

通常将memory 设置为V4L2_MEMORY_MMAP 即可!使用示例如下:

struct v4l2_requestbuffers reqbuf;
reqbuf.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
reqbuf.count = 3; // 申请3 个帧缓冲
reqbuf.memory = V4L2_MEMORY_MMAP;
if (0 > ioctl(fd, VIDIOC_REQBUFS, &reqbuf))
{fprintf(stderr, "ioctl error: VIDIOC_REQBUFS: %s\n", strerror(errno));return -1;
}

streaming I/O 方式会在内核空间中维护一个帧缓冲队列,驱动程序会将从摄像头读取的一帧数据写入到队列中的一个帧缓冲,接着将下一帧数据写入到队列中的下一个帧缓冲;当应用程序需要读取一帧数据时,需要从队列中取出一个装满一帧数据的帧缓冲,这个取出过程就叫做出队;当应用程序处理完这一帧数据后,需要再把这个帧缓冲加入到内核的帧缓冲队列中,这个过程叫做入队!这个很容易理解,现实当中都有很多这样的例子,这里就不再举例了。
所以由此可知,读取图像数据的过程其实就是一个不断地出队列和入队列的过程,如下图所示
图25.2.2 应用层读取图像数据的过程

将帧缓冲映射到进程地址空间
使用VIDIOC_REQBUFS 指令申请帧缓冲,该缓冲区实质上是由内核所维护的,应用程序不能直接读取该缓冲区的数据,我们需要将其映射到用户空间中,这样,应用程序读取映射区的数据实际上就是读取内核维护的帧缓冲中的数据。

在映射之前,需要查询帧缓冲的信息,譬如帧缓冲的长度、偏移量等信息,使用VIDIOC_QUERYBUF
指令查询,使用方式如下所示:

ioctl(int fd, VIDIOC_QUERYBUF, struct v4l2_buffer *buf);

调用ioctl()需要传入一个struct v4l2_buffer *指针,struct v4l2_buffer 结构体描述了帧缓冲的信息,ioctl()
会将获取到的数据写入到buf 指针所指的对象中。我们来看看struct v4l2_buffer 结构体的定义:

struct v4l2_buffer
{__u32 index; // buffer 的编号__u32 type;  // type__u32 bytesused;__u32 flags;__u32 field;struct timeval timestamp;struct v4l2_timecode timecode;__u32 sequence;/* memory location */__u32 memory;union{__u32 offset; // 偏移量unsigned long userptr;struct v4l2_plane *planes;__s32 fd;} m;__u32 length; // buffer 的长度__u32 reserved2;__u32 reserved;
};

index 字段表示一个编号,申请的多个帧缓冲、每一个帧缓冲都有一个编号,从0 开始。一次ioctl()调用只能获取指定编号对应的帧缓冲的信息,所以要获取多个帧缓冲的信息,需要重复调用多次,每调用一次
ioctl()、index 加1,指向下一个帧缓冲。
type 字段与前面所提及到的type 字段意义相同,不再介绍,在调用ioctl()之前需先设置它的值。
memory 字段与struct v4l2_requestbuffers 结构体的memory 字段意义相同,需要在调用ioctl()之前设置它的值。
length 字段表示帧缓冲的长度,而共同体中的offset 则表示帧缓冲的偏移量,如何理解这个偏移量?因为应用程序通过VIDIOC_REQBUFS 指令申请帧缓冲时,内核会向操作系统申请一块内存空间作为帧缓冲区,这块内存空间的大小就等于申请的帧缓冲数量* 每一个帧缓冲的大小,每一个帧缓冲对应到这一块内存空间的某一段,所以它们都有一个地址偏移量。
帧缓冲的数量不要太多了,尤其是在一些内存比较吃紧的嵌入式系统中,帧缓冲的数量太多,势必会占用太多的系统内存。
使用示例,申请帧缓冲后、调用mmap()将帧缓冲映射到用户地址空间:

struct v4l2_requestbuffers reqbuf;
struct v4l2_buffer buf;
void *frm_base[3];
reqbuf.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
reqbuf.count = 3; // 申请3 个帧缓冲
reqbuf.memory = V4L2_MEMORY_MMAP;
/* 申请3 个帧缓冲*/
if (0 > ioctl(fd, VIDIOC_REQBUFS, &reqbuf))
{fprintf(stderr, "ioctl error: VIDIOC_REQBUFS: %s\n", strerror(errno));return -1;
}
/* 建立内存映射*/
buf.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
buf.memory = V4L2_MEMORY_MMAP;
for (buf.index = 0; buf.index < 3; buf.index++)
{ioctl(fd, VIDIOC_QUERYBUF, &buf);frm_base[buf.index] = mmap(NULL, buf.length,PROT_READ | PROT_WRITE, MAP_SHARED,fd, buf.m.offset);if (MAP_FAILED == frm_base[buf.index]){perror("mmap error");return -1;}
}

在上述的示例中,我们会将三个帧缓冲映射到用户空间,并将每一个帧缓冲对应的映射区的起始地址保存在frm_base 数组中,后面读取摄像头采集的数据时,直接读取映射区即可。

入队

使用VIDIOC_QBUF 指令将帧缓冲放入到内核的帧缓冲队列中,使用方式如下:
ioctl(int fd, VIDIOC_QBUF, struct v4l2_buffer *buf);
调用ioctl()之前,需要设置struct v4l2_buffer 类型对象的memory、type 字段,使用示例如下所示:
将三个帧缓冲放入内核的帧缓冲队列(入队操作)中:

struct v4l2_buffer buf;
/* 入队操作*/
buf.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
buf.memory = V4L2_MEMORY_MMAP;
for (buf.index = 0; buf.index < 3; buf.index++)
{if (0 > ioctl(fd, VIDIOC_QBUF, &buf)){perror("ioctl error");return -1;}
}

开启视频采集

将三个帧缓冲放入到队列中之后,接着便可以打开摄像头、开启图像采集了,使用VIDIOC_DQBUF 指令开启视频采集,使用方式如下所示:

ioctl(int fd, VIDIOC_STREAMON, int *type); //开启视频采集
ioctl(int fd, VIDIOC_STREAMOFF, int *type); //停止视频采集
type 其实一个enum v4l2_buf_type *指针,通常用法如下:
enum v4l2_buf_type type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
if (0 > ioctl(fd, VIDIOC_STREAMON, &type)) {perror("ioctl error");return -1;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/112101.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023-08-27 LeetCode每日一题(合并区间)

2023-08-27每日一题 一、题目编号 56. 合并区间二、题目链接 点击跳转到题目位置 三、题目描述 以数组 intervals 表示若干个区间的集合&#xff0c;其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间&#xff0c;并返回 一个不重叠的区间数组&#…

【HSPCIE仿真】输入网表文件(3)子电路描述语句

子电路描述语句 1. 子电路的定义定义子电路的基本语法子电路终止语句子电路的调用语句全局节点(.gloab)示例 2. 基于子电路执行多次分析 HSPICE 允许用户在程序执行过程中调用由各种 HSPICE 元件和器件构成的子电路&#xff0c;即电路结构的层次化描述。 子电路是以 .SUBCKT 或…

git clone 报SSL证书问题

git命令下运行 git config --global http.sslVerify false 然后再进行重新clone代码

3418. 杨辉三角形

目录 题目描述&#xff1a; 解题思路&#xff1a; 备注知识点&#xff1a; 代码详解&#xff1a; 题目描述&#xff1a; 解题思路&#xff1a; 所求为第一次出现的数字 因为杨辉三角沿中间轴对称 故只需考虑最左边的数字 因为杨辉三角对于每一列从小到大递增 对于每一行…

动态不确定性的动态S过程(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

mysql数据表Table is marked as crashed and should be repaired 的解决办法

错误原因 网上查了一下&#xff0c;错误的产生原因&#xff0c;有网友说是频繁查询和更新XXXX表造成的索引错误&#xff0c;还有说法是Mysql数据库因某种原因而受到了损坏。 【如&#xff1a;数据库服务器突发性断电&#xff0c;在数据表提供服务时对表的源文件进行某种操作都…

学习笔记:Pytorch利用MNIST数据集训练生成对抗网络(GAN)

2023.8.27 在进行深度学习的进阶的时候&#xff0c;我发了生成对抗网络是一个很神奇的东西&#xff0c;为什么它可以“将一堆随机噪声经过生成器变成一张图片”&#xff0c;特此记录一下学习心得。 一、生成对抗网络百科 2014年&#xff0c;还在蒙特利尔读博士的Ian Goodfello…

统信OS国产操作系统身份证读卡器社保卡读卡web网页开发使用操作流程

用于DONSEE系列身份证阅读器谷歌Chrome火狐Firefox插件&#xff0c;支持的型号有&#xff1a;EST-100、EST-100GS、EST-100G、EST-100U、EST-200G、EST-J13X等。 本方案无缝支持最新版本谷歌Chrome火狐Firefox等网页浏览器&#xff0c;支持H5、Vue、React、Node.js、Electron、…

区块链金融项目怎么做?

区块链技术的兴起引发了金融领域的变革&#xff0c;为金融行业带来了前所未有的机遇与挑战。在这个快速发展的领域中&#xff0c;如何在区块链金融领域做出卓越的表现&#xff1f;本文将从专业性和思考深度两个方面&#xff0c;探讨区块链金融的发展路径&#xff0c;并为读者提…

低代码/无代码平台:加速应用开发的工具

在数字化时代&#xff0c;软件应用已经成为企业和组织不可或缺的一部分。然而&#xff0c;传统的应用开发过程往往需要大量的时间、资源和专业知识。为了解决这个问题&#xff0c;低代码/无代码平台应运而生&#xff0c;它们为开发者提供了一种更快速、更简便的应用开发方式。本…

lab11 net

background 在开始写代码之前&#xff0c;回顾一下xv6book的第五章会有帮助你将使用E1000去处理网络通信 E1000会和qemu模拟的lan通信在qemu模拟的lan中 xv6的地址是10.0.2.15qemu模拟的计算机的地址是10.0.2.2 qemu会将所有的网络包都记录在packets.pcap中文件kernel/e1000.…

【LeetCode-中等题】148. 排序链表

文章目录 题目方法一&#xff1a;集合排序&#xff08;核心是内部的排序&#xff09;方法二&#xff1a; 优先队列&#xff08;核心也是内部的排序&#xff09;方法三&#xff1a;归并排序&#xff08;带递归&#xff09; 从上往下方法四&#xff1a;归并排序&#xff08;省去递…

java八股文面试[多线程]——什么是守护线程

知识来源&#xff1a; 【2023年面试】什么是守护线程_哔哩哔哩_bilibili

新亮点!安防视频监控/视频集中存储/云存储平台EasyCVR平台六分屏功能展示

安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快&#xff0c;可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等&#xff0c;以及支持厂家私有协议与SDK接入&#xff0c;包括海康Ehome、海大宇等设备的SDK等。平台既具备传统安…

WebRTC之FEC前向纠错协议

FEC前向纠错用于丢包恢复&#xff0c;对媒体包进行异或或其他算法生成冗余包进行发送。如果接收端出现丢包&#xff0c;可以通过冗余包恢复出原始的媒体包。FEC的代价是增加码率带宽&#xff0c;所以一般会根据网络状况、丢包率来动态调整FEC冗余系数&#xff0c;也会结合NACK/…

一文带你全面理解向量数据库

近些年来&#xff0c;向量数据库引起业界的广泛关注&#xff0c;一个相关事实是许多向量数据库初创公司在短期内就筹集到数百万美元的资金。 你很可能已经听说过向量数据库&#xff0c;但也许直到现在才真正关心向量数据库——至少&#xff0c;我想这就是你现在阅读本文的原因…

cvat 安装部署

官网地址&#xff1a; https://github.com/opencv/cvat/tree/masterhttps://github.com/opencv/cvat/tree/master 1.从官网上下载源码地址。 2.配置环境变量 vim /etc/profile source /etc/profile 或者执行&#xff1a; export CVAT_HOSTyour-ip-address 3.执行命令 …

基于Spring Boot 的 Ext JS 应用框架之coworkee

Ext JS 官方提供了一个人员管理的完整应用框架 - coworkee。该框架的显示如下: 该框架的布局特点如下: 布局方式: 左右布局, 左侧导航栏默认收合特点:左侧导航区占用空间小, 工作区较大, 适合没有二级导航栏,工作区需要显示的内容较多的系统。如果导航栏是横向底部,就…

ssm毕业生就业状况管理系统源码和论文

ssm毕业生就业状况管理系统源码和论文093 开发工具&#xff1a;idea 数据库mysql5.7 数据库链接工具&#xff1a;navcat,小海豚等 技术&#xff1a;ssm 摘 要 现代经济快节奏发展以及不断完善升级的信息化技术&#xff0c;让传统数据信息的管理升级为软件存储&#xff…

无涯教程-Android - Grid View函数

Android GridView在二维滚动网格(行和列)中显示项目&#xff0c;并且网格项目不一定是预定的&#xff0c;但它们会使用ListAdapter自动插入到布局中 Grid View - Grid view ListView 和 GridView 是 AdapterView 的子类&#xff0c;可以通过将它们绑定到 Adapter 来填充&#x…