MySQL一行记录是如何存储的?

 

目录

MySQL的数据存放在哪个文件?

表空间文件的结构是怎么样的?

1、行(row)

2、页(page)

3、区(extent)

4、段(segment)

InnoDB 行格式有哪些?

COMPACT行格式长什么样?

记录的额外信息

1、变长字段长度列表

2、NULL值列表

3、记录头信息

记录的真实信息

varchar(n) 中 n 最大取值为多少?

单字段的情况

多字段的情况

行溢出后,MySQL是怎么处理的?

总结


MySQL的数据存放在哪个文件?

MySQL存储的行为由存储引擎实现的,MySQL 支持多种存储引擎,不同的存储引擎保存的文件也不同

InnoDB是我们常用的存储引擎,也是 MySQL 默认的存储引擎。所以本文主要围绕 InnoDB 存储引擎展开。

查询MySQL数据库的文件存放在哪个目录:

mysql> SHOW VARIABLES LIKE 'datadir';
+---------------+-----------------+
| Variable_name | Value           |
+---------------+-----------------+
| datadir       | /var/lib/mysql/ |
+---------------+-----------------+
1 row in set (0.00 sec)

我们每创建一个 database (数据库)都会在 datadir 目录里创建一个以 database 为名的目录,然后保存表结构和表数据的文件都会存放在这个目录里。

比如,这里有一个名为 my_test 的 database ,该 database 里有一张名为 t_order 数据库表。

 然后,我们进入 /var/lib/mysql/my_test 目录,看看有什么文件?

[root@xiaolin ~]#ls /var/lib/mysql/my_test
db.opt  
t_order.frm  
t_order.ibd

可以看到,公有三个文件,这三个文件分别代表着:

  • db.opt,用来存储当前数据库的默认字符集和字符校验规则
  • t_order.frm,t_order 的表结构会保存在这个文件。在MySQL中建立一张表都会生成一个 .frm 文件,该文件是用来保存每个表的元数据信息的,主要包含表结构定义
  • t_order.ibd,t_order 的表数据会保存在这个文件。表数据既可以存在共享表空间文件(文件名:ibdata1)里,也可以存放在独占表空间文件(文件名:表名字.ibd)。这个行为是由参数 innodb_file_per_table 控制的,若设置了参数 innodb_file_per_table 为 1 ,则会将存储的数据、索引等信息单独存储在一个独占表空间,从 MySQL 5.6.6 版本开始,它的默认值就是 1 了,因此从这个版本之后, MySQL 中每一张表的数据都存放在一个独立的 .ibd 文件

总结:每创建一张表都会生成.opt.frm.ibd三个文件,其中 .opt 存储字符集和字符校验规则; .frm 存储表结构定义;.ibd 存储每张表的数据。


表空间文件的结构是怎么样的?

表空间由 段(segment)、区(extent)、页(page)、行(row)组成,InnoDB存储引擎的逻辑结构大致如下图:

1、行(row)

数据表中的记录都是按行(row)进行存放的,每个记录根据不同的行格式,有不同的存储结构。

2、页(page)

记录是按照行来存储的,但是数据库的读取并不以 [行] 为单位,否则一次读取(也就是一次 I/O操作)只能处理一行数据,效率会非常低。

因此 InnoDB的数据是按 [页] 为单位读写的,也就是说,当需要读取一条记录的时候,并不是将这个记录从磁盘读出来,而是以页为单位,将其整体读入内存。

默认每个页的大小为 16 KB ,也就是最多能保证 16 KB 的连续存储空间。

页是 InnoDB 存储引擎磁盘管理的最小单元,意味着数据库每次读写都是以 16KB 为单位的,一次最少从磁盘中读取 16K 的内容到内存中,一次最少把内存中的 16 K 内容刷新到磁盘中。

页的类型很多,常见的有数据页、undo 日志页、溢出页等等。数据表中的页式用 [数据页] 来管理的。

3、区(extent)

InnoDB存储引擎是用 B+ 树来组织数据的。

B+ 树中每一层都是通过双向链表连接起来的,如果是以页为单位来分配存储空间,那么链表中相邻的两个页之间的物理位置并不是连续的,可能离得非常远,那么磁盘查询时就会有大量的随机I/O,随机 I/O 是非常慢的。

解决这个问题也很简单,就是让链表中相邻的页的物理位置也相邻,这样就可以使用顺序 I/O 了,那么在范围查询(扫描叶子结点)的时候性能就会很高。

解决办法:

在表中数据量大的时候,为某个索引分配空间的时候就不再按照页为单位分配了,而是按照区(extent)为单位分配。每个区的大小为 1MB ,对于 16KB 的页来说,连续的 64 个页会被划分为一个区,这样就使得链表中相邻的页的物理位置也相邻,就能使用顺序 I/O 了。

4、段(segment)

表空间是由各个段(segment)组成的,段是由多个区(extent)组成的。段一般分为数据段、索引段和回滚段等。

  • 索引段:存放 B+ 树的非叶子节点的区的集合
  • 数据段:存放 B+ 树的叶子节点的集合
  • 回滚段:存放的是回滚数据的区的集合

InnoDB 行格式有哪些?

行格式(row_format),就是一条记录的存储结构。

InnoDB 提供了 4 种行格式,分别是Redundant 、Compact、Dynamic和Compressed行格式。

  • Redundant 是很古老的行格式了,MySQL 5.0 版本之前用的行格式,现在基本没人用了
  • 由于Redundant不是一种紧凑的行格式,所以 MySQL 5.0 之后引入了 Compact 行记录存储方式,Compact是一种紧凑的行格式,设计的初衷就是为了让一个数据页中可以存放更多的行记录,从 MySQL 5.1 版本后,行格式默认设置成 Compact
  • Dynamic 和 Compressed 两个都是紧凑的行格式,它们的行格式都和Compact差不多,因为都是基于Compact改进一点东西。从 MySQL5.7版本后,默认使用Dynamic 行格式

COMPACT行格式长什么样?

 可以看到,一条完整的记录分为 [记录的额外信息] 和 [记录的真实数据] 两个部分。

记录的额外信息

记录的额外信息包含三个部分:变长字段长度列表、NULL值列表、记录头信息。

1、变长字段长度列表

varchar(n) 和 char(n) 的区别:char是定长的,varchar 是变长的,变长字段实际存储数据的长度(大小)不固定。

所以,在存储数据的时候,也要把数据占用的大小存起来,存到 [变长字段长度列表] 里面,读取数据的时候才能根据这个 [变长字段长度列表] 去读取对应长度的数据。其他 TEXT、BLOB等变长字段也是这么实现的。

为了展示 [变长字段长度列表] 具体是怎么保存 [变长字段的真实数据占用的字节数],我们先创建这样的一张表,字符集是 ascii (所以每一个字符占用的是 1 字节),行格式是 Compact ,t_user 表中 name 和 phone 字段都是变长字段:

CREATE TABLE `t_user` (`id` int(11) NOT NULL,`name` VARCHAR(20) DEFAULT NULL,`phone` VARCHAR(20) DEFAULT NULL,`age` int(11) DEFAULT NULL,PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB DEFAULT CHARACTER SET = ascii ROW_FORMAT = COMPACT;

现在 t_user 表里有三条记录:

 接下来我们看看这三条记录的行格式中的 [变长字段长度列表] 是怎么存储的?

第一条记录:

  • name 列的值为 a ,真实数据占用的字节数是 1 字节,十六进制 0x01;
  • phone 列的值 为 123,真实数据占用的字节数是 3 字节,十六进制 0x03;
  • age 列和 id 列是不变长字段,所以这里不用管

这些变长字段的真实数据占用的字节数会按照列的顺序逆序存放,所以 [变长字段长度列表] 里的内容是 [03 01],而不是 [01 03]。

同样,可以得出第二条记录的行格式中,[变长字段长度列表] 里的内容是 [04 02] ,如下图:

第三条记录中的 phone 的 列值为 NULL ,NULL 是不会存放在行格式中记录的真实数据部分里的,所以 [变长字段长度列表] 里不需要保存值为 NULL 的变长字段的长度。

 为什么 [变长字段长度列表] 的信息要按照逆序存放?

主要是因为 [ 记录头信息] 中指向下一个记录的指针指向的是下一条记录的 [记录头信息] 和 [真实数据] 之间的位置,这样的好处就是向左读就是记录头信息,向右读就是真实数据,比较方便。

[变长字段长度列表] 中的信息之所以要逆序存放,是因为这样可以使得位置靠前的记录的真实数据和数据对应的字段长度信息可以同时在一个 CPU Cache Line 中这样就可以提高 CPU Cache 的命中率

同样的道理,NULL值列表的信息也需要逆序存放。

每个数据库表的行格式都有 [变长字段字节数列表] 吗?

变长字段字节数列表不是必须的。

当数据表没有变长字段的时候,比如全部都是 int 类型的字段,这时候表里的行格式就不会有 [变长字段长度列表] 了,因为没必要,不如去掉可以节省空间。

所以 [变长字段长度列表] 只出现在数据表中有变长字段的时候。

2、NULL值列表

表中的某些列可能会存储 NULL值,如果把这些 NULL 值都放在记录的真实数据中会比较浪费空间,所以Compact 行格式把这些值为 NULL的列存储到 NULL 值列表中。

如果存在允许 NULL 值的列,则每一个列对应一个二进制位(bit),二进制位按照列的顺序逆序排列

  • 二进制位的值为 1 时,代表该列的值为 NULL
  • 二进制位的值为 0 时,代表该列的值不为 NULL

另外,NULL的值列表必须用整数个字节的位表示(1字节8位),如果使用的二进制位个数不足整数个字节,则在字节的高位补 0.

还是以 t_user 表的这三条记录作为例子:

接下来,看看这三条记录的行格式中的 NULL 值列表是怎样存储的:

先看第一条记录,第一条记录所有列都有值,不存在 NULL 值,所以用二进制来表示是这样子的:

 但是 InnoDB 是用整数字节的二进制来表示NULL值列表的,现在不足 8 位 ,所以要在高位补 0 ,最终用二进制来表示是这样子的:

 所以,对于第一条数据, NULL值列表用十六进制表示是 0x00.

第二条记录:第二条记录age列是NULL值,所以,对于第二条数据,NULL值列表用十六进制表示是0x04.

 第三条记录:第三条记录 phone 列和 age 列是 NULL值,所以,对于第三条数据,NULL值列表用十六进制表示是0x06。

 把三条记录的NULL值列表都填充完毕后,它们的行格式是这样的:

 每个数据库表行格式都有 [NULL值列表] 吗?

NULL值列表也不是必须的。

当数据库的字段都定义成 NOT NULL 的时候,这时候表里的行格式就不会有 NULL值列表了。

所以在设计数据库表的时候,通常都是建议将字段设置为 NOT NULL ,这样可以至少节省 1 字节的空间(NULL值列表至少占用 1 字节空间)。

[NULL 值列表] 是固定 1 字节吗?如果是这样的话,一条记录有九个字段值都是 NULL ,这时候怎么表示?

[NULL值列表] 的空间不是固定 1 字节的。

当一条记录有 9 个字段值都是 NULL ,那么就会创建 2 字节空间的 [NULL 值列表],以此类推。

3、记录头信息

记录头信息包含的内容很多,这里例举几个比较重要的:

  • delete_mask:标识此条数据是否被删除。从这里可以知道,我们执行 delete 删除记录的时候,并不会真正的删除记录,只是将这个记录的 delete_mask 标记为 1。
  • next_record:下一条记录的位置。从这里可以知道,记录与记录之间是通过链表组织的。在前面提到过,指向的是下一条记录的 [记录头信息] 和 [真实数据] 之间的位置
  • record_type:表示当前记录的类型, 0 表示 普通记录, 1 表示 B+树非叶子节点记录, 2 则表示最小记录, 3 表示最大记录。

记录的真实信息

记录的真实数据部分除了我们定义的字段,还有三个隐藏字段,分别为 row_id、trx_id、roll_pointer。

  •  row_id:如果建表的时候指定了主键或者唯一约束列,那么就没有 row_id隐藏字段了。如果既没有指定主键,又没有唯一约束,那么InnoDB就会记录添加 row_id 隐藏字段。row_id 不是必需的,占用 6 个字节
  • trx_id:事务id,表示这个数据是由哪个事务生成的。trx_id是必需的,占用 6 个字节。
  • roll_pointer:这条记录上一个版本的指针。roll_pointer是必需的,占用 7 个字节。

varchar(n) 中 n 最大取值为多少?

MySQL规定除了 TEXT、BLOBs 这种大对象类型之外,其他所有的列(步包括隐藏列和记录头信息)占用的字节长度加起来不能超过 65535 个字节。

也就是说,一行记录除了TEXT、BLOBs 类型的列,限制最大为 65535 字节,注意是一行的总长度不是一列。

PS: varchar(n) 字段类型的 n 代表的是最多存储的字符数量,并不是字节大小

要算varchar(n)最大能允许存储的字节数,还需要看数据库表的字符集,因为字符集代表着,1个字符占用多少字节,比如ascii字符集,1 个字符占用 1 字节,那么 varchar(100)意味着最大能允许存储 100 字节的数据。如果是utf-8字符集,一个中文字符占用 3 字节,英文占用 1 字节。

单字段的情况

前面,我们知道了一行记录最大只能存储 65535 字节的数据

假设数据库表只有一个 varchar(n)类型的列且字符集是 ascii ,在这种情况下,varchar(n)中 n 取最大值是 65535 吗?

我们定义一个 varchar(65535)类型的字段,字符集为 ascii 的数据库表

CREATE TABLE test ( 
`name` VARCHAR(65535)  NULL
) ENGINE = InnoDB DEFAULT CHARACTER SET = ascii ROW_FORMAT = COMPACT;

看看能不能成功创建一张表:

可以看到,创建失败了

从报错信息可以知道:一行数据的最大字节数是 65535 (不包含 TEXT、BLOBs 这种大对象类型),其中包含了storage overhead.

storage overhead 其实就是 [变长字段长度列表] 和 [NULL值列表],也就是说一行数据的最大字节数 65535 ,实际上是包含 [变长字段长度列表] 和 [NULL 值列表] 所占用的字节数。所以在计算varchar(n) 中 n 最大值时,需要减去 storage overhead 占用的字节数。 

 这是因为我们存储字段类型为 varchar(n) 的数据时,其实分成了三个部分来存储:

  • 真实数据
  • 真实数据占用的字节数
  • NULL标识,如果不允许为NULL,这部分不需要

本例中, [NULL值列表] 所占用的字节数是多少?

我们创建表时,字段允许为NULL的,而且行字段数不超过8,所以会用 1 字节来表示 [NULL值列表]。

本例中,[变长字段长度列表] 所占用的字节数是多少?

[变长字段长度列表] 所占用的字节数 = 所有 [变长字段长度] 占用的字节数之和。

所以,我们要先知道每个变长字段的 [变长字段长度] 需要用多少字节表示?具体情况分为:

  • 条件一:如果变长字段允许存储的最大字节数小于等于 255 字节,就会用 1 字节表示 [变长字段长度]
  • 条件二:如果变长字段允许存储的最大字节数大于 255 字节,就会用 2 字节表示 [变长字段长度] ;

因为我们这个案例是只有 1 个变长字段,所以「变长字段长度列表」= 1 个「变长字段长度」占用的字节数,也就是 2 字节

因为在算 varchar(n) 中 n 最大值时,需要减去 「变长字段长度列表」和 「NULL 值列表」所占用的字节数的。所以,在数据库表只有一个 varchar(n) 字段且字符集是 ascii 的情况下,varchar(n) 中 n 最大值 = 65535 - 2 - 1 = 65532

可以看到,创建成功了。所以在算 varchar(n) 中 n 最大值时,需要减去 「变长字段长度列表」和 「NULL 值列表」所占用的字节数的

当然,上面这个例子是针对字符集为 ascii 情况,如果采用的是 UTF-8,varchar(n) 最多能存储的数据计算方式就不一样了:

  • 在 UTF-8 字符集下,一个字符最多需要3个字节,varchar(n) 的 n 最大取值就是 65532/3 = 21844。

上面所说的只是针对于一个字段的计算方式。

多字段的情况

如果有多个字段的话,要保证所有字段的长度 + 变长字段字节数列表所占用的字节数 + NULL值列表所占用的字节数 <= 65535


行溢出后,MySQL是怎么处理的?

MySQL 中磁盘和内存交互的基本单位是页,一个页的大小一般是 16KB,也就是 16384字节,而一个 varchar(n) 类型的列最多可以存储 65532字节,一些大对象如 TEXT、BLOB 可能存储更多的数据,这时一个页可能就存不了一条记录。这个时候就会发生行溢出,多的数据就会存到另外的「溢出页」中

如果一个数据页存不了一条记录,InnoDB 存储引擎会自动将溢出的数据存放到「溢出页」中。在一般情况下,InnoDB 的数据都是存放在 「数据页」中。但是当发生行溢出时,溢出的数据会存放到「溢出页」中

当发生行溢出时,在记录的真实数据处只会保存该列的一部分数据,而把剩余的数据放在 [溢出页] 中,然后真实数据处用 20 字节存储指向溢出页的地址,从而可以找到剩余数据所在的页

 上面这个是 Compact 行格式在发生行溢出后的处理。

Compressed 和 Dynamic 这两个行格式和 Compact 非常类似,主要的区别在于处理行溢出数据时有些区别。

这两种格式采用完全的行溢出方式,记录的真实数据处不会存储该列的一部分数据,只存储 20 个字节的指针来指向溢出页。而实际的数据都存储在溢出页中,看起来就像下面这样


总结

 MySQL的NULL值是怎么存放的?

MySQL的Compact行格式中会用 [NULL值列表] 来标记值为 NULL 的列。NULL值并不会存储在行格式中的真实数据部分。

NULL值列表会占用 1 字节空间,当表中所有的字段都定义成 NOT NULL ,行格式中就不会有 NULL 值列表,这样可以节省 1 字节的空间。

MySQL怎么知道varchar(n) 实际占用数据的大小?

MySQL  的 Compact 行格式中会用 [变长字段长度列表] 存储变长字段实际占用的数据大小。

varchar(n)中 n 最大值为多少?

一行记录最大能存储 65535 字节的数据,但是这个是包含「变长字段字节数列表所占用的字节数」和「NULL值列表所占用的字节数」。所以, 我们在算 varchar(n) 中 n 最大值时,需要减去这两个列表所占用的字节数。

如果一张表只有一个 varchar(n) 字段,且允许为 NULL,字符集为 ascii。varchar(n) 中 n 最大取值为 65535(行最大存储) - 2(变长字段长度列表) - 1(NULL值列表) = 65532。

如果有多个字段的话,要保证所有字段的长度 + 变长字段字节数列表所占用的字节数 + NULL值列表所占用的字节数 <= 65535。

ps:在计算的时候需要考虑字符集、NULL值列表 和 变长字段列表 三部分。

行溢出后,MySQL是怎么处理的?

如果一个数据页存不了一条记录 ,InnoDB存储引擎会自动将溢出的数据存放在 [溢出页] 中

Compact 行格式:当发生行溢出时,在记录的真实数据处只会保存该列的一部分数据,而把剩余的数据放在「溢出页」中,然后真实数据处用 20 字节存储指向溢出页的地址,从而可以找到剩余数据所在的页。

Compressed 和 Dynamic 这两种格式采用完全的行溢出方式,记录的真实数据处不会存储该列的一部分数据只存储 20 个字节的指针来指向溢出页。而实际的数据都存储在溢出页中

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/111862.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mac电脑屏幕录制Berrycast Mac屏幕录制软件

Berrycast是一款为Mac设计的优秀屏幕录制软件&#xff0c;它让屏幕录制变得简单而高效。以下是Berrycast的一些主要特点&#xff1a; 简单的用户界面&#xff1a;Berrycast拥有直观和简洁的用户界面&#xff0c;使得用户可以轻松上手。高质量的视频输出&#xff1a;Berrycast能…

面试中的系统设计:应对复杂问题的方法与技巧

&#x1f337;&#x1f341; 博主猫头虎 带您 Go to New World.✨&#x1f341; &#x1f984; 博客首页——猫头虎的博客&#x1f390; &#x1f433;《面试题大全专栏》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33a; &a…

Swift 中的动态成员查找

文章目录 前言基础介绍基础示例1. 定义一个动态成员访问类&#xff1a;2. 访问嵌套动态成员&#xff1a; 使用 KeyPath 的编译时安全性KeyPath 用法示例KeyPath 进阶使用示例1. 动态访问属性&#xff1a;2. 结合可选属性和 KeyPath&#xff1a;3. 动态 KeyPath 和字典&#xff…

springBoot打印精美logo

文章目录 &#x1f412;个人主页&#x1f3c5;JavaEE系列专栏&#x1f4d6;前言&#xff1a;&#x1f380;文本logo &#x1f412;个人主页 &#x1f3c5;JavaEE系列专栏 &#x1f4d6;前言&#xff1a; 本篇博客主要以提供springBoot打印精美logo &#x1f380;文本logo ??…

lnmp架构-tomcat session

tomcat session共享 部署 tomcat 在server2 和 server3上进行同样的操作 保存的信息都会在tomcat日志中保存 tomcat 与nginx的整合 在server1上 当并发量开始增大时 就得做负载均衡 解决 当一个tomcat服务器挂掉后 另一个服务器上有第一个服务器上提交的数据问题 在server2…

Maven入门教程(二):idea/Eclipse使用Maven

视频教程&#xff1a;Maven保姆级教程 Maven入门教程(一)&#xff1a;安装Maven环境 Maven入门教程(二)&#xff1a;idea/Eclipse使用Maven Maven入门教程(三)&#xff1a;Maven语法 Maven入门教程(四)&#xff1a;Nexus私服 Maven入门教程(五)&#xff1a;自定义脚手架 4.开发…

DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION 论文精读笔记

DEFORMABLE DETR DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION 参考&#xff1a;AI-杂货铺-Transformer跨界CV又一佳作&#xff01;Deformable DETR&#xff1a;超强的小目标检测算法&#xff01; 摘要 摘要部分&#xff0c;作者主要说明了如…

2023年7月天猫糕点市场数据分析(天猫数据怎么看)

烘焙食品行业是近几年食品领域比较火热的赛道之一&#xff0c;随着居民饮食结构的变化&#xff0c;人均消费水平的上升&#xff0c;蛋糕、面包等烘焙糕点越发成为消费者饮食的重要组成部分。同时&#xff0c;在烘焙糕点市场中&#xff0c;老品牌不断推新迭变&#xff0c;新品牌…

钉钉小程序引用阿里巴巴图标

2.打开的界面如图&#xff0c;先建一个iconfont.acss文件&#xff0c;全选浏览器打开的样式代码&#xff0c;复制粘贴进新建的iconfont.acss文件中 3.使用

ARM DIY(四)WiFi 调试

文章目录 焊接打开内核编译选项重新编译内核烧录 && 运行 && 测试完善脚本测速手搓天线正式天线 焊接 换个粗点的风枪嘴&#xff0c;让热风覆盖 RTL8823BS 整体模块&#xff0c;最终实现自动归位 焊接 SDIO 接口的上拉电阻以及复位引脚上拉电阻 硬件部分就这…

Typora上使用Mermaid语法展示流程图、时序图、甘特图

你已经安装Typora并打开了一个新文档后,可以按照以下详细步骤在Typora上使用Mermaid语法展示流程图、时序图、甘特图 流程图 使用graph LR声明开始,并使用箭头和连接符号定义节点之间的关系。例如,A --> B表示从节点A指向节点B的箭头连接。graph TB A[界面布局图] -->…

Redisson分布式锁 原理源码 分析

# 基于setnx实现的分布式锁存在的问题&#xff1a; # 为了解决上面的问题&#xff0c;可以用Redisson # Redisson入门 # Redisson可重入锁原理 获取锁的Lua脚本&#xff1a; 释放锁的Lua脚本&#xff1a; # 锁重试原理分析 tryLock&#xff08;&#xff09;底层代码分析 tim…

R语言空气污染数据的地理空间可视化和分析:颗粒物2.5(PM2.5)和空气质量指数(AQI)...

原文链接&#xff1a;http://tecdat.cn/?p23800 由于空气污染对公众健康的不利影响&#xff0c;人们一直非常关注。世界各国的环境部门都通过各种方法&#xff08;例如地面观测网络&#xff09;来监测和评估空气污染问题&#xff08;点击文末“阅读原文”获取完整代码数据&…

机器学习基础之《分类算法(4)—案例:预测facebook签到位置》

一、背景 1、说明 2、数据集 row_id&#xff1a;签到行为的编码 x y&#xff1a;坐标系&#xff0c;人所在的位置 accuracy&#xff1a;定位的准确率 time&#xff1a;时间戳 place_id&#xff1a;预测用户将要签到的位置 3、数据集下载 https://www.kaggle.com/navoshta/gr…

做区块链卡牌游戏有什么好处?

区块链卡牌游戏是一种基于区块链技术的创新性游戏形式&#xff0c;它将传统的卡牌游戏与区块链技术相结合&#xff0c;实现了去中心化、数字化资产的交易和收集。这种新型游戏形式正逐渐在游戏行业引起了广泛的关注和热潮。本文将深入探讨区块链卡牌游戏的定义、特点以及其在未…

论文阅读 The Power of Tiling for Small Object Detection

The Power of Tiling for Small Object Detection Abstract 基于深度神经网络的技术在目标检测和分类方面表现出色。但这些网络在适应移动平台时可能会降低准确性&#xff0c;因为图像分辨率的增加使问题变得更加困难。在低功耗移动设备上实现实时小物体检测一直是监控应用的…

Java网络爬虫——jsoup快速上手,爬取京东数据。同时解决‘京东安全’防爬问题

文章目录 介绍jsoup使用1.解析url&#xff0c;获取前端代码2.解决京东安全界面跳转3.获取每一组的数据4.获取商品数据的具体信息4.最终代码 介绍 网络爬虫&#xff0c;就是在浏览器上&#xff0c;代替人类爬取数据&#xff0c;Java网络爬虫就是通过Java编写爬虫代码&#xff0…

hadoop 学习:mapreduce 入门案例一:WordCount 统计一个文本中单词的个数

一 需求 这个案例的需求很简单 现在这里有一个文本wordcount.txt&#xff0c;内容如下 现要求你使用 mapreduce 框架统计每个单词的出现个数 这样一个案例虽然简单但可以让新学习大数据的同学熟悉 mapreduce 框架 二 准备工作 &#xff08;1&#xff09;创建一个 maven 工…

【python】Leetcode(primer-dict-list)

文章目录 260. 只出现一次的数字 III&#xff08;字典 / 位运算&#xff09;136. 只出现一次的数字&#xff08;字典&#xff09;137. 只出现一次的数字 II&#xff08;字典&#xff09;169. 求众数&#xff08;字典&#xff09;229. 求众数 II&#xff08;字典&#xff09;200…