SQLite3 数据库学习(一):数据库和 SQLite 基础

参考引用

  • SQL 必知必会
  • SQLite 权威指南(第二版)
  • 关系型数据库概述

1. 数据库基础

1.1 什么是数据库

  • 数据库(database):保存有组织的数据的容器(通常是一个文件或一组文件)

    • 可以将其想象为一个文件柜,此文件柜是一个存放数据的物理位置,不管数据是什么以及如何组织的
  • 数据库软件应称为 DBMS(数据库管理系统),数据库是通过 DBMS 创建和操纵的容器

    • 在很大程度上说,数据库究竟是文件还是别的什么东西并不重要,因为你并不直接访问数据库,而是使用 DBMS,它替你访问数据库

1.2 为什么需要数据库?

因为应用程序需要保存用户的数据,比如 Word 需要把用户文档保存起来,以便下次继续编辑或者拷贝到另一台电脑。要保存用户的数据,一个最简单的方法是把用户数据写入文件

  • 但是,随着应用程序的功能越来越复杂,数据量越来越大,如何管理这些数据就成了大问题

    • 读写文件并解析出数据需要大量重复代码
    • 从成千上万的数据中快速查询出指定数据需要复杂的逻辑

    如果每个应用程序都各自写自己的读写数据的代码,一方面效率低,容易出错,另一方面,每个应用程序访问数据的接口都不相同,数据难以复用

  • 所以,数据库作为一种专门管理数据的软件就出现了。应用程序不需要自己管理数据,而是通过数据库软件提供的接口来读写数据。至于数据本身如何存储到文件,那是数据库软件的事情,应用程序自己并不关心

1.3 基本概念

1.3.1 表
  • 表(table):某种特定类型数据的结构化清单

    • 在你将资料放入自己的文件柜时,并不是随便将它们扔进某个抽屉就完事了,而是在文件柜中创建文件,然后将相关的资料放入特定的文件中
    • 在数据库领域中,这种文件称为表。表可以保存顾客清单、产品目录,或者其他信息清单
    • 存储在表中的数据是同一种类型的数据或一个清单
      • 不应该将顾客的清单与订单的清单存储在同一个数据库表中,因为这样做将使以后的检索和访问很困难,应该创建两个表,每个清单一个表
  • 表名

    • 数据库中的每个表都有一个名字,用来标识自己
    • 此名字是唯一的,这表示数据库中没有其他表具有相同的名字,表名的唯一性取决于多个因素,如数据库名和表名等的结合,这表示在不同的数据库中可以使用相同的表名
  • 模式(schema):关于数据库和表的布局及特性的信息

    • 这些特性定义了数据在表中如何存储,如:可以存储什么样的数据,数据如何分解,各部分信息如何命名等
1.3.2 列和数据类型
  • 列(column):表中的一个字段,所有表都是由一个或多个列组成的

    • 理解列的最好办法是将数据库表想象为一个网格,网格中每一列存储着一条特定的信息
    • 例如,在顾客表中,一个列存储着顾客编号,另一个列存储着顾客名
  • 数据类型(datatype):所容许的数据的类型

    • 每个表列都有相应的数据类型,它限制(或容许)该列中存储的数据种类
      • 例如,可以防止在数值字段中录入字符值
    • 数据类型还可帮助正确地排序数据,并在优化磁盘使用方面起到重要作用
1.3.3 行
  • 行(row):表中的一个记录
    • 表中的数据是按行存储的,所保存的每个记录存储在自己的行内
    • 例如,顾客表可以每行存储一个顾客,表中的行数为记录的总数
1.3.4 键
1、主键
  • 在关系型数据库中,一张表中的每一行数据被称为一条记录
    • 一条记录就是由多个字段组成的。例如,下表 students 的两行记录

在这里插入图片描述

  • 主键(primary key):一列(或一组列),其值能够唯一区分表中每个行

    • 能够通过某个字段唯一区分出不同的记录,这个字段被称为主键
    • 例如,假设上表把 name 字段作为主键,那么通过名字小明或小红就能唯一确定一条记录
  • 业务场景中选取主键的一个基本原则是:不使用任何业务相关的字段作为主键。作为主键最好是完全业务无关的字段,一般把这个字段命名为 id,常见的可作为 id 字段的类型有:

    • 自增整数类型:数据库会在插入数据时自动为每一条记录分配一个自增整数,这样就完全不用担心主键重复,也不用自己预先生成主键
    • 全局唯一 GUID 类型:使用一种全局唯一的字符串作为主键,类似8f55d96b-8acc-4636-8cb8-76bf8abc2f57。GUID 算法通过网卡 MAC 地址、时间戳和随机数保证任意计算机在任意时间生成的字符串都是不同的
    • 每个行都必须具有一个主键值(主键列不允许 NULL 值)

    通常,自增类型的主键就能满足需求。上表 students 中定义的主键也是 BIGINT NOT NULL AUTO_INCREMENT 类型

2、联合主键

在这里插入图片描述

  • 关系型数据库还允许通过多个字段唯一标识记录,即两个或更多的字段都设置为主键,这种主键被称为联合主键

    • 对于联合主键,允许一列有重复,只要不是所有主键列都重复即可
  • 如果把上表的 id_num 和 id_type 这两列作为联合主键,那么上面的 3 条记录都是允许的,因为没有两列主键组合起来是相同的

    • 没有必要的情况下,尽量不使用联合主键,因为它给关系表带来了复杂度的上升

主键的最好习惯

  • 不更新主键列中的值
  • 不重用主键列的值
  • 不在主键列中使用可能会更改的值
3、外键
一对多
  • 当用主键唯一标识记录时,就可以在 students 表中确定任意一个学生的记录

在这里插入图片描述

  • 还可以在 classes 表中确定任意一个班级记录

在这里插入图片描述

  • 但是如何确定 students 表的一条记录,例如,id=1 的小明,属于哪个班级呢?
    • 由于一个班级可以有多个学生,在关系模型中,这两个表的关系可以称为 “一对多”,即一个 classes 的记录可以对应多个 students 表的记录
    • 为了表达这种一对多的关系,需要在 students 表中加入一列 class_id,让它的值与 classes 表的某条记录相对应
    • 在 students 表中,通过 class_id 的字段,可以把数据与另一张表关联起来,这种列称为外键 (下图红框列)

在这里插入图片描述

  • 这样,就可以根据 class_id 这个列直接定位出一个 students 表的记录应该对应到 classes 的哪条记录

    • 小明的 class_id 是 1,因此,对应的 classes 表的记录是 id=1 的一班
    • 小红的 class_id 是 1,因此,对应的 classes 表的记录是 id=1 的一班
    • 小白的 class_id 是 2,因此,对应的 classes 表的记录是 id=2 的二班
  • 外键并不是通过列名实现的,而是通过定义外键约束实现的

    ALTER TABLE students
    ADD CONSTRAINT fk_class_id    // 外键约束名称,可随意指定
    FOREIGN KEY (class_id)        // 指定 class_id 作为外键
    REFERENCES classes (id)       // 指定这个外键将关联到 classes 表的 id 列(即 classes 表的主键)
    DROP FOREIGN KEY fk_class_id  // 删除外键约束 fk_class_id,删除外键约束并没有删除外键这一列
    
多对多
  • 通过一个表的外键关联到另一个表,可以定义出一对多关系。有些时候,还需要定义 “多对多” 关系。例如,一个老师可以对应多个班级,一个班级也可以对应多个老师,因此,班级表和老师表存在多对多关系
    • 多对多关系是通过两个一对多关系实现的,即通过一个中间表,关联两个一对多关系,就形成了多对多关系

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

  • 通过中间表 teacher_class 可知 teachersclasses 的关系

    • id=1 的张老师对应 id=1,2 的一班和二班
    • id=2 的王老师对应 id=1,2 的一班和二班
    • id=3 的李老师对应 id=1 的一班
    • id=4 的赵老师对应 id=2 的二班
  • 同理可知 classesteachers 的关系

    • id=1 的一班对应 id=1,2,3 的张老师、王老师和李老师
    • id=2 的二班对应 id=1,2,4 的张老师、王老师和赵老师
一对一
  • 一个表的记录对应到另一个表的唯一一个记录
    • 例如,students 表的每个学生可以有自己的联系方式,如果把联系方式存入另一个表 contacts,就可以得到一个 “一对一” 关系
    • 实际上,一对一关系准确地说,是 contacts 表一对一对应 students 表

在这里插入图片描述

  • 还有一些应用会把一个大表拆成两个一对一的表,目的是把经常读取和不经常读取的字段分开,以获得更高的性能
    • 例如,把一个大的用户表拆分为用户基本信息表 user_info 和用户详细信息表 user_profiles,大部分时候,只需要查询 user_info 表,并不需要查询 user_profiles 表,这样就提高了查询速度
1.3.5 索引
  • 在关系数据库中,如果有上万甚至上亿条记录,在查找记录的时候,想要获得非常快的速度,就需要使用索引

    • 索引是关系数据库中对某一列或多个列的值进行预排序的数据结构
    • 通过使用索引,可以让数据库系统不必扫描整个表,而是直接定位到符合条件的记录,这就大大加快了查询速度
  • 例如,对于 students 表,如果要经常根据 score 列进行查询,就可以对 score 列创建索引

    ALTER TABLE students
    ADD INDEX idx_score (score);
    //ADD INDEX idx_name_score (name, score);  // 索引名称是任意的,索引如果有多列,可以在括号里依次写上
    

在这里插入图片描述

唯一索引
  • 在设计关系数据表的时候,看上去唯一的列,例如身份证号、邮箱地址等,因为他们具有业务含义,因此不宜作为主键。但是,这些列根据业务要求,又具有唯一性约束:即不能出现两条记录存储了同一个身份证号。这个时候,就可以给该列添加一个唯一索引。例如,假设 students 表的 name 不能重复
    ALTER TABLE students
    ADD UNIQUE INDEX uni_name (name);  // 通过 UNIQUE 关键字就添加了一个唯一索引
    

1.4 数据模型

1.4.1 层次模型
  • 层次模型就是以 “上下级” 的层次关系来组织数据的一种方式,层次模型的数据结构看起来就像一颗树

在这里插入图片描述

1.4.2 网状模型
  • 网状模型把每个数据节点和其他很多节点都连接起来,它的数据结构看起来就像很多城市之间的路网

在这里插入图片描述

1.4.3 关系模型
  • 关系模型把数据看作是一个二维表格,任何数据都可以通过行号 + 列号来唯一确定,它的数据模型看起来就是一个 Excel 表
    • 基于关系模型的关系型数据库成为主流,因为相比层次模型和网状模型,关系模型理解和使用起来最简单

在这里插入图片描述

  • 现有主流的关系型数据库
    • 商用数据库,例如:Oracle,SQL Server,DB2 等
    • 开源数据库,例如:MySQL,PostgreSQL 等
    • 桌面数据库,以微软 Access 为代表,适合桌面应用程序使用
    • 嵌入式数据库,以 SQLite 为代表,适合手机应用和桌面程序

1.5 数据类型

  • 通常来说,BIGINT 能满足整数存储的需求,VARCHAR(N) 能满足字符串存储的需求,这两种类型是使用最广泛的
    • 下表中列举了最常用的数据类型,各数据库厂商还会支持特定的数据类型,例如 JSON
      在这里插入图片描述

2. SQL 介绍

  • SQL(发音为字母 S-Q-L 或 sequel)是结构化查询语言(Structured Query Language)的缩写

    • SQL 是一种专门用来与数据库通信的语言
  • SQL 的优点

    • SQL不是某个特定数据库供应商专有的语言
      • 几乎所有重要的 DBMS 都支持 SQL
    • SQL 简单易学
      • 它的语句全都是由描述性很强的英语单词组成,而且这些单词的数目不多
    • SQL 是一种强有力的语言,灵活使用其语言元素,可以进行非常复杂和高级的数据库操作
  • SQL 语言定义 3 种操作数据库的能力

    • DDL:Data Definition Language
      • DDL 允许用户定义数据,也就是创建表、删除表、修改表结构这些操作
      • 通常,DDL 由数据库管理员执行
    • DML:Data Manipulation Language
      • DML 为用户提供添加、删除、更新数据的能力,这些是应用程序对数据库的日常操作
    • DQL:Data Query Language
      • DQL 允许用户查询数据,这也是通常最频繁的数据库日常操作

任意两个 DBMS(数据库管理系统)实现的 SQL 都不完全相同,无法完全直接移植

3. SQLite 介绍

3.1 简介

  • SQLite 是一款开源的、嵌入式关系型数据库

    • 它没有独立运行的进程,它与所服务的应用程序在应用程序进程空间内共生共存
    • 它的代码与应用程序代码也是在一起的,或者说嵌入其中作为托管它的程序的一部分
    • 程序只需要做自己的事,管理自己的数据,不需要详细了解 SQLite 是如何工作的
  • 数据库服务器和客户端运行在同一个进程中的好处是:不需要网络配置或管理

    • 不用担心防火墙或者地址解析,不用浪费时间管理复杂的授权和权限
    • 可以减少网络调用相关的消耗,简化数据库管理,使程序更容易部署
  • 从下图可知,一个 Perl 脚本、一个标准 C/C++ 程序和一个 Apache 托管的 PHP 脚本都使用 SQLite

    • 这三种都有嵌入在它们进程空间的 SQLite,这样做不仅可以使这些进程运行各自的代码,也可以成为独立的数据库服务器
    • 此外,尽管每个进程中都有独立的数据库服务器,但它们依然可以操作同一个数据库文件,因为 SQLite 利用操作系统功能来完成数据的同步和加锁

在这里插入图片描述

3.2 体系结构

在这里插入图片描述

  • 接口

    • 接口处于栈的顶端,由 SQLite C API 组成
    • 程序、脚本语言还有与 SQLite 交互的库文件最终都是通过它与 SQLite 交互的
  • 编译器

    • 编译过程从词法分析器 (Tokenizer) 和语法分析器 (Parser) 开始。它们协同处理文本形式的结构化查询语句 (Structured Query Language,SQL),分析其语法有效性,然后转化为底层能更方便处理的层次化数据结构
    • SQLite 词法分析器是手动编码实现,它的语法分析器是由 SQLite 特定的语法分析生成器 Lemon 产生
  • 虚拟机

    • 架构栈的中心部分是虚拟机,也叫做虚拟数据库引 (Virtual DataBase Engine,VDEB)
    • VDBE 是 SQLite 的核心,它之前的所有模块都是用于创建 VDBE 程序的,它之后的所有模块都是用于执行 VDBE 序的,每次执行一条指令
  • 后端

    • 后端由 B-tree、页缓存 (page cache) 以及操作系统接口组成
    • B-tree 将页面组织成树状结构,这种组织结构很适合搜索,页面就是树的叶子
    • pager (SQLite 的一种数据结构) 帮助 B-tree 管理页面,它负责传输

3.3 性能和局限性

3.3.1 性能
  • 在对单表进行查询时平均而言,SQLite 与其他数据库一样快。简单的 SELECT、INSERT 和 UPDATE 是相当快速的。SQLite 通常要快其他数据库,因为它在处理一个事务开始,或者一个查询计划的产生方面开销较小,并且没有调用服务器的网络或认证以及权限协商的开销
  • 但是随着查询变大变复杂,查询时间使得网络调用或者事务处理开销相形见绌,SQLite 将会与其他数据库一样,这时一些大型的设计复杂的数据库开始发挥作用了
3.3.2 局限性
  • 并发
    • SQLite 的锁机制是粗粒度的,它允许多个读,但是一次只允许一个写
    • 写锁会在写期间排他地锁定数据库,其他人在此期间不能访问数据库
  • 网络
    • 虽然 SQLite 数据库可以通过网络文件系统共享,但是与这种文件系统相关的潜在延时会导致性能受损
    • 如果文件系统的锁实现不当,可能允许两个客户端同时修改同一个数据库文件,这必然会导致数据库出错

并发性要求低、数据小于 1TB、本地存储的应用场景下可以考虑使用 SQLite

3.4 SQLite 安装

3.4.1 SQLite on Windows

  • Qt 编译安装 SQLite
  1. 源码下载
    在这里插入图片描述

  2. 在 Qt 中新建 C 项目
    在这里插入图片描述

  3. 将第 1 步下载的源码解压后全部拷贝到第 2 步中创建的 C 项目中(与 main.c 同级),并删除原有 main.c 文件(因为源码 shell.c 中也有 main 函数,会产生冲突
    在这里插入图片描述

  4. 勾选下图所示选项
    在这里插入图片描述

  5. 编译成功如下
    在这里插入图片描述

  • 安装数据库查看工具 Sqlite Expert
    • Sqlite Expert

3.4.2 SQLite on Linux

  • 安装 SQLite

    $ sudo apt-get install sqlite3
    
  • 运行 SQLite
    在这里插入图片描述

  • 安装数据库查看工具 SQLite Browser

    $ sudo apt install sqlitebrowser -y
    

linux 下通过 gcc 编译 sqlite3

  • gcc -o sqlite3 sqlite3.c shell.c -lpthread -ldl

linux下通过arm-linux-gcc交叉编译sqlite3

  • arm-linux-gcc -o sqlite3 sqlite3.c shell.c -lpthread -ldl

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/191536.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言仅凭自学能到什么高度?

今日话题,C语言仅凭自学能到什么高度?学习C语言的决定我确实非常推荐,毕竟它是编程领域的“通用工具”,初学者可以尝试并在发现编程的乐趣后制定长期学习计划。至于能够达到何种高度,这实在无法准确回答。即使是经验丰…

NtripShare Mos地铁自动化监测终端盒子硬件设计

自动化监测产品到目前为止做了接近一年,在软件层面上,控制终端软件、平台软件、网平差算法都已解决,硬件盒子始终是心里过不去的坎,最终还是没有耐住性子自己做了一把。 选型如下: 1、主板:瑞芯微RK3568主板。 2、外…

主流接口测试框架对比,究竟哪个更好用

公司计划系统的开展接口自动化测试,需要我这边调研一下主流的接口测试框架给后端测试(主要测试接口)的同事介绍一下每个框架的特定和使用方式。后端同事根据他们接口的特点提出一下需求,看哪个框架更适合我们。 需求 1、接口编写…

Windows系统下使用docker部署redis

使用虚拟机部署redis,虚拟机很占用电脑资源,所以选择使用docker对redis进行部署。 一、安装docker 安装链接:https://docker.p2hp.com/ 二、配置redis.conf文件 下载配置文件:https://download.redis.io/redis-stable/redis.con…

rabbitMq创建交换机,以及路由键绑定队列教程

创建交换机: 创建队列: 创建路由,绑定到交换机: 补充: 创建新用户后,记得点进用户中,那两个set都点击一下; 还有配置代码连接的时候,连的端口为5672,可不…

【JavaEE】Servlet(创建Maven、引入依赖、创建目录、编写及打包、部署和验证、smart Tomcat)

一、什么是Servlet? Servlet 是一种实现动态页面的技术. 是一组 Tomcat 提供给程序猿的 API, 帮助程序猿简单高效的开发一个 web app 1.1 Servlet能干什么? 🚕允许程序猿注册一个类, 在 Tomcat 收到某个特定的 HTTP 请求的时候, 执行这个类…

Azure 机器学习 - 机器学习中的企业安全和治理

目录 限制对资源和操作的访问网络安全性和隔离数据加密数据渗透防护漏洞扫描审核和管理合规性 在本文中,你将了解可用于 Azure 机器学习的安全和治理功能。 如果管理员、DevOps 和 MLOps 想要创建符合公司策略的安全配置,那么这些功能对其十分有用。 通过…

Linux必备基础命令,JAVA程序员必备

目录 一、了解基本的左侧栏什么意思​编辑 二、ls,ll(list,查找目录内容) 三、cd(change directory,切换目录) 小技巧,我们在查找东西的时候,可以使用tab进行智能补全。 四、touch(建立文件…

R程序 示例4.3.2版本包 在centos进行编译部署

为了在CentOS上下载和编译R语言4.3.2包,可以按照以下步骤进行操作: 1.首先,需要安装一些必要的依赖项。可以使用以下命令安装它们: sudo yum install -y epel-release sudo yum install -y gcc gcc-c gcc-gfortran readline-dev…

RTSP/Onvif安防平台EasyNVR批量禁用/启用通道接口的详细操作步骤

TSINGSEE青犀视频安防监控平台EasyNVR可支持设备通过RTSP/Onvif协议接入,并能对接入的视频流进行处理与多端分发,包括RTSP、RTMP、HTTP-FLV、WS-FLV、HLS、WebRTC等多种格式。在智慧安防等视频监控场景中,EasyNVR可提供视频实时监控直播、云端…

Python爬虫过程中DNS解析错误解决策略

在Python爬虫开发中,经常会遇到DNS解析错误,这是一个常见且也令人头疼的问题。DNS解析错误可能会导致爬虫失败,但幸运的是,我们可以采取一些策略来处理这些错误,确保爬虫能够正常运行。本文将介绍什么是DNS解析错误&am…

RAFT3D 代码复现

代码地址 https://github.com/princeton-vl/RAFT-3D 配置环境 1.创建环境 conda create -n raft3d python3.8 conda activate raft3d2.安装库 conda install pytorch1.8.0 torchvision0.9.0 torchaudio0.8.0 cudatoolkit11.1 -c pytorch -c conda-forgesudo apt-get insta…

linux查看端口占用情况

lsof命令 lsof(list open files)命令可以列出当前系统中打开的所有文件,包括网络端口。可以使用lsof命令查看某个端口被哪个进程占用。 具体的命令为:sudo lsof -i :端口号,其中端口号为需要查询的端口号。 netstat命令 使用netstat命令&a…

使用责任链模式实现登录风险控制

责任链模式 责任链模式是是设计模式中的一种行为型模式。该模式下,多个对象通过next属性进行关系关联,从而形成一个对象执行链表。当发起执行请求时,会从首个节点对象开始向后依次执行,如果一个对象不能处理该请求或者完成了请求…

DefaultListableBeanFactory

DefaultListableBeanFactory 是一个完整的、功能成熟的 IoC 容器,如果你的需求很简单,甚至可以直接使用 DefaultListableBeanFactory,如果你的需求比较复杂,那么通过扩展 DefaultListableBeanFactory 的功能也可以达到&#xff0c…

金蝶云星空和管易云接口打通对接实战

金蝶云星空和管易云接口打通对接实战 对接系统:金蝶云星空 金蝶K/3Cloud结合当今先进管理理论和数十万家国内客户最佳应用实践,面向事业部制、多地点、多工厂等运营协同与管控型企业及集团公司,提供一个通用的ERP服务平台。K/3Cloud支持的协同…

时序数据库 TDengine + 高级分析软件 Seeq,助力企业挖掘时序数据潜力

作为一款制造业和工业互联网(IIOT)高级分析软件,Seeq 支持在工艺制造组织中使用机器学习创新的新功能。这些功能使组织能够将自己或第三方机器学习算法部署到前线流程工程师和主题专家使用的高级分析应用程序,从而使单个数据科学家…

sqlserver查询时去除1900-01-01

在下图示例中“chk_date”字段在数据中显示的是默认时间,如何将这个时间在SQL查询时设为空? cast(nullif(a.chk_date,) as datetime) 确认日期 以上是我的方法。 select chk_date as 日期 from Ixa_payment_req 运行结果是:1900-01-01 00:0…

【移远QuecPython】EC800M物联网开发板的SIM卡初始化和网络状态检测

【移远QuecPython】EC800M物联网开发板的SIM卡初始化和网络状态检测 文章目录 SIM卡初始化导入库获取SIM状态 网络检测导入库等待网络就绪 函数打包附录:列表的赋值类型和py打包列表赋值BUG复现代码改进优化总结 py打包 SIM卡初始化 导入库 import sim获取SIM状态…

【机器学习基础】机器学习入门(2)

🚀个人主页:为梦而生~ 关注我一起学习吧! 💡专栏:机器学习 欢迎订阅!后面的内容会越来越有意思~ 💡往期推荐:【机器学习基础】机器学习入门(1) 💡…