思维导图:
2.1.1 关系
笔记:
关系数据库模型是一个简单但强大的方式来表示数据及其之间的关系。下面是这节的关键内容:
- **关系模型核心概念**
* 关系数据模型的核心是“关系”,它在逻辑上表现为一个二维表。
* 此表中,每一行称为一个元组,每一列称为一个属性或域。
* 数据的逻辑结构只是二维表,这使得关系模型既简单又强大。
- **域 (Domain)**
* 域定义了可能的值的集合,每个域都有一个与之关联的数据类型。
* 示例:整数、实数、小于25字节的字符串集合都是有效的域。
- **笛卡尔积 (Cartesian Product)**
* 笛卡尔积是定义在一组域上的集合运算。
* 如果我们有两个集合,笛卡尔积就是所有可能的元组组合。
* 例如,给定三个域 D₁, D₂, D₃, 它们的笛卡尔积会产生一个包含所有可能组合的新集合。
- **元组 (Tuple)**
* 一个元组是关系中的一行,由多个分量或值组成。
* 每个分量代表域中的一个值。
* 在示例中,(张清玫,计算机专业,李勇) 是一个元组。
- **二维表**
* 笛卡尔积的结果可以表示为一个二维表,每行表示一个元组,每列表示一个域的值。
从上述内容中,我们可以理解关系模型的基本构建块:域、元组、关系。这为后续章节介绍关系操作、完整性约束和其他概念打下了基础。
我的理解:
关系数据库模型中的概念可以在日常生活中找到相应的类比,以帮助我们更好地理解。以下是对这一节概念的简化和日常类比:
1. **关系**: 想象一张电子表格或Excel表格。这张表格就是一个“关系”。每行代表一个实体(如一个人、一本书等),每列代表实体的某个属性(如姓名、年龄或书的标题)。
2. **域 (Domain)**: 域可以看作是一个特定的列可能有的所有值的集合。例如,对于一个“性别”列,域可能是{男,女}。这就像在填写表格时,某列下你只能从特定的选择列表中选择。
3. **笛卡尔积 (Cartesian Product)**: 想象你有两副扑克牌,你想列出所有可能的两张牌的组合。这样的组合列表就是笛卡尔积的结果。在数据库中,笛卡尔积指的是从多个域中取值形成的所有可能的元组组合。
4. **元组 (Tuple)**: 这就像电子表格中的一行。它表示一个完整的记录,例如一个学生或一个订单。
5. **二维表**: 这是整个关系的表示,就像一个完整的Excel表格。在这个表格中,你可以看到所有的记录和它们的属性。
总结一下:
- 关系数据库模型其实就是通过二维表来组织和存储数据的一种方式。
- 这些表中的每一行代表一个记录,每一列代表一个属性。
- 这些属性的取值范围被称为“域”。
- 通过组合不同域的取值,我们可以得到许多可能的记录组合,这就是笛卡尔积。
理解这些基本概念是掌握关系数据库操作、查询和设计的基础。
这一节详细介绍了关系数据库中的关系的基本性质和定义。以下是对这些内容的笔记摘要:
1. **主码**: 如果假设研究生不会重名, `POSTGRADUATE`属性的每个值都唯一地标识了一个元组,因此它可以作为`SAP`关系的主码。
2. **关系类型**:
- **基本关系/基表**: 实际存在的表,是存储数据的逻辑表示。
- **查询表**: 查询结果对应的表。
- **视图表**: 由基本表或其他视图表导出的,是虚表,不对应实际存储的数据。
3. **关系的性质**:
- 关系是有限的。
- 列可以任意交换。
- 任意两个元组的候选码不能相同。
- 行可以任意交换。
- 分量必须取原子值。
4. **关系的规范化**:
- 关系模型要求关系必须是规范化的。
- 每一个分量都必须是不可分的数据项。
- 规范化的关系简称为范式(Normal Form, NF)。
- “表中有表”是不允许的。
5. **例子**: 表2.3展示了导师与研究生之间的一对多关系,但由于`POSTGRADUATE`属性中的分量取了两个值,这不符合规范化的要求。
6. **实际数据库产品的性质**: 不是所有的关系数据库产品都完全满足这6条性质。例如,有的仍然区分了属性顺序和元组的顺序。元组有时被称为记录。
通过这些笔记,可以清晰地理解关系数据库的关键概念,特别是关于关系的性质和规范化的要求。
2.1.2 关系模式
1. **型与值的区分**:在关系数据库中,关系模式代表“型”,而关系代表“值”。
2. **关系模式描述**:关系模式指明了元组集合的结构,如何由哪些属性构成,这些属性来自哪些域,以及它们之间的映像关系。
3. **完整性约束**:现实世界的事实和规则限定了关系模式所有可能的关系必须满足一定的完整性约束条件。
4. **定义2.4**:关系模式(relation schema)形式化地表示为R(U,D,DOM,F)。
5. **关系与关系模式的区别**:关系模式是静态的描述,而关系是动态的,表示在某一时刻的状态或内容。
2.1.3 关系数据库
1. **关系的表示**:实体及其联系在关系模型中都用关系表示。
2. **关系数据库的定义**:在特定应用领域中,所有关系的集合构成一个关系数据库。
3. **关系数据库模式与值的区分**:关系数据库模式描述关系数据库,而关系数据库的值表示某一时刻的关系集合。
2.1.4 关系模型的存储结构
1. **逻辑与物理表示**:关系数据的逻辑模型是表,而物理组织可以依赖于操作系统或由关系数据库管理系统自行管理。
总结:
当谈及关系数据结构,我们通常是指关系数据模型的核心组件。关系数据模型由E.F.Codd在1970年提出,它为数据管理提供了一种逻辑方法,基于数学的集合论和逻辑。以下是关系数据结构的关键概念及其形式化定义的简要总结:
1. **关系**:关系是由相同类型的元组(或行)组成的集合。每个元组是由一组有序的属性值组成。
2. **属性**:每个关系都有一个固定数目的属性,可以视为关系的列。每个属性都有一个相关联的域,该域规定了该属性可能的值的集合。
3. **域**:域是一个属性可能取的值的集合。比如,日期域包含了所有可能的日期。
4. **元组**:在关系中,元组代表了一行数据。每个元组都包含该关系的每个属性的一个值。
5. **关系模式**:描述了关系的结构。它可以形式化地表示为:
\[ R(A_1, A_2, ..., A_n) \]
其中,\( R \) 是关系名,而 \( A_1, A_2, ..., A_n \) 是属性名。
6. **关系实例**:是关系模式在某一时刻的状态或值。它是元组的集合。
7. **完整性约束**:这是关系数据库必须满足的条件,确保数据的准确性和可靠性。常见的约束包括实体完整性(确保主键的唯一性和非空性)和参照完整性(确保外键值匹配另一个表中的主键值或为空)。
8. **主键**:是关系中唯一标识元组的属性集。在关系的任何两个不同的元组中,主键的值都是不同的。
关系数据结构的美妙之处在于它的数学基础。它基于集合论,并使用标准的数学记号进行操作,如并集、交集和差集。这种结构为数据库管理提供了一个坚实的理论基础,使得数据操作和查询都可以在一个清晰、一致的框架内进行。