6 / 21

形式化关系查询语言

在前面的内容中，我们已经系统学习了关系模型及其对应的 SQL 查询语言。为了更深入地理解这些实际技术的理论基础，有必要掌握形式化关系查询语言。形式化查询语言为数据库查询操作提供了严谨的数学描述和分析框架，是数据库理论的核心组成部分。

所以我们将系统介绍三类主要的形式化查询语言：关系代数、元组关系演算和域关系演算。关系代数是 SQL 的理论基础，采用过程化范式，强调查询的操作步骤；元组关系演算和域关系演算则基于一阶逻辑，采用声明式范式，侧重于描述查询的逻辑条件和目标结果。

形式化关系查询语言

关系代数

关系代数是一种过程化的关系查询语言，具有严密的数学基础。它通过定义一组基本操作，对关系（即关系数据库中的表）进行处理，每个操作以一个或两个关系作为输入，输出一个新的关系，从而实现对数据的查询与变换。

在理论上，关系可以被视为数学意义上的集合，关系代数则规定了在这些集合上可执行的各种运算规则。通过组合这些操作，可以构建出复杂的查询表达式，以满足多样化的数据检索需求。

关系代数包括六种基本操作：选择（Selection）、投影（Projection）、并集（Union）、差集（Set Difference）、笛卡尔积（Cartesian Product）和重命名（Rename）。此外，还存在若干衍生操作，如交集（Intersection）、自然连接（Natural Join）和赋值（Assignment）等，这些衍生操作均可通过基本操作进行定义和实现。

基础操作

关系代数的基本操作可分为两大类：一元操作和二元操作。其中，选择（Selection）、投影（Projection）和重命名（Rename）属于一元操作，仅作用于单一关系；并集（Union）、差集（Set Difference）和笛卡尔积（Cartesian Product）属于二元操作，需以两个关系为输入对象。

选择操作

选择操作（Selection）用于从关系中选取满足给定谓词条件的元组。该操作以希腊字母σ（sigma）表示，选择条件作为下标，操作对象的关系作为括号内的参数。

例如，考虑一个教师关系，记录了教师的基本信息：

|
-- 教师表示例数据
教师ID | 姓名   | 系别     | 薪资
10001  | 张教授  | 计算机系  | 85000
10002  | 李老师  | 数学系    | 75000  
10003  | 王教授  | 物理系    | 95000
10004  | 陈老师  | 计算机系  | 88000
10005  | 赵教授  | 化学系    | 72000

如果我们要查找计算机系的所有教师，用关系代数表示就是：

|
教师.教师ID | 教师.姓名 | 课程.课程ID | 课程.课程名
101         | 张教授    | CS-101      | 数据库
101         | 张教授    | CS-201      | 算法  
102         | 李老师    | CS-101      | 数据库
102         | 李老师    | CS-201      | 算法

操作类型	表示形式	说明
并集	E1 ∪ E2	合并两个关系的记录
差集	E1 − E2	E1中有但E2中没有的记录
笛卡尔积	E1 × E2	两个关系的所有记录组合
选择	σ_P(E1)	满足条件P的记录
投影	π_S(E1)	保留属性列表S中的属性
重命名	ρ_x(E1)	将结果命名为x

|
-- 教师表
教师ID | 姓名   | 系别
101    | 张教授  | 计算机系
102    | 李老师  | 数学系
 
-- 授课表
教师ID | 课程ID | 学期
101    | CS-101 | 秋季
101    | CS-201 | 春季  
102    | MATH-101 | 秋季

|
教师ID | 姓名   | 系别     | 课程ID   | 学期
101    | 张教授  | 计算机系  | CS-101   | 秋季
101    | 张教授  | 计算机系  | CS-201   | 春季
102    | 李老师  | 数学系    | MATH-101 | 秋季

操作类型	符号	说明
左外连接	⟕	保留左边关系中的所有记录，右边无匹配时用null填充右边属性
右外连接	⟖	保留右边关系中的所有记录，左边无匹配时用null填充左边属性
全外连接	⟗	保留两个关系中的所有记录，无匹配的部分用null填充对应属性

|
-- 教师表
教师ID | 姓名   | 系别
101    | 张教授  | 计算机系
102    | 李老师  | 数学系  
103    | 王教授  | 物理系
 
-- 授课表
教师ID | 课程ID | 学期
101    | CS-101 | 秋季
102    | MATH-101 | 春季

|
教师ID | 姓名   | 系别     | 课程ID   | 学期
101    | 张教授  | 计算机系  | CS-101   | 秋季
102    | 李老师  | 数学系    | MATH-101 | 春季
103    | 王教授  | 物理系    | null     | null

函数	功能
sum	求和
avg	求平均值
count	计数
min	求最小值
max	求最大值

特征	元组关系演算	域关系演算
变量类型	元组变量	域变量
思维方式	以记录为单位思考	以属性值为单位思考
表达复杂度	需要显式指定属性	直接操作值
与SQL关系	较远	更接近

教师ID	姓名	系别	薪资	职称
1001	张教授	计算机系	95000	教授
1002	李老师	数学系	78000	副教授
1003	王教授	物理系	88000	教授
1004	陈老师	计算机系	72000	讲师
1005	赵教授	化学系	82000	教授

课程ID	课程名	学分	教师ID
CS101	数据库	3	1001
MATH201	高等数学	4	1002
PHYS301	量子物理	3	1003

课程ID	课程名	学分	教师ID
CS101	数据库	3	1001
CS315	算法设计	3	1004
CHEM101	有机化学	4	1005

教师ID	姓名	系别
1001	张教授	计算机系
1002	李老师	数学系
1003	王教授	物理系

教师ID	课程ID	学期	年份
1001	CS101	秋季	2023
1001	CS315	春季	2024
1002	MATH201	秋季	2023
1003	PHYS301	春季	2024

学号	课程ID	成绩	学期
2023001	CS101	85	秋季
2023001	MATH201	92	秋季
2023002	CS101	78	秋季
2023002	PHYS301	88	春季
2023003	MATH201	90	秋季
2023003	CHEM101	85	春季

教师ID	姓名	系别	薪资	入职年份
1001	张教授	计算机系	95000	2010
1002	李老师	数学系	78000	2015
1003	王教授	物理系	88000	2008
1004	陈老师	计算机系	72000	2018

系别	大楼	预算
计算机系	主楼	5000000
数学系	理科楼	3000000
物理系	理科楼	4500000

教师ID	姓名	系别	职称
1001	张教授	计算机系	教授
1002	李老师	数学系	副教授
1003	王教授	物理系	教授

课程ID	课程名	学分	系别
CS101	数据库	3	计算机系
MATH201	高等数学	4	数学系
PHYS301	量子物理	3	物理系

教师ID	课程ID	学期	年份	教室
1001	CS101	秋季	2023	A101
1002	MATH201	秋季	2023	B201
1003	PHYS301	春季	2024	C301

教师ID	姓名	系别
1001	张教授	计算机系
1002	李老师	数学系
1003	王教授	物理系
1004	陈老师	化学系

教师ID	课程ID	学期
1001	CS101	秋季
1002	MATH201	秋季
1003	PHYS301	春季

r

形式化关系查询语言 | 自在学

形式化关系查询语言

关系代数

基础操作

选择操作

投影操作

关系代数表达式的组合

并集操作

差集操作

笛卡尔积操作

重命名操作

关系代数的正式定义

附加的关系代数操作

交集操作

自然连接操作

赋值操作

外连接操作

扩展的关系代数操作

广义投影

聚合操作

关系代数与SQL的对应关系

元组关系演算

基本概念和语法

简单查询示例

逻辑连接词的使用

多关系查询

全称量词的使用

表达式的安全性

元组关系演算的表达能力

域关系演算

基本概念和语法 —— 域关系演算

域关系演算与元组关系演算的比较

安全性问题

与QBE的关系

实战演练

习题一：关系代数基础操作

习题二：并集与差集操作

习题三：自然连接操作

习题四：聚合操作

习题五：元组关系演算

习题六：域关系演算

习题七：复杂查询综合

习题八：外连接操作