关系代数的出现,主要是源于对声明性语言与程序性语言的讨论,两边的代表分别是 SQL 和 关系代数(RA)。
SQL是一种声明性查询语言,它描述希望获得的元组集合,为了数据库中有效地实现查询,需要将 SQL 查询转换成过程性程序。 关系代数(RA)是一种用于关系数据库的查询语言,它在用户界面中是不可见的,但是在SQL的核心起着重要作用,还提供了一个评估 SQL 的中间步骤。RA 常用于关系型 DBMS 内部对 SQL 查询进行表达和优化。
关系代数是由一组所有可能的数据库形成的集合,与一组关系操作符共同组成的代数。
常用的操作符号如下表所示:
操作符记号含义备注选择(selection)
σ_φ(R)选择行(元组)φ 为选择的条件,如 A=1;A=B
可用的操作符有 { =, <, ≤, >, ≥, ≠ }
投影(projection)π_(A_1,...,A_n) (R)选择列(属性)A_1,...,A_n 为要投影的属性联合集(union)
交叉集(intersection)
区别集(difference)
R_1 ∪ R_2
R_1 ∩ R_2
R_1 - R_2
集合运算联合集自动清除重复的结果笛卡尔积
连接
自然连接
R_1 × R_2
R_1 _φ R_2
R_1 R_2
连接表φ 是连接的条件重命名(renaming)ρ_R'(A_1,...,A_n)(R) ρ_R'(R) ρ_(A_1,...,A_n)(R)对关系表或者属性重命名R' 是重命名后的关系表名
一组关系操作符的完整集合通常包含 6 个操作符:
选择(σ), 投影(π), 重命名(ρ), 联合集(∪), 区别集(-)和笛卡尔积(×)。这意味着交叉集(∩)和连接()可以通过以上的操作符结合得到:
连接: R1 R2 = σ_φ (R1 × R2)intersection: R1 ∩ R2 = R1 − (R1 − R2)操作符的优先级:(从高到低){ σ,π,ρ },{ ×, },{ ∩ },{ ∪,− }
