先后经历的有层次模型、网状模型、关系模型。 21世纪以后出现了对象数据库技术、网络数据库技术等。
数据库 的概念源于20世纪50年代,当时为了战争的需要,把各种情报集中在一起,存储到计算机中。
数据:是数据库系统研究和处理的对象,是描述现实世界的符号,是信息的载体。
信息:关于现实世界事物存在方式或运动状态的反映,是对数据语义的解释。
数据管理:数据的收集、整理、组织、存储、维护、检索、传递等操作。
数据库(DB,DataBase): 是长期存储在计算机内、有组织的、统一管理的相关数据的集合。
特点是:用户共享、具有较小冗余(Redundancy)度、数据间联系紧密而又有较高的数据独立性等。数据库管理系统(DBMS,DataBase Management System):是位于用户与操作系统(OS)之间的一层数据管理软件。
作用是:为用户或应用程序提供访问DB的方法,包括建立、查询、更新及各种数据控制。总是基于某种数据模型,可以分为层次、网状、关系、面向对象等。数据库系统(DBS,DataBase System):是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统。(是使用数据库技术的计算机系统)
数据库技术:是研究数据库的结构、存储、设计、管理和使用的一门软件课程,是在操作系统的文件系统基础上发展起来的。
需要用到数据结构的知识,例如链表、树、图。应用程序是使用数据库系统最基本的方式。集合论、数理逻辑是关系数据库的理论基础。是根据用户的需求设计数据库的概念结构,采用以下四个术语:
实体(Entity):客观存在,可以相互区别的事物称为实体;实体集(Entity Set):性质相同的同类实体的集合称为实体集;属性(Attribute):实体有很多特性,每一个特性称为属性,每个属性有一个值域;实体标识符(Identifier):能惟一标识实体的属性或属性集的标识符称为实体标识符(主键、主码)。是根据概念设计得到的概念结构设计数据库的逻辑结构,即表达方式和实现方法,采用:
字段(Field):标记实体属性的命名单位称为字段,或数据项,命名往往和属性名相同;记录(Record):字段的有序集合称为记录(能完整地描述一个实体的字段集);文件(File):同一类记录的集合称为文件,文件是用来描述实体集的,例如所有的学生记录组成了一个学生文件;主键(Key):能惟一标识文件中每个记录的字段或字段集。概念设计和逻辑设计中的对应关系:
是设计数据库的物理结构,有以下一些数据描述的术语:
位(Bit):一个二进制位称为“位”。一位只能取0或 1 两个状态。字节(Byte):8个比特(Bit称为一个字节)可以存放一个字符所对应的ASCII码。字(Word):若干个字节组成一个字,一个字所含的二进制位的位数称为字长,各种计算机的字长是不一样的。块(Block):又称为物理块或物理记录,块是内存和外存交换信息的最小单位,每块的大小,通常为210 - 214 字节,内、外存信息交换是由操作系统的文件系统管理的。桶(Bucket):外存的逻辑单位,一个桶可以包含一个物理块或多个在空间上不一定连续的物理块。卷(Volume):一个输入/输出设备所能装载的全部有用信息,称为“卷”。能表示实体类型及实体间联系的模型称为“数据模型”。
也可以叫数据抽象的级别,模式结构:
外模式(也叫视图,用户看到的样子);逻辑模式(数据的表述形式);物理模式(数据在磁盘上的存储形式)。三个级别之间往往差别很大,为了实现这三个抽象级别的联系和转换,DBMS在三级结构之间提供两个层次的映射(Mapping)。
从模块结构来观察,DBMS由两大部分组成:查询处理器和存储管理器。
查询处理器有四个主要成分:DDL编译器,DML编译器,嵌入式DML的预编译器及查询运行核心程序;存储管理器有四个主要成分:权限和完整性管理器,事务管理器,文件管理器及缓冲区管理器。DBS的全局结构: