示例SQL:
SELECT * FROM user LEFT JOIN order ON user.id = order.uid WHERE order.price > 1000 GROUP BY user.name HAVING count(1) > 5 ORDER BY user.name LIMIT 0,10
FROM(将最近的两张表,进行笛卡尔积)---产生结果VT1ON(将VT1按照它的条件进行过滤)---产生结果VT2LEFT JOIN(保留左表的记录)---产生结果VT3WHERE(过滤VT3中的记录)--产生结果VT4到VTnGROUP BY(对VT4的记录进行分组)---产生结果VT5HAVING(对VT5中的记录进行过滤)---产生结果VT6SELECT(对VT6中的记录,选取指定的列)--产生结果VT7ORDER BY(对VT7的记录进行排序)--游标控制LIMIT(对排序之后的值进行分页) WHERE条件执行顺序(影响性能) MYSQL:从左往右去执行WHERE条件的。Oracle:从右往左去执行WHERE条件的。 结论:写WHERE条件的时候,优先级高的部分要去编写过滤力度最大的条件语句,这样后面的语句过滤前的结果会比较小,效率会比较高。
Connectors:指的是不同语言中与SQL的交互。
Management Serveices & Utilities:系统管理和控制工具
Connection Pool: 连接池
管理缓冲用户连接,线程处理等需要缓存的需求。负责监听对 MySQL Server 的各种请求,接收连接请求,转发所有连接请求到线程管理模块。每一个连接上 MySQL Server 的客户端请求都会被分配(或创建)一个连接线程为其单独服务。而连接线程的主要工作就是负责 MySQL Server 与客户端的通信,接受客户端的命令请求,传递 Server 端的结果信息等。线程管理模块则负责管理维护这些连接线程。包括线程的创建,线程的 cache 等。
SQL Interface: SQL接口
接受用户的SQL命令,并且返回用户需要查询的结果。比如select from就是调用SQL Interface
Parser: 解析器
SQL命令传递到解析器的时候会被解析器验证和解析。主要功能:a . 将SQL语句进行语义和语法的分析,分解成数据结构,然后按照不同的操作类型进行分类,然后做出针对性的转发到后续步骤,以后SQL语句的传递和处理就是基于这个结构的。b. 如果在分解构成中遇到错误,那么就说明这个sql语句是不合理的
Optimizer: 查询优化器
SQL语句在查询之前会使用查询优化器对查询进行优化。
它使用的是“选取-投影-联接”策略进行查询, 用一个例子就可以理解: select uid,name from user where gender = 1;
1.这个select 查询先根据where 语句进行选取,而不是先将表全部查询出来以后再进行过滤
2.这个select查询先根据uid和name进行属性投影,而不是将属性全部取出以后再进行过滤
3.将这两个查询条件联接起来生成最终查询结果
Cache和Buffer: 查询缓存。
他的主要功能是将客户端提交给MySQL的 select请求的返回结果集 cache 到内存中,与该 query 的一个 hash 值 做一个对应。该 Query 所取数据的基表发生任何数据的变化之后, MySQL 会自动使该 query 的Cache 失效。在读写比例非常高的应用系统中, Query Cache 对性能的提高是非常显著的。当然它对内存的消耗也是非常大的。如果查询缓存有命中的查询结果,查询语句就可以直接去查询缓存中取数据。这个缓存机制是由一系列小缓存组成的。比如表缓存,记录缓存,key缓存,权限缓存等
存储引擎接口:存储引擎是基于表的,而不是数据库
存储引擎接口模块可以说是 MySQL 数据库中最有特色的一点了。目前各种数据库产品中,基本上只有 MySQL 可以实现其底层数据存储引擎的插件式管理。这个模块实际上只是 一个抽象类,但正是因为它成功地将各种数据处理高度抽象化,才成就了今天 MySQL 可插拔存储引擎的特色。
从图还可以看出,MySQL区别于其他数据库的最重要的特点就是其插件式的表存储引擎。MySQL插件式的存储引擎架构提供了一系列标准的管理和服务支持,这些标准与存储引擎本身无关,可能是每个数据库系统本身都必需的,如SQL分析器和优化器等,而存储引擎是底层物理结构的实现,每个存储引擎开发者都可以按照自己的意愿来进行开发。
存储引擎:show engines;
存储引擎是针对表的
MySQL 5.5之后,默认的存储引擎由MyISAM变为InnoDB。
Innodb
Myisam
存储文件
.frm 表定义文件
.ibd 数据文件
.frm 表定义文件
.myd 数据文件
.myi 索引文件
锁
表锁、行锁
表锁
事务
ACID
不支持
CRDU
读、写
读多
count
扫表
专门存储的地方
索引结构
B+ Tree
B+ Tree
MyISAM不支持事务,但是读快,可以根据实际情况对不同的表使用不同的存储引擎,如日志可以使用MyISAM,业务表使用InnoDB
MySQL文件分为日志文件和数据文件
日志文件包含错误日志、二进制日志、查询日志、慢查询日志和InnoDB引擎在线Redo日志、中继日志等。
二进制日志(bin-log):
默认是关闭的,需要通过配置:log-bin=mysql-bin进行开启。其中mysql-bin是binlog日志文件的basename,binlog日志文件的名称:mysql-bin-000001.log
* binlog记录了数据库所有的ddl语句和dml语句,但不包括select语句内容,语句以事件的形式保存,描述了数据的变更顺序,binlog还包括了每个更新语句的执行时间信息,binlog主要作用是用于恢复数据,因此binlog对于灾难恢复和备份恢复来说至关重要。
* 如果是DDL语句,则直接记录到binlog日志,而DML语句,必须通过事务提交才能记录到binlog日志中。
* binlog还用于实现mysql主从复制。
* binlog还用于数据恢复。
慢查询日志(slow query log):
* 默认是关闭的。需要通过设置:slow_query_log=ON进行开启。
* 记录执行时间超过long_query_time秒的所有查询,便于收集查询时间比较长的SQL语句
事务日志:
* 事务日志(InnoDB特有的日志)也叫redo日志。
* 文件名为"ib_logfile0"和“ib_logfile1”,默认存放在表空间所在目录。
* 还有一个日志文件叫undo 日志,默认存储在ib_data目录下。
中继日志:
* 是在主从复制环境中产生的日志。
* 主要作用是为了从机可以从中继日志中获取到主机同步过来的SQL语句,然后执行到从机中。
数据文件
查看MySQL数据文件:SHOW VARIABLES LIKE ‘%datadir%’;
.frm文件:主要存放与表相关的数据信息,主要包括表结构的定义信息.ibd和.ibdata文件:用来存储InnoDB存储引擎的表数据和索引信息.myd文件:主要用来存储使用MyISAM存储引擎的表数据信息。.myi文件:主要用来存储使用MyISAM存储引擎的表数据文件中任何索引的数据树。索引
MYISAM和InnoDB两种存储引擎都是支持b+tree索引
索引的分类* 单列索引:
* 普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。
* 唯一索引:索引列中的值必须是唯一的,但是允许为空值,
* 主键索引:是一种特殊的唯一索引,不允许有空值。
* 组合索引
* 在表中的多个字段组合上创建的索引,只有在查询条件中使用了这些字段的左边字段时,索引才会被使用,使用组合索引时遵循最左前缀集合。
索引的存储结构
MYISAM的索引是存储指向数据的地址;InnoDB的数据是存储在主键索引下面,其他索引中存储的都是主键的地址。
B Tree和B+ Tree的特点与区别:
* 树的高度一般都是在2-4这个高度,树的高度直接影响IO读写的次数。
* 如果是三层树结构---支撑的数据可以达到20G,如果是四层树结构---支撑的数据可以达到几十T
* B Tree和B+ Tree的最大区别在于非叶子节点是否存储数据的问题。B Tree是非叶子节点和叶子节点都会存储数据。而B+ Tree只有叶子节点才会存储数据,而且存储的数据都是在一行上,而且这些数据都是有指针指向的,也就是由顺序的。
非聚集索引(MYISAM):
* 叶子节点只会存储数据行的指针,简单来说数据和索引不在一起,就是非聚集索引。
* 主键索引和辅助索引都会存储指针的值
聚集索引(InnoDB):
* 主键索引(聚集索引)的叶子节点会存储数据行,也就是说数据和索引是在一起,这就是聚集索引。
* 辅助索引只会存储主键值
* 如果没有没有主键,则使用唯一索引建立聚集索引;如果没有唯一索引,MySQL会按照一定规则创建聚集索引。
使用索引时的注意事项:
尽量创建组合索引(组合索引其实会默认按照最左前缀原则帮我们创建多组索引)组合索引(id,name,sex)索引最左前缀原则索引覆盖:要查询的列,也要使用索引覆盖住