索引的定义 MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构.可以得出索引的本质就是数据结构 你可以简单理解为"排序好的快速查找数据结构" 在数据之外,数据库还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构的基础上实现高级查找算法,这种数据结构就是索引 一般来说索引本身很大,不适合全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上 我们平常所说的索引,如果没有特别指明,都是指B树(多路搜索树,并不一定是二叉的)结构组织的索引,其中聚集索引,次要索引,覆盖索引 复合索引,前缀索引,唯一索引默认都是使用B+树索引,统称索引.当然,除了B+树这种类型的索引之外,还有哈稀索引(hash index)等优势 类似大学图书馆建书目录索引,提高数据检索的效率,降低数据库的IO成本 通过索引列对数据进行排序,降低数据排序成本,降低了CPU的消耗 可以加速表和表之间的连接劣势 实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引也是要占内存空间的 虽然索引大大提高了查询速度,同时都会降低更新表的速度,如对表进行insert,update和delete 因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引的字段,都会调整因为更新所带来的键值变化后的索引信息 索引只是高效的一个因素,如果你的MySQL有大数据量的表,就需要花时间研究建立最优秀的索引,或优化查询方法索引的分类 单值索引:即一个索引只包含单个列,一个表不\可以有多个单列索引 唯一索引:索引列的值必须唯一,但允许有控制,例如手机号,银行卡号等值必须是唯一 复合索引:即一个索引包含多个列,例如手机号和银行卡号一起,如果一个表中的数据在查询时有多个字段总是同时出现则这些字段就可以作为复合索引基本语法 创建:create [unique] index indexName on tbname(columnname(lenght)) 更改:alter table tbname add [unique] index [indexName] on (columnname(lenght)) 更改:alter table tbname add [unique] fulltext [indexName] on (columnname(lenght))#指定索引为fulltext,用于全文索引 删除:drop index [indexName] on tbname; 查看:show index from tbname\G;索引结构 BTree索引 Hash索引 full-text全文索引 R-Tree索引
哪种情况需要创建索引 1.主键自动建立唯一索引 2.频繁作为查询条件的字段应该创建索引 3.查询中与其他表关联的字段,外键关系建立索引 4.频繁更新的字段不适合创建索引,因为每次更新不单单是更新数据还会更新索引 5.Where条件里用得到的字段适合创建索引 6.单键/组合索引的选择问题,在高并发下倾向创建组合索引 7.查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度 8.查询中统计或者分组字段哪种情况不需要建索引 1.表记录太少(一般生产环境下,三百万条记录性能就可能开始下降,官方说的是五百万到八百万) 2.经常增删改的表 3.某个数据列的值包含许多重复的内容
导致索引失效的案例 1.建什么索引用什么索引,顺序也最好保持一致 2.最佳左前缀索引名称命名(如字段name,age,city,则索引命名应该是nameAgeCity或者xxx_nameAgeCity,顺序很重要) 3.不在索引列上做任何操作(计算,函数,or,类型转换),会导致索引失效而转向全表扫描 4.存储引擎不能使用索引中范围条件右边的列(如name='lin' and age>25 and city='qingdao',则age后面的索引会实效) 5.尽量使用覆盖索引(只访问索引的查询(索引列和要查询的列一致)),减少select * 6.MySQL在使用不等于(!=或者<>)的时候无法使用索引会导致全表扫描 7.is null,is not null 也无法使用索引 8.like以通配符在这('