1. Mysql 体系结构和存储引擎
mysql 是单进程多线程架构,支持插件式的表存储引擎,存储引擎基于表而不是数据库。
1.3 MySQL存储引擎:
InnoDB
支持事务,面向在线事务处理(OLTP)应用,特点是行锁设计,支持外键,非锁定读。 使用多版本并发控制(MVCC)获得高并发性。 表中数据的存储,采用聚集(clustered)方式,因此每张表的存储都是按照主键的顺序存放。
MyISAM
不支持事务、表锁设计,支持全文索引,主要面向OLAP数据库应用。
NDB
集群存储引擎,join操作在数据库层完成,不是在存储引擎层,复杂连接需要巨大网络开销
Memory
存放内存中,适用于临时表,默认是哈希索引
Archive
只支持 insert select 操作,告诉插入和压缩功能
2. InnoDB 存储引擎
多线程模型:
- Master Thread: 主要负责将缓冲池中的数据异步刷新到磁盘,保证数据的一致性
- IO Thread: InnoDB中大量使用了AIO(Async IO)处理IO请求
- Purge Thread: 回收已经使用并分配的 undo 页
- Page Cleaner Thread: 将之前版本中脏页的刷新操作都放入到单独的线程中来完成,减轻master工作压力
(关于linux 内存管理:https://blog.csdn.net/gatieme/article/details/52384636 ,内存被细分为多个页面帧, 页面是最基本的页面分配的单位 )
内存:
- 缓冲池:缓冲池技术提升性能(协调磁盘与cpu速度鸿沟) innodb_buffer_pool_size,新版可以有多个缓冲池
- LRU List, Free List, Flush List: 管理内存区
Checkpoint 技术: 为了避免数据丢失问题,当前事务数据库系统普遍使用了Write Ahead Log 策略,当事务提交时,先写重做日志,再修改页。 当由于发生宕机导致数据丢失时,通过重做日志完成数据恢复。 (Durability持久性) Checkpoint 技术解决了几个问题:
- 缩短数据库恢复时间
- 缓冲池不够用时,将脏页刷新到磁盘
- 重做日志不可用时,刷新脏页
当数据库宕机,数据库不需要重做所有日志,因为checkpoint 之前的页都已经刷新回磁盘,只需要对 checkpoint 后的重做日志进行恢复,这样就大大缩减了恢复时间。
InnoDB 通过LSN(Log Sequence Number) 来标记版本。 InnoDB 中两种Checkpoint:
- Sharp Checkpoint: 发生在数据库关闭时将所有的脏页都刷新回磁盘,默认
- Fuzzy Checkpoint: 只刷新一部分
Maste Thread 实现可以参考书中的示例伪代码
InnoDB 关键特性:
- 插入缓冲(Insert Buffer)
- 两次写(Double Write)
- 自适应哈希索引(Adaptive Hash Index)
- 异步IO(Async IO)
- 刷新邻接页(Flush Neighbor Page)
延伸阅读,主要是了解B树: B-Tree: 多叉平衡查找树
- https://zh.wikipedia.org/wiki/B%E6%A0%91
- https://blog.csdn.net/v_JULY_v/article/details/6530142