编辑推荐
“只要你不敢以MySQL专家自诩,又岂敢错过这本神书?”
“一言以蔽之,写得好,编排得好,需要参考时容易到爆!”
“我可是从头到尾看了一遍上一版,可还是毫不犹豫拿起了这本《高性能MySQL(第3版)》,而且看完后一点都不后悔……”
◎ 学习MySQL新特性,包括存储引擎、分区数据库、触发器和视图
◎ 实现复制的改进、高可用和集
◎ 获得在云端运行MySQL的高性能
◎ 优化高级查询特性,如全文索引
◎ 从现代的多核CPU和固态硬盘中获益
◎ 探索备份和恢复的策略,包括新的在线备份工具
内容简介
《高性能MySQL(第3版)》是MySQL 领域的经典之作,拥有广泛的影响力。第3 版更新了大量的内容,不但涵盖了MySQL5.5版本的新特性,也讲述了关于固态盘、高可扩展性设计和云计算环境下的数据库相关的新内容,原有的基准测试和性能优化部分也做了大量的扩展和补充。全书共分为16章和6 个附录,内容涵盖MySQL架构和历史,基准测试和性能剖析,数据库软硬件性能优化,复制、备份和恢复,高可用与高可扩展性,以及云端的MySQL和MySQL相关工具等方面的内容。每一章都是相对独立的主题,读者可以有选择性地单独阅读。 《高性能MySQL(第3版)》不但适合数据库管理员(DBA)阅读,也适合开发人员参考学习。不管是数据库新手还是专家,相信都能从本书有所收获。
作者简介
BaronSchwartz是一位软件工程师,居住在弗吉尼亚州的Charlottesville,网络常用名是Xaprb,这是按照QWERTY键盘的顺序在Dvorak键盘上打出来的名字。在不忙于解决有趣的编程挑战时,Baron会和他的妻子Lynn以及小狗Carbon一起享受闲暇的时光。他有一个软件工程方面的博客。 PeterZaitsev曾经是MySQLAB公司高性能组的经理,目前在运作mysqlperformanceblog.com网站。他擅长于帮助那些每天有数以百万计访问量的网站的管理员解决问题,这些网站通常需要几百台机器来处理TB级的数据。他常常为了解决一个问题而不停地升级硬件和软件(比如查询优化)。Peter还经常在各种会议上演讲。 VadimTkachenko曾经是MySQLAB公司的性能工程师。作为一名在多线程编程和同步方面的专家,他的主要工作是基准测试、性能剖析,以及找出系统的性能瓶颈。他还在性能监控和调优方面做了一些工作,使得MySQL在多核机器上有更好的可扩展性。 译者简介 宁海元有超过十年的数据库管理经验,从最初的SQLServer2000到Oracle再到MySQL,擅长数据库高可用架构、性能优化和故障诊断。2007年加入*,带领*DBA团队完成了数据库的垂直拆分、水平拆分,迁移到MySQL体系等主要工作,为*业务的快速增长提供支撑。目前专注于无线数据领域。网络常用名NinGoo, 周振兴毕业于北京师范大学数学系,2009年加入*数据库团队,负责MySQL运维管理工作,有丰富的MySQL性能优化、Troubleshooting经验,对MySQL主要模块的实现和原理有深入的研究,经历了*MySQL实例从30到3000的发展,对系统架构、高可用环境规划都有深入理解。 彭立勋2010年大学毕业后加入********运维部。作为一名MySQLDBA,在运维MySQL的过程中对MySQL和InnoDB的一些功能和缺陷进行了补充,编写了多主复制和数据闪回等补丁。目前在阿里集团核心系统研发部数据库组,专注于MySQL数据库相关的开发工作。后来一些补丁被MySQL之父Mony看中,多主复制、线程内存监控等补丁被合并到了MariaDB10.0版本,本人也因此成为MariaDB提交组(Maria-captains)成员。 翟卫祥毕业于武汉大学,研究生阶段从事数据库相关研究。毕业后就职数据库技术团队至今,主要负责阿里内部MySQL代码分支维护,包括MySQLBugFix及新特性开发。对MySQL内核有一定的研究。 刘辉2008年毕业于西安电子科技大学计算机系,硕士学位。2011年加入数据库技术团队,花名希羽,MySQL内核开发工程师。
内页插图
精彩书评
每一章均别具匠心,力求理论与实践的精确平衡,且布满无价之宝,有时甚至越过MySQL舞台,完全适用于任一数据库。其中第二章“MySQL基准测试”及第3章“服务器性能剖析”是非常必要的基础,推荐提前阅读。
纵观全书,作者推荐的工具、实战案例及经验过的诊断技术,可大大提高你的性能急救技能,以及加深对MySQL本质的理解。然而,本书值得推崇的,还是其在探讨性能的同时,将数据库结构的客观方面纳入思考,这是其他书里难以看到的。此外,增补的MySQL高可用性及云特性,也让人更加欣喜。
相信不少人会因为找不到某些书中引用的资料或工具而苦恼,但从本书中按图索骥,会发现这些东西正是作者对MySQL社区的杰出贡献,也就是说,你可以直接用这些工具!
很多年前我就是这本书的“粉丝”了,这是一本伟大的书,第三版尤其如此。这些世界*的专家不仅仅分享他们的专业知识,也花了很多时间来更新和添加新的章节,且都是高品质的内容。本书有大量关于如何获得MySQL高性能的细节信息,并且关注的是提升性能的过程,而不仅仅是描述事实结果和琐碎的细枝末节。这本书将告诉读者如何将事情做得更好,不管MySQL在不同版本中的行为有多么大的改变。
毫无疑问,本书的作者是有资格来写这么一本书的人,他们经验丰富,有合理的方法,关注效率,并且精益求精。说到经验丰富,本书的作者已经在MySQL性能领域工作多年,从MySQL还没有什么可扩展性和可测量性的时代,直到现在这些方面已经有了长足的进步。而说到合理的方法,他们简直把这件事情当成了科学,首先定义需要解决的问题,然后通过合理的猜测和精确的测量来解决问题。
我对作者在效率方面的关注尤其印象深刻。作为顾问,他们时间宝贵。客户是按照他们的时间付费的,所以都希望能更快地解决问题。所以本书作者定义了一整套的流程,开发了很多的工具,让事情变得正确和高效。在本书中,作者详细描述了这些流程,并且发布了工具的源代码。
最后,本书作者在工作上一直精益求精。比如从吞吐量到响应时间的关注,致力于了解MySQL在新硬件上的性能表现,追求新的技能如排队理论对性能的影响,等等。我相信本书预示了MySQL的光明前景。MySQL已经支持高要求的工作负载,本书作者也在努力提升MySQL社区内对性能的认识。同时,他们还直接为性能提升做出了贡献,包括XtraDB和XtraBackup。一直以来我从他们身上学到了不少东西,也希望读者多花点时间读读本书,一定会同样有所收益。
——MarkCallaghan,Facebook软件工程师
目录
推荐序前言
第1章 MySQL 架构与历史
1.1 MySQL 逻辑架构1.1.1 连接管理与安全性1.1.2 优化与执行1.2 并发控制1.2.1 读写锁1.2.2 锁粒度1.3 事务1.3.1 隔离级别1.3.2 死锁1.3.3 事务日志1.3.4 MySQL 中的事务1.4 多版本并发控制1.5 MySQL 的存储引擎1.5.1 InnoDB 存储引擎1.5.2 MyISAM 存储引擎1.5.3 MySQL 内建的其他存储引擎1.5.4 第三方存储引擎1.5.5 选择合适的引擎1.5.6 转换表的引擎1.6 MySQL 时间线(Timeline)1.7 MySQL 的开发模式1.8 总结第2章 MySQL 基准测试2.1 为什么需要基准测试2.2 基准测试的策略2.2.1 测试何种指标2.3 基准测试方法2.3.1 设计和规划基准测试2.3.2 基准测试应该运行多长时间2.3.3 获取系统性能和状态2.3.4 获得准确的测试结果2.3.5 运行基准测试并分析结果2.3.6 绘图的重要性2.4 基准测试工具2.4.1 集成式测试工具2.4.2 单组件式测试工具2.5 基准测试案例2.5.1 http_load2.5.2 MySQL 基准测试套件 .2.5.3 sysbench2.5.4 数据库测试套件中的dbt2 TPC-C 测试2.5.5 Percona 的TPCC-MySQL 测试工具2.6 总结第3章 服务器性能剖析3.1 性能优化简介3.1.1 通过性能剖析进行优化3.1.2 理解性能剖析3.2 对应用程序进行性能剖析3.2.1 测量PHP 应用程序3.3 剖析MySQL 查询3.3.1 剖析服务器负载3.3.2 剖析单条查询3.3.3 使用性能剖析3.4 诊断间歇性问题3.4.1 单条查询问题还是服务器问题3.4.2 捕获诊断数据3.4.3 一个诊断案例3.5 其他剖析工具3.5.1 使用USER_STATISTICS 表3.5.2 使用strace3.6 总结第4章 Schema 与数据类型优化4.1 选择优化的数据类型4.1.1 整数类型4.1.2 实数类型4.1.3 字符串类型4.1.4 日期和时间类型4.1.5 位数据类型4.1.6 选择标识符(identifier)4.1.7 特殊类型数据4.2 MySQL schema 设计中的陷阱4.3 范式和反范式4.3.1 范式的优点和缺点4.3.2 反范式的优点和缺点 .4.3.3 混用范式化和反范式化4.4 缓存表和汇总表4.4.1 物化视图4.4.2 计数器表4.5 加快ALTER TABLE 操作的速度4.5.1 只修改.frm 文件4.5.2 快速创建MyISAM 索引4.6 总结第5章 创建高性能的索引5.1 索引基础5.1.1 索引的类型5.2 索引的优点5.3 高性能的索引策略5.3.1 独立的列5.3.2 前缀索引和索引选择性5.3.3 多列索引5.3.4 选择合适的索引列顺序5.3.5 聚簇索引5.3.6 覆盖索引5.3.7 使用索引扫描来做排序5.3.8 压缩(前缀压缩)索引5.3.9 冗余和重复索引5.3.10 未使用的索引5.3.11 索引和锁5.4 索引案例学习5.4.1 支持多种过滤条件5.4.2 避免多个范围条件5.4.3 优化排序5.5 维护索引和表5.5.1 找到并修复损坏的表 .5.5.2 更新索引统计信息5.5.3 减少索引和数据的碎片5.6 总结第6章 查询性能优化6.1 为什么查询速度会慢6.2 慢查询基础:优化数据访问6.2.1 是否向服务器请求了不需要的数据6.2.2 MySQL 是否在扫描额外的记录6.3 重构查询的方式6.3.1 一个复杂查询还是多个简单查询6.3.2 切分查询6.3.3 分解关联查询6.4 查询执行的基础6.4.1 MySQL 客户端/ 服务器通信协议6.4.2 查询缓存6.4.3 查询优化处理6.4.4 查询执行引擎6.4.5 返回结果给客户端6.5 MySQL 查询优化器的局限性6.5.1 关联子查询6.5.2 UNION 的限制6.5.3 索引合并优化6.5.4 等值传递6.5.5 并行执行6.5.6 哈希关联6.5.7 松散索引扫描6.5.8 值和最小值优化 .6.5.9 在同一个表上查询和更新6.6 查询优化器的提示(hint)6.7 优化特定类型的查询6.7.1 优化COUNT() 查询6.7.2 优化关联查询6.7.3 优化子查询6.7.4 优化GROUP BY 和DISTINCT6.7.5 优化LIMIT 分页6.7.6 优化SQL_CALC_FOUND_ROWS6.7.7 优化UNION 查询6.7.8 静态查询分析6.7.9 使用用户自定义变量 .6.8 案例学习6.8.1 使用MySQL 构建一个队列表6.8.2 计算两点之间的距离 .6.8.3 使用用户自定义函数 .6.9 总结第7章 MySQL 高级特性7.1 分区表7.1.1 分区表的原理7.1.2 分区表的类型7.1.3 如何使用分区表7.1.4 什么情况下会出问题 .7.1.5 查询优化7.1.6 合并表7.2 视图7.2.1 可更新视图7.2.2 视图对性能的影响7.2.3 视图的限制7.3 外键约束7.4 在MySQL 内部存储代码7.4.1 存储过程和函数7.4.2 触发器7.4.3 事件7.4.4 在存储程序中保留注释7.5 游标7.6 绑定变量7.6.1 绑定变量的优化7.6.2 SQL 接口的绑定变量7.6.3 绑定变量的限制7.7 用户自定义函数7.8 插件7.9 字符集和校对7.9.1 MySQL 如何使用字符集7.9.2 选择字符集和校对规则7.9.3 字符集和校对规则如何影响查询7.10 全文索引7.10.1 自然语言的全文索引7.10.2 布尔全文索引7.10.3 MySQL5.1 中全文索引的变化7.10.4 全文索引的限制和替代方案7.10.5 全文索引的配置和优化7.11 分布式(XA)事务7.11.1 内部XA 事务7.11.2 外部XA 事务7.12 查询缓存7.12.1 MySQL 如何判断缓存命中7.12.2 查询缓存如何使用内存7.12.3 什么情况下查询缓存能发挥作用7.12.4 如何配置和维护查询缓存7.12.5 InnoDB 和查询缓存 .7.12.6 通用查询缓存优化7.12.7 查询缓存的替代方案7.13 总结第8章 优化服务器设置8.1 MySQL 配置的工作原理8.1.1 语法、作用域和动态性8.1.2 设置变量的副作用8.1.3 入门8.1.4 通过基准测试迭代优化8.2 什么不该做8.3 创建MySQL 配置文件8.3.1 检查MySQL 服务器状态变量8.4 配置内存使用8.4.1 MySQL 可以使用多少内存?8.4.2 每个连接需要的内存 .8.4.3 为操作系统保留内存 .8.4.4 为缓存分配内存8.4.5 InnoDB 缓冲池(Buffer Pool)8.4.6 MyISAM 键缓存(Key Caches)8.4.7 线程缓存8.4.8 表缓存(Table Cache)8.4.9 InnoDB 数据字典(Data Dictionary)8.5 配置MySQL 的I/O 行为8.5.1 InnoDB I/O 配置8.5.2 MyISAM 的I/O 配置 .8.6 配置MySQL 并发 .8.6.1 InnoDB 并发配置8.6.2 MyISAM 并发配置8.7 基于工作负载的配置8.7.1 优化BLOB 和TEXT 的场景8.7.2 优化排序(Filesorts).8.8 完成基本配置8.9 安全和稳定的设置8.10 高级InnoDB 设置8.11 总结第9章 操作系统和硬件优化9.1 什么限制了MySQL 的性能9.2 如何为MySQL 选择CPU9.2.1 哪个更好:更快的CPU 还是更多的CPU9.2.2 CPU 架构9.2.3 扩展到多个CPU 和核心9.3 平衡内存和磁盘资源9.3.1 随机I/O 和顺序I/O9.3.2 缓存,读和写9.3.3 工作集是什么9.3.4 找到有效的内存/ 磁盘比例9.3.5 选择硬盘9.4 固态存储9.4.1 闪存概述9.4.2 闪存技术9.4.3 闪存的基准测试9.4.4 固态硬盘驱动器(SSD)9.4.5 PCIe 存储设备9.4.6 其他类型的固态存储 .9.4.7 什么时候应该使用闪存9.4.8 使用Flashcache9.4.9 优化固态存储上的MySQL9.5 为备库选择硬件9.6 RAID 性能优化9.6.1 RAID 的故障转移、恢复和镜像9.6.2 平衡硬件RAID 和软件RAID9.6.3 RAID 配置和缓存9.7 SAN 和NAS9.7.1 SAN 基准测试9.7.2 使用基于NFS 或SMB 的SAN9.7.3 MySQL 在SAN 上的性能9.7.4 应该用SAN 吗9.8 使用多磁盘卷9.9 网络配置9.10 选择操作系统9.11 选择文件系统9.12 选择磁盘队列调度策略9.13 线程9.14 内存交换区9.15 操作系统状态9.15.1 如何阅读vmstat 的输出9.15.2 如何阅读iostat 的输出9.15.3 其他有用的工具9.15.4 CPU 密集型的机器9.15.5 I/O 密集型的机器9.15.6 发生内存交换的机器9.15.7 空闲的机器9.16 总结第10章 复制10.1 复制概述10.1.1 复制解决的问题10.1.2 复制如何工作10.2 配置复制10.2.1 创建复制账号10.2.2 配置主库和备库10.2.3 启动复制10.2.4 从另一个服务器开始复制10.2.5 推荐的复制配置10.3 复制的原理10.3.1 基于语句的复制10.3.2 基于行的复制10.3.3 基于行或基于语句:哪种更优10.3.4 复制文件10.3.5 发送复制事件到其他备库10.3.6 复制过滤器10.4 复制拓扑10.4.1 一主库多备库10.4.2 主动- 主动模式下的主- 主复制10.4.3 主动- 被动模式下的主- 主复制10.4.4 拥有备库的主- 主结构10.4.5 环形复制10.4.6 主库、分发主库以及备库10.4.7 树或金字塔形10.4.8 定制的复制方案10.5 复制和容量规划10.5.1 为什么复制无法扩展写操作10.5.2 备库什么时候开始延迟10.5.3 规划冗余容量10.6 复制管理和维护10.6.1 监控复制10.6.2 测量备库延迟10.6.3 确定主备是否一致10.6.4 从主库重新同步备库10.6.5 改变主库10.6.6 在一个主- 主配置中交换角色10.7 复制的问题和解决方案10.7.1 数据损坏或丢失的错误10.7.2 使用非事务型表10.7.3 混合事务型和非事务型表10.7.4 不确定语句10.7.5 主库和备库使用不同的存储引擎10.7.6 备库发生数据改变10.7.7 不的服务器ID .10.7.8 未定义的服务器ID .10.7.9 对未复制数据的依赖性10.7.10 丢失的临时表10.7.11 不复制所有的更新 .10.7.12 InnoDB 加锁读引起的锁争用10.7.13 在主- 主复制结构中写入两台主库10.7.14 过大的复制延迟10.7.15 来自主库的过大的包10.7.16 受限制的复制带宽 .10.7.17 磁盘空间不足10.7.18 复制的局限性10.8 复制有多快10.9 MySQL 复制的高级特性10.10 其他复制技术10.11 总结第11章 可扩展的MySQL11.1 什么是可扩展性11.1.1 正式的可扩展性定义11.2 扩展MySQL11.2.1 规划可扩展性11.2.2 为扩展赢得时间11.2.3 向上扩展11.2.4 向外扩展11.2.5 通过多实例扩展11.2.6 通过集扩展11.2.7 向内扩展11.3 负载均衡11.3.1 直接连接11.3.2 引入中间件11.3.3 一主多备间的负载均衡11.4 总结第12章 高可用性12.1 什么是高可用性12.2 导致宕机的原因12.3 如何实现高可用性12.3.1 提升平均失效时间(MTBF)12.3.2 降低平均恢复时间(MTTR)12.4 避免单点失效12.4.1 共享存储或磁盘复制12.4.2 MySQL 同步复制12.4.3 基于复制的冗余12.5 故障转移和故障恢复12.5.1 提升备库或切换角色12.5.2 虚拟IP 地址或IP 接管12.5.3 中间件解决方案12.5.4 在应用中处理故障转移12.6 总结第13章 云端的MySQL13.1 云的优点、缺点和相关误解13.2 MySQL 在云端的经济价值13.3 云中的MySQL 的可扩展性和高可用性13.4 四种基础资源13.5 MySQL 在云主机上的性能13.5.1 在云端的MySQL 基准测试13.6 MySQL 数据库即服务(DBaaS)13.6.1 Amazon RDS13.6.2 其他DBaaS 解决方案13.7 总结第14章 应用层优化14.1 常见问题14.2 Web 服务器问题14.2.1 寻找并发度14.3 缓存14.3.1 应用层以下的缓存14.3.2 应用层缓存14.3.3 缓存控制策略14.3.4 缓存对象分层14.3.5 预生成内容14.3.6 作为基础组件的缓存14.3.7 使用HandlerSocket 和memcached14.4 拓展MySQL14.5 MySQL 的替代品14.6 总结第15章 备份与恢复15.1 为什么要备份15.2 定义恢复需求15.3 设计MySQL 备份方案15.3.1 在线备份还是离线备份15.3.2 逻辑备份还是物理备份15.3.3 备份什么15.3.4 存储引擎和一致性15.4 管理和备份二进制日志15.4.1 二进制日志格式15.4.2 安全地清除老的二进制日志15.5 备份数据15.5.1 生成逻辑备份15.5.2 文件系统快照15.6 从备份中恢复15.6.1 恢复物理备份15.6.2 还原逻辑备份15.6.3 基于时间点的恢复15.6.4 更高级的恢复技术15.6.5 InnoDB 崩溃恢复15.7 备份和恢复工具15.7.1 MySQL Enterprise Backup15.7.2 Percona XtraBackup .15.7.3 mylvmbackup15.7.4 Zmanda Recovery Manager15.7.5 mydumper15.7.6 mysqldump.15.8 备份脚本化15.9 总结第16章 MySQL 用户工具16.1 接口工具16.2 命令行工具集16.3 SQL 实用集16.4 监测工具16.4.1 开源的监控工具16.4.2 商业监控系统16.4.3 Innotop 的命令行监控16.5 总结附录A MySQL 分支与变种附录B MySQL 服务器状态附录C 大文件传输附录D EXPLAIN附录E 锁的调试附录F 在MySQL 上使用Sphinx索引
收起全部↑
精彩书摘
第一个趋势,采用了InnoDB plugin的版本,在高并发的时候性能明显更好,可以说InnoDB plugin的扩展性更好。这是可以预期的结果,旧的版本在高并发时确实存在问题。第二个趋势,新的版本在单线程的时候性能比旧版本更差。一开始可能无法理解为什么会这样,仔细想想就能明白,这是一个非常简单的只读测试。新版本的SQL语法更复杂,针对复杂查询增加了很多特性和改进,这对于简单查询可能带来了更多的开销。旧版本的代码简单,对于简单的查询反而会更有利。原计划做一个更复杂的不同并发条件下的读写混合场景的测试(类似TPC—C),但要在不同版本间做到可比较基本是不可能的。一般来说,新版本在复杂场景时性能有更多的优化,尤其是高并发和大数据集的情况下。 那么该如何选择版本呢?这更多地取决于业务需求而不是技术需求。理想情况下当然是版本越新越好,当然也可以选择等到第一个bug修复版本以后再采用新的大版本。如果应用还没有上线,也可以采用即将发布的新版本,以尽可能地延迟应用上线后的升级操作。 1.7 MySQL的开发模式 MySQL的开发过程和发布模型在不同的阶段有很大的变化,但目前已经基本稳定下来。在Oracle定期发布的新里程碑开发版本中,会包含即将在下一个GA版本发布的新特性。这样做是为了测试和获得反馈,请不要在生产环境使用此版本,虽然Oracle宣称每个里程碑版本的质量都是可靠的,并随时可以正式发布(到目前为止也没有任何理由去推翻这个说法)。Oracle也会定期发布实验室预览版,主要包含一些特定的需要评估的特性,这些特性并不保证会在下一个正式版本中包括进去。最终,Oracle会将稳定的特性打包发布一个新的GA版本。 MySQL依然遵循GPL开源协议,全部的源代码(除了一些商业版本的插件)都会开放给社区。Oracle似乎也理解,为社区和付费用户提供不同的版本并非明智之举。MySQLAB曾经尝试过不同版本的策略,结果导致付费用户变成了“睁眼瞎”,无法从社区的测试和反馈中获得好处。不同版本的策略并不受企业用户的欢迎,所以后来被Sun废除了。现在Oracle为付费用户单独提供了一些服务器插件,而MySQL本身还是遵循开源模式。尽管对于私有的服务器插件的发布有一些抱怨,但这只是少数的声音,并且慢慢地在平息。 ……
查看全部↓
前言/序言
我们写这本书不仅仅是为了满足MySQL 应用开发者的需求,也是为了满足MySQL 数据库管理员的需要。我们假定读者已经有了一定的MySQL 基础。我们还假定读者对于系统管理、网络和类Unix 的操作系统都有一些了解。 本书的第二版为读者提供了大量的信息,但没有一本书是可以涵盖一个主题的所有方面的。在第二版和第三版之间的这段时间里,我们记录了数以千计有趣的问题,其中有些是我们解决的,也有一些是我们观察到其他人解决的。当我们在规划第三版的时候发现,如果要把这些主题完全覆盖,可能三千页到五千页的篇幅都还不够,这样本书的完成就遥遥无期了。在反思这个问题后,我们意识到第二版强调的广泛的覆盖度事实上有其自身的限制,从某种意义上来说也没有引导读者如何按照MySQL 的方式来思考问题。 所以第三版和第二版的关注点有很大的不同。我们虽然还是会包含很多的信息,并且会强调同样的诸如可靠性和正确性的目标,但我们也会在本书中尝试更深入的讨论:我们会指出MySQL 为什么会这样做,而不是MySQL 做了什么。我们会使用更多的演示和案例学习来将上述原则落地。通过这样的方式,我们希望能够尝试回到下面这样的问题:“给出MySQL 的内部结构和操作,对于实际应用能带来什么帮助?为什么能有这样的帮助?如何让MySQL 适合(或者不适合)特定的需求?” 最后,我们希望关于MySQL 内部原理的知识能够帮助大家解决本书没有覆盖到的一些情况。我们更希望读者能培养发现新问题的洞察力,能学习和实践合理的方式来设计、维护和诊断基于MySQL 的系统。 本书是如何组织的 本书涵盖了许多复杂的主题。在这里,我们将解释一下是如何将这些主题有序地组织在一起的,以便于阅读和学习。 概述 第1 章是非常基础的一章,在更深入地学习之前建议先熟悉一下这部分内容。在有效地使用MySQL 之前应当理解它是如何组织的。本章解释了MySQL 的架构及其存储引擎的关键设计。如果读者还不太熟悉关系数据库和事务的基础知识,本章也可以带来一点帮助。如果之前已经对其他关系数据库如Oracle 比较熟悉,本章也可以帮助读者了解MySQL 的入门知识。本章还包括了一点MySQL 的历史背景:MySQL 随着时间的演进、最近的公司所有权更替,以及我们认为比较重要的内容。 打造坚实的基础 本书前几章的内容在今后使用MySQL 的过程中可能会被不断地引用到,它们是非常基础的内容。 第2章讨论了基准测试的基础,例如服务器可以处理的工作负载的类型、处理特定任务的速度等。基准测试是一项至关重要的技能,可用于评估服务器在不同负载下的表现,但也要明白在什么情况下基准测试不能发挥作用。 第3章介绍了我们常用于故障诊断和服务器性能问题分析的一种面向响应时间的方法。该方法已经被证明可以解决我们曾碰到过的一些极为棘手的问题。当然也可以选择修改我们所使用的方法(实际上我们的方法也是从Cary Millsap 的方法修改而来的),但无论如何,至少不能没有方法胡乱猜测。 从第4章到第6 章,连续介绍了三个关于良好的数据库逻辑设计和物理设计基础的话题。第4 章涵盖了不同数据类型的细节差别以及表设计的原则。第5 章则展开讨论了索引,这是数据库的物理设计。对于索引的深入理解和利用是高效使用MySQL 的基础,相信这一章会经常需要回头翻看。而第6 章则包含了分析MySQL 的查询是如何执行的,以及如何利用查询优化器的话题。该章也包含了大量常见类型查询的例子,演示了MySQL 是如何做好工作的,以及如何改写查询以利用MySQL 的特性。 到此为止,已经覆盖了关于数据库的基础内容:表、索引、数据和查询。第7 章则在MySQL 基础知识之外介绍了MySQL 的高级特性是如何工作的。这章的内容包括分区、存储引擎、触发器,以及字符集。MySQL 中这些特性的实现可能不同于其他数据库,可能之前读者并不清楚这些不同,因此理解它们对于性能可能会带来新的收益。 配置应用程序 接下来的两章讲述的是如何让MySQL、应用程序及硬件一起很好地工作。第8 章介绍了如何配置MySQL,以便更好地利用硬件,达到更好的可靠性和鲁棒性。第9 章解释了如何让操作系统和硬件工作得更好。另外也深入讨论了固态硬盘,为高可扩展性应用发挥更好的性能提供了硬件配置的建议。 上面两章都一定程度地涉及了MySQL 的内部知识。这将会是一个反复出现的主题,附录中也会有相关内容可以学习到MySQL 的内部是如何实现的,理解了这些知识将帮助读者更好地理解某些现象背后的原理。 作为基础设施组件的MySQL MySQL 不是存在于真空中的,而是应用整体的一个环节,因此需要考虑整个应用架构的鲁棒性。下面的章节将告诉我们该如何做到这一点。 第10 章讨论了MySQL 的杀手级特性:能够设置多个服务器从一台主服务器同步数据。不幸的是,复制可能也是MySQL 给很多用户带来困扰的一个特性。但实际上不应该发生这样的情况,本章将告诉你如何让复制运行得更好。 第11章讨论了什么是可扩展性(这和性能不是一回事),应用和系统为什么会无法扩展,该怎么改善扩展性。如果能够正确地处理,MySQL 的可扩展性是足以应付任何需求的。 第12章讲述的是和可扩展性相关但又完全不同的主题:如何保障MySQL 稳定而正确地持续运行。第13 章将告诉你当MySQL 在云计算环境中运行时会有什么不同的事情发生。 第14章解释了什么是全方位的优化(full-stack optimization),就是从前端到后端的整体优化,从用户体验开始直到数据库。 即使是世界上设计最好、可扩展性的架构,如果停电会导致彻底崩溃,无法抵御恶意攻击,解决不了应用的bug 和程序员的错误,以及其他一些灾难场景,那就不是什么好的架构。第15 章讨论了MySQL 数据库各种备份与恢复的场景。这些策略可以帮助读者减少在各种不可抗的硬件失效时的宕机时间,保证在各种灾难下的数据最终可恢复。 其他有用的主题 在本书的最后一章以及附录中,我们探讨了一些无法明确地放到前面章节的内容,以及一些被前面多个章节引用而需要特别注意的主题。 第16章探索了一些可以帮助用户更有效地管理和监控MySQL 服务器的工具,有些是开源的,也有些是商业的。 附录A 介绍了近年来成长迅速的三个主要的非MySQL 官方版本,其中一个是我们公司在维护的产品。知道还有其他什么是可用的选择是有价值的;很多MySQL 难以解决的棘手问题在其他的变种版本中说不定就不是问题了。这三个版本中的两个(Percona Server 和MariaDB)是MySQL 的完全可替换版本,所以尝试使用的成本相对来说是很低的。当然,在这里我们也需要补充一点,Oracle 提供的MySQL 官方版本对于大多数用户来说都能服务得很好。 附录B 演示了如何检查MySQL 服务器。知道如何从服务器获取状态信息是非常重要的;而了解这些状态代表的意义则更加重要。这里将覆盖SHOW INNODB STATUS 的输出结果,因此这里包含了InnoDB 事务存储引擎的深入信息。在这个附录中讨论了很多InnoDB的内部信息。 附录C 演示了如何高效地将大文件从一个地方复制到另外一个地方。如果要管理大量的数据,这种操作是经常都会碰到的。附录D 演示了如何真正地使用并理解EXPLAIN 命令。附录E 演示了如何破除不同查询所请求的锁互相干扰的问题。最后,附录F 介绍了Sphinx,一个基于MySQL 的高性能的全文索引系统。
查看全部↓