• 本文重点介绍了MySQL领域最新的书籍:《MySQL实战》,以及2020左右推出的书籍《MySQL是怎样运行的》。

    《MySQL实战》,作者陈臣

    上个月,MySQL领域又发布了一本新书:《MySQL实战》,作者是陈臣,来自Oracle的工程师,一直活跃在MySQL数据库领域。本文概要的介绍一下,这是一本怎样的书,以及合适哪些人阅读。

    《MySQL实战》这本书更加偏重实践、深入原理相结合的方式介绍MySQL,是非常适合希望能够系统的、更加深入的了解MySQL的开发者或DBA的,例如从事的工作与MySQL数据库密切相关,涉及到MySQL的管理、问题排查、调优选型等。如果做一般性的了解,则可以选择性的阅读其中的章节和内容。

    具体的,如果你从事的工作与需要进行复制配置与管理,那么则可以考虑深入阅读第二章”复制“;如果,你的工作中需要处理Binlog,例如需要进行增量数据解析与获取,则可以精读第三章”深入解析Binlog“。

    相比于官方手册,该书籍在实践方面是更接地气的,这一点上,这本书也是MySQL官方手册的很好补充。

    例如,如果想系统的了解MySQL的备份,本书在第五章系统的介绍各种MySQL的备份方法。涵盖了官方提供的mysqldump,也包括在社区使用非常广泛的mydumper和XtraBackup。如果只是阅读官方手册的话,你可能只会看到关于mysqldump的相关介绍,但在实际的生产使用中,尤其是海量数据备份时,XtraBackup和mydumper都被广泛使用。

    再比如,大表DDL一直是MySQL的一个”硬伤“,在系统运行较长时间后,都会遇到这个令人头疼的问题。本书的第七章就叫”DDL“,单独的介绍了这个online DDL的现状以及常用的解决方案。不仅包含了官方MySQL中的online DDL支持,也涵盖了在社区最为广泛使用的两个工具pt-osc和gh-ost。

    《MySQL是怎样运行的》

    另外,也补充介绍一下2020年的书《MySQL是怎样运行的》。这本书封面上写的作者名字是”小孩子4919“,可见作者更加有个性,这也体现在书籍中。书中,一般会用打比方的方式介绍或者引入数据库的一些概念,然后再较为深入的进行介绍。非常适合新手从零开始学习MySQL,了解他的基本概念,以及对应的原理。在覆盖面上,涵盖了诸如安装配置、字符集、InnoDB、查询优化基础、事务等相关内容,并且都尽可能从非常基础的开始讲起。

    例如,在介绍MySQL启动选项和系统变量的时候,作者使用了手机中的“设置”进行类比;再比如,很少有书籍会介绍“字符集和比较规则”,但这也是一个新手难以理解的地方,本书则使用了独立章节进行介绍,并从计算机底层的二进制存储开始引入结束,可以说是深入浅出。

    当然,作者也做了一些取舍,也就只能放弃非常深入全面的解析每个模块的细枝末节。总得来说,这本书作为打开MySQL大门的引导,是非常合适的。

    是《MySQL实战》,不是《MySQL实战45讲》

    另外,“MySQL实战”在领域还有一个非常有名系列是由丁奇和极客时间推出“MySQL实战45讲”。本书和该系列没有什么直接关系。

    最后

    最后,搜索引擎这么强大,为什么还要读书?相比互联网上零散的信息与知识,书籍则提供完整的、系统的介绍某个领域的知识。而,作为专业领域的从业者,通常都需要了解领域的方方面面,书籍或者手册则是非常好开始。

  • 重要更新

    4月28日,向量数据库平台Pinecone在B轮获得1亿美元融资,估值达到7.5亿美元:参考;而在之前一周,4月22日,开源向量数据库Weaviate也宣布获得5000万美元(约3.5亿元)B轮融资;来自中国的同类产品Milvus也在去年9月获得B+6000万美元的融资。

    更新详情

    AWS
    • Aurora Serverless v1支持PostgreSQL 13,同时支持11到13的原地升级:参考
    • Aurora Serverless v1实例支持转成普通预留实例:参考
    • RDS PostgreSQL支持扩展pgvector,内置了ML模型,可实现向量搜索:参考
    GCP
    • Spanner发布了历史执行计划采样展示功能(Preview): 参考
    • 托管PostgreSQL支持快速迁移功能,可以更快速的将外部数据迁移到GCP:参考
    • 托管SQL Server支持禁用 simultaneous multithreading (SMT) 功能以减少客户所需的授权费用
    • Spanner单表支持的索引个数由32个增长为128个: 参考
    • 保底折扣( Committed use discounts)支持托管Redis和Memcached
    • AlloyDB支持节点状态(CPU使用/负责延迟/uptime)指标数据:参考
    Azure
    • 托管Databricks服务的Serverless SQL功能正式GA:参考

    推荐阅读

  • 不可见索引(Invisible Indexes)MySQL 8.0之后引入的一个重要特性。也可以帮助DBA或者开发者更好的管理和维护数据库的索引。本文将介绍不可见索引的一些常见使用场景和注意事项。

    更加安全的删除没用的索引

    通常,线上运行时间较长的系统,可以通过索引使用统计信息知道哪些索引是从来不被使用的,但依旧会占用磁盘空间,并且会影响系统的写入/更新/删除操作的性能。但是删除索引的操作,有时候也会带来意想不到的系统性能下降,所以,在正式删除之前,可以先将索引修改为不可用,待观察数日后再进行删除,会更加安全。

    性能分析

    有时候在对线上系统进行SQL性能分析时,有时候为了排除某些索引对查询性能影响时,可以暂时的将某些索引暂时标记为不可用,再统计此时的SQL执行时长与性能。然后,再将索引置为可见,再次执行SQL,并统计执行时长与性能。

    通过这样对比,可以非常简单直观、量化的观察到索引对对于具体SQL性能的提升。

    不可见索引依旧会有维护成本

    虽然不可见索引不会被查询优化器使用,但在对数据进行DML操作(如:插入、更新、删除)时仍会被维护。这意味着不可见索引可能会对数据库性能产生一定影响。在使用不可见索引进行性能测试或分析时,请务必权衡这一点。

    不建议长期保留不可见索引

    如果确定某个不可见索引对查询性能没有帮助,建议尽早删除该索引,以节省存储空间和减小维护成本。否则,该索引对系统性能没有起到任何正面作用,反而会占用空间,并影响DML的性能。

    优化器选项可以让不可见索引生效

    在优化器选项(optimizer_switch)中,可以通过打开标记位(use_invisible_indexes),来强制优化器忽略索引的不可见属性,这在增加了SQL性能调试时的灵活性。

    可以通过SELECT/SHOW命令查询优化器选项,也可用通过SET命令变更该选项:

    SET [GLOBAL|SESSION] optimizer_switch='command[,command]...';
    
    SET SESSION optimizer_switch = 'use_invisible_indexes=ON';
  • 重要更新

    根据建行龙集采平台信息,国产数据库-小机下移项目有腾讯云、PingCAP、中兴支持,金额为3436万:参考;国产数据库-贷记卡场景由华为云支持,金额为578万。过去几年和未来很长时间,国产数据库都将在国家基础设施中起着越来越大作用:参考

    云数据库技术社区组织的第一次线下沙龙在杭州成功举行:参考。本次沙龙由玖章算术(NineData)、菜根发展、良仓太炎、ITPub联合主办与支持,以MySQL x ClickHouse为主题,汇聚了字节跳动、阿里云、玖章算术、华为云、腾讯云、百度的6位数据库领域专家,分享了MySQL x ClickHouse 的实践经验和技术趋势。

    更新详情

    阿里云
    • 托管RDS优化了恢复流程,提升用户体验。link
    • PolarDB MySQL 发布条件下推(某些情况下下推到生成表/Derived Table)以提升性能:参考、支持通过并行DDL创建全局二级索引:参考,等数十项优化。
    腾讯云
    • 托管MySQL、MariaDB更多区域支持了外网:参考;备份空间商业化生效:参考
    • 托管SQL Server优化了回档功能:参考
    AWS & Azure
    • AWS 托管RDS的读优化实例在中国地区发布上线。该类型实例在本地提供了高性能的NVMe磁盘,可以让需要使用本地盘读写性能的SQL(例如,大排序、大分组等)运行得更快 link
    • Azure Cosmos DB for PG支持用户自定义密钥的数据加密:参考

    推荐阅读

    • 从 MySQL 到 Oracle 再到全面 TiDB ,云盛海宏的数据库架构实践:参考
    • 国际顶会 ICDE入选|OceanBase死锁检测实现了哪些技术突破:参考
    • 亚马逊云科技与字节跳动 ByteHouse 强强联合,新一代云数仓服务重磅登场!:参考
    • 中国联通数据库实践:CUDB for OceanBase 分布式数据库产品规模应用:参考
  • 重要更新

    最近两篇争锋相对的文章,又在数据库圈子里面引起了一阵涟漪:正方为:《分布式数据库是伪需求吗?》,反方为《2023年了,还有人在谈分布式数据库是不是伪需求》感兴趣的可以看看。正方观点看起来虽然有一些偏激,但是笔者还是支持正方的,也认为狭义的分布式数据库受众是非常有限的,并确实在受到硬件快速发展的挤压,例如,2009年淘宝业务使用的x86数据库服务器内存是16GB+HDD硬盘,而现在云数据库很容易买到500GB内存的实例(如阿里云RDS最大内存可达768G),比较极限的还可以买到4TB内存的实例(可以看看Amazon的”db.x2iedn.32xlarge”规格3)。另外,分布式数据库场景虽然有限,依旧有部分场景,最典型的就是写入密集型,并且是非常关键的一些场景,例如交易事务,需要使用分布式数据库。你站哪边?可以留下你的评论。

    华为云GaussDB荣获中国电子学会“科技进步一等奖”(参考),这代表该数据库一定程度获得了中国官方非常高的认可与评价。

    据悉,MySQL版本管理将会做出重大改变,原来模式下每3年左右发布一个大版本,例如5.1/5.5/5.6/5.7/8.0等,但是事实上,距离8.0在2018年4月GA到现在已经有5年没有大版本了,据悉,新的模式下,将会使用LTS版本和Innovation Release结合形式,LTS版本两年发布一次,并提供5年(Premier)+3年(Extended)支持的方式;Innovation Release则每个季度一个小版本持续迭代,会不断融入更多新功能与特性:参考1、参考25

    MariaDB再遇艰难时刻,现金可能会难以支撑长期运营:参考14。自去年12月,MariaDB以SPAC模式在美上市后,股价也一直走低。这次,MariaDB发出警告说,虽然已经裁员26人,但现金依旧可能不足以支撑公司,并在寻求新的一轮融资。只能说当初Monty自己构建的MySQL太强大了。

    云数据库技术社区的第一次沙龙将在周六下午于杭州海智中心举行,主题为MySQLx ClickHouse,很久没有线下聚会了,感兴趣的可以来现场交流:参考

    更新详情

    阿里云
    • RDS MySQL支持从本地SSD升级到ESSD:参考6
    • RDS MySQL集群版支持存储自动扩容:参考7
    • PolarDB普通集群上新增开启Serverless功能:参考8
    • DTS支持专属集群:参考9
    AWS
    • RDS的事件通知功能新增了实例Tag信息,帮助用户更好的处理实例事件1
    • DynamoDB支持最多可以同时并发恢复50个表2
    • AWS Backup现在支持在EC2上HANA的备份与恢复4
    腾讯云
    • RDS支持PostgreSQL 15
    火山引擎
    • RDS MySQL新增对Terraform的支持:参考11
    • 托管Redis支持多可用区同城容灾:参考10
    其他
    • 号称MongoDB平替的FerretDB发布 1.0:参考12
    • 开源向量数据库Qdrant获750万美元融资,这是在其去年获得220万美元融资之后的再次融资:参考13
    • MariaDB再遇艰难时刻,现金可能会难以支撑长期运营:参考14

    推荐阅读

    引用链接

    关于引用链接的说明:还是偶尔会收到一些认真的开发者来咨询,某某特性有没有更详细的说明链接,于是还是打算尽量给更新的出处。但因为微信公众号不支持任何外链,所以就通过引用链接的方式给出相关内容的引用。另外,有很多链接都非常长,既不美观也不便于复制,于是使用bitly的短链接服务,让操作更简单一些。但是,也注意到bitly服务在国内有时候并不稳定,请看客自己科学跳转。

  • 疫情来到之初,因为对于病毒和传播了解较少,难以感受到疫情在过去的三年如此巨大的改变了大家的生活。而这次ChatGPT变革则是处在自己所在的互联网/基础科技领域,已经感受到了ChatGPT将较为深刻的改变很多内容。

    (more…)