orczhou.com – Page 21

云数据库行业动态@2022-05-27

2022-05-27
重要更新

腾讯云发布自研数据库KeeWiDB，兼容Redis ：名称看起来有点奇怪，但应该是”K-V”的发音吧。能力上包括 (a) 使用了持久化内存，应该是optane，在性能有较好保障的情况下，扩展了内存空间 (b) 提供内存、持久内存、SSD三级自动冷热数据存储，降低Redis使用成本。与阿里云发布的Tair比较类似，Tair更加专注于不同版本解决不同的问题，性能增强型专注于解决更高的性能问题，持久内存型则提供较高的性价比，容量存储型则通过ESSD大大扩展存储空间。如果KeeWiDB提供的“自动分级”，那么还是一定程度上可以简化用户使用。

字节NoSQL团队发布Abase2–新一代高可用 NoSQL 数据库：Abase是字节内部自研高可用 KV 存储，支撑包括推荐、广告、搜索、抖音、西瓜、飞书、游戏等公司内几乎所有业务线的 KV场景。Abase2则新增了资源池化、多租户、多写、CRDT 的软硬件一体化的版本。除了内部使用，也在考虑在火山云上推出

MySQL发布8.0.29版本之后，Xtrabackup备份会失败：由于新版本对redo log的修改不兼容之前的版本，所以会导致使用当前版本的Xtrabackup备份失败。Percona也在准备发布新的版本支持，如果后续生产环境使用8.0.29以及以后的版本，也需要注意对应的Xtrabackup也要升级

阿里云彭祥成为MariaDB的voting board member：MariaDB一直是一个独特的存在，在中国市场的推广一直都不好，还需要更强的策略在中国市场才有更多机会，采访中提到站点镜像、用户组、Kubernetes operator等都是不错的机会点，不过对于改变中国MariaDB市场的现状的作用，还有待观察

SQL Server 2022版进入公测阶段；PostgreSQL 15 Beta 1版本发布

Cloudflare推出数据库服务D1：基于SQLite的云数据库服务，与Cloudflare自身的一系列云服务组成一个面向开发者的小的云产品矩阵。当前处于邀请测试阶段

国家级数据云平台—“人民云”（www.peopleyun.cn）正式上线：基础技术平台由人民数据管理（北京）有限公司与北京世纪互联宽带数据中心有限公司共同构建。定位为大数据“存、管、用”的安全云、自主可控的信创云、国资监管的国资云、开放共赢的行业云。为全国各级各地党政机关、央国企及各行各业的数字化转型提供全生命周期服务及解决方案。

更新详情

[阿里云] RDS PostgreSQL集成Babelfish支持SQL Server数据库的迁移

[阿里云] DTS新增支持Db2 for LUW到PolarDB MySQL和ADB MySQL的数据同步功能

[腾讯云] 云数据库 PostgreSQL支持了透明加密功能、支持了PostgreSQL 14版本

[AWS] ElastiCache/MemoryDB for Redis服务支持JSON格式

[AWS] RDS MySQL/PG/MariaDB/Oracle开始支持db.m6i、db.r6i系列规格实例，在此之前6代实例仅支持基于AWS自研的Graviton实例

[AWS] Redshift新增快照隔离(Snapshot isolation)支持

[Azure] Azure MySQL(FS)托管服务的小版本升级功能GA

[Azure] 发布Azure MySQL(FS)发布80 vCore规格( Business Critical)

[Azure] Azure Synapse Link for SQL公测，帮助用户在Azure SQL Database、SQL Server 2022将数据迁移到Azure Synapse Analytics等环境

[Azure] SQL Database支持Ledger能力，可以通过一定验证过程确保数据不被篡改

[GCP] 支持使用Informatica Data Loader向BigQuery加载数据
深度解析Google云新数据库产品AlloyDB

2022-05-23
在上周的Google I/O大会上，GCP（Google云平台）正式对外发布了数据库AlloyDB（Preview版本）。这里对AlloyDB的架构也做一个较为深入的分析，看看与当前的云原生数据库PolarDB、Aurora有哪些异同。

01 AlloyDB 整体架构图

AlloyDB是GCP上的一个全托管的云数据库服务，当前完全兼容PostgreSQL 14，提供企业级的性能、扩展性与可用性。声称是标准PostgreSQL性能的4倍，AWS同类服务的两倍（应该是指RDS PostgreSQL和Aurora PostgreSQL），如果是分析查询，则可能有100倍的性能加速。另外，在介绍时，还特别提到，价格非常透明，这应该是针对当前AWS数据库大多数都对IOPS独立并按量计费而说的。

根据当前资料，其整体架构如下：

高清大图下载地址：

https://cloud-database-tech.github.io/images/alloydb-arch-with-qr-code.png

02 AlloyDB与Aurora、PolarDB有什么异同

简单来说，其架构与现有的云原生数据库Aurora、PolarDB都非常相似。使用了存储计算分离，分布式存储提供了多节点挂载能力。分布式存储，会带来海量存储能力，以及非常强的IO吞吐能力；多点挂载，大大增强了数据库的读扩展能力，同时因为底层使用同一个存储，所以也不再有数据拷贝和延迟等问题。

在实现上，体现了”the log is the database”，尽可能只传输日志，避免数据块的传输与复制。例如，计算节点与存储节点的不再传输数据块（当然，就多了一个日志应用的过程）。这一点与Aurora类似，但是PolarDB在日志下推上，做得比较少，而是选择将存储以”较为标准”的文件系统提供给计算节点，数据库本身的各个模块还是比较完整的，这带来的好处是，对数据库的侵入要稍微小一些，对于新版本的支持和不同的数据库的支持会更加简单和一致。Aurora和AlloyDB的这种做法，则是将数据库的解构更加彻底，将数据库的日志模块一定程度下沉到存储层。在AlloyDB在实现时，还将这个部分彻底的做了分布式，通过多个不同的日志处理进程（LPS）进行分布式并发处理。

这种日志处理的下推，也让数据库在进行崩溃恢复的时候，相比传统的一体化架构要快非常多，也就让数据库所提供的SLA可以更高。因为没有checkpoint，也应该就没有什么fuzzy或者sharp一说了，后端的LPS进程会持续的将redo apply到本地存储，分布式存储上的数据块的版本总是非常新的。而不用像传统数据库，数据库crash后，所有的没有刷写到磁盘的脏数据块（内存中该数据库已经更新，但是还没有刷写到磁盘）都需要通过redo应用到最新状态，所以，传统数据库在崩溃恢复时总是需要一定的时间，而且内存越大，这个时间可能会越长。

另外，AlloyDB的日志存储使用了较为独立的存储，也就是文中提到了”log storage”或者”log store”。考虑日志与数据块的读写特性都不相同，使用独立的存储在性能优化上，会更加有效。一般来说，日志写入通常是append-only的，而且是”同步”操作，需要非常低的延迟，另外，在AlloyDB的设计中，日志写入后，需要立刻读取并应用到数据块中。只需要将内存中已经更新过的数据块覆盖写入本地存储就可以了。而数据块的处理，通常来说是一个异步的过程（不阻塞数据库的写入），并且会有大量的随机读，这与日志数据的访问有很大的不同。这里的一个猜测是，日志存储和数据块存储可能使用同一套存储架构，但是可能使用面向不同场景的优化和参数，如果有Google的人，希望求证一下。

计算节点使用了”ultra-fast cache”，猜测一下，可能是使用了与PolarDB类似的optane存储作为加速，虽然使用optane卡的场景不同。这也是另一个希望求证的点。

AlloyDB的数据块请求是带有LSN号的，而每个可用区（Zone）内都有完整的数据块，所以，在各个可用区的节点（可能是read replica）总是可以在本地可用区获得最新的数据块。也就是无需像Aurora使用的多数派协议，数据块的读取需要3份（写入四份，4+3>6），当然Aurora也对这里做了很多的优化（例如，通过一个bookkeeping记录写入数据和node的对应关系，尽可能将多数派读取变成一次单节点的读取[参考]）。

AlloyDB下沉到存储的日志处理服务（LPS），也做了彻底的分布式。日志存储在一个底层的相对独立的日志存储中，日志处理服务则是一个分布式的、相对”无状态”的进程，因为也做了存算分离，所以有非常好的扩展性。另外，在日志处理的分片上，AlloyDB通过将底层的数据块分成一个个独立的分片（Shard，应该类似于PolarDB或其他系统中的chunk），每个分片由一个独立的LPS处理，一个LPS可以根据系统压力情况处理一个或多个分片。这样就通过分布式的方式解决了日志应用的问题。并且，这个日志应用是在各个不同的可用区独立运行。

关于数据副本数量的问题：Aurora是3*2的副本设计，每个可用区两个副本，每次写入应该是3个副本，读取可能需要4个副本，这种性能应该比较差，达到的效果是宣传”AZ+1”的容灾能力，也就是一个可用区失败，再加一个副本失败，依旧可以恢复数据。在实现上，Aurora对于底层副本感知是要更强的，并与上层实现结合起来了。但是AlloyDB使用Google底层统一的存储，这里看到的数据分布在三个zone，有三个副本，但实际上，每个zone的数据是存储在一个分布式存储的，这个分布式存储数据的副本数情况，并没有对数据库暴露。这里可以猜测，可能是两个副本或者更多，对于数据库这里IO敏感型的应用，应该比较难使用EC算法去做去重。所以，实际上，一份数据，可能会有超过6份的副本数。

另外，这里看到，Block storage部分是可以通过一些智能化的方式，对数据块进行分级，降低整体的存储成本的，这应该是底层存储的数据分层能力。

03 AlloyDB的写操作

这里通过一个写操作来看看，AlloyDB的整个处理流程。客户端通过TCP连接，连接到主实例，然后将变更SQL发送到主实例。主节点进行SQL解析、并在内容中更新数据和索引页，同时，准备好WAL日志。在事务提交时，则同步地将日志写入低延迟的日志存储，这些日志则会被日志处理进程（LPS）异步的消费并处理。

存储层被分成了三个部分：日志存储、日志处理服务、数据块存储。日志存储本身是顺序写，并对写入延迟要求很高，会直接影响事务处理的性能。AlloyDB专门针对该模式/场景进行了优化，以提供一个高性能的、低延迟的日志存储服务。

多个日志处理服务（LPS）则会根据”Shard”（一组数据库的数据块）机制，对不同的日志进行处理。先从存储层读取需要处理的数据块（随机读），然后将redo日志应用到这些数据块，并回写（持久化）数据块到存储中，并最终删除日志存储中的日志记录。

04 AlloyDB的读操作

读操作有两种情况，一个是从主节点提供服务，一个是从读节点（read replica）提供服务。如果查询所需要的数据都在内存中，那么就和单机的PostgreSQL实例一样，进行SQL解析、执行计划生成、查询执行，并响应用户。为了加速查询处理，AlloyDB在数据库中额外集成了一个”ultra-fast block cache”。

如果，需要的数据块在上面的两级缓存中都不存在，则需要到存储中获取。在把请求发送给存储层的时候，需要附带把LSN（log-sequence number）号也作为请求的一部分，而底层存储则返回满足该LSN对应事务能够看到数据块。

从整体存储层来看，LPS进程也会参与数据块的请求的处理。LPS进程也有自己的缓存，如果请求的数据块在这个缓存中，则会立刻返回给上层节点。如果，这里再次缓存缺失，则再向数据块存储读取数据块并响应请求。

这里，LPS进程需要存储一个”列表”，用于记录日志已经提交，但是，还没有应用到底层的块记录。对于此类数据块的请求，则需要先完成日志应用再返回。虽然，此类情况不应该经常出现，因为如果是一个最近日志没有应用的块，缓存应该不太会把这样的页面清除。

05 其他

虽然是Preview，但已经是目前看到的最具诚意的Preview了：任何用户立刻就可以开通使用，并且给予了非常大的免费额度，具体的，计算节点每月免费不超过1.5万美元、存储节点不超过650美元的资源。

另外，注意到，GCP会说这是一个”fully-managed, PostgreSQL-compatible database”，而不会过多的强调这是一个云原生的数据库系统。对于用户来说，这就是一个具备高性能、高可用以及高可靠的PostgreSQL。至于，是不是Cloud-Native的，Google似乎对于这个概念并不那么”感冒”。

通过实现”non-disruptive instance resizing”、Vacuum优化管理、Crash Recovery的速度提升，这个服务推出就是99.99%的SLA。

更底层使用的是Google内部统一的分布式存储层，经过Gmail、Youtube等大型系统的验证，性能/稳定性等经过了验证。这一点上，AlloyDB与PolarDB、Aurora是不一样的。PolarDB和Aurora都选择了实现自己面向数据库的分布式存储系统，而AlloyDB选择了更加通用的存储层，再面向数据库进行优化。这两个路线，客户价值都是直接的，但哪个方案的生命力会更加持久，可能需要几十年的时间去观察。

与AlloyDB一起，GCP还推出一个Oracle到PostgreSQL的迁移服务，只是这个服务看起来推出的也比较仓促，比较困难的结构迁移部分，使用了一个第三方的开源产品来实现。一方面可以看到这个，迁移是非常重要的模块，另一方面也看到，这一块做起来其实比较难。从这里看到，AlloyDB考虑优先推出PostgreSQL版本的一个重要原因，是认为：Oracle数据库的迁移至关重要，且PostgreSQL是Oracle迁移的重要目标数据库。

目前，发布的内容来看，关于数据库内部的并发访问/多版本管理的内容比较少，这部分应该是另一个复杂的点。期待后续的文章。

06 一些已知的不确定的点

ultra-fast cache是什么介质？如何被使用？

对于其他zone（非primary节点所在的zone），他的WAL日志（在log storage上）从哪里获取？WAL一定是具备跨zone的容灾能力的，这里WAL的容灾是在数据层去做的（日志写时写两份或者三份），还是log storage去做的？

与上面的问题相关的另一个重要的问题，LPS进程是全局的还是属于某个Zone的？

log storage是针对日志场景专门进行优化的，其模式是，append-only、延迟敏感并直接影响效率，这里的疑问是，做了哪些优化？

如果有Google的同学，可以一起讨论一下。

参考

AlloyDB for PostgreSQL under the hood: Intelligent, database-aware storage

AlloyDB for PostgreSQL

Introducing AlloyDB for PostgreSQL: Free yourself from expensive, legacy databases
一张图读懂阿里云数据库架构与选型

2022-05-18

阿里云RDS已经发展超过十年，在演进的过程中，其架构和规格已经变得比较复杂，本文尝试通过一张架构图，较为完整的概况RDS所支持的主要的架构类型、规格，帮助开发者从高可用、成本、可靠性等角度选择适合自己业务的RDS类型与规格。

1. 阿里云RDS的架构与规格大图

下图从高可用类型、数据可靠性、资源复用率、规格大小、规格代码等角度，较为完整的概况了当前RDS主要的架构与规格：

从高可用区架构上，分为单节点（基础版）、双节点（高可用版）以及三节点企业版、集群版（仅SQL Server AlwaysOn）。从资源共享与隔离上，则分为通用型、独享型、共享型和独占物理机（可以理解为是特殊的独享型）。从磁盘使用上的不同，则分为云盘版和本地盘版。

当前，RDS最大规格为104核CPU，768GB内存。其中通用型，最大为12核CPU；共享型最大为32核CPU。
(more…)
实测阿里云RDS Serverless

2022-05-16
在4月底，阿里云RDS Serverless正式公测发布。第一时间申请了公测资格，并进行了测试验证。测试完成后，还是非常期待这个功能的商业化的，当前的公测版本也值得开发者们去了解和小范围（例如开发测试环境）尝试。

00 什么是RDS Serverless

RDS Serverless是一种独立于按量付费、包年包月的资源使用与计费模式。提供了一种自动化的弹性扩缩容的规格，用户无需提前选定固定规格，后端会根据系统压力进行自动升降配，并根据实际使用计费，当然，用户需要设置该规格最大和最小规格，限制最大、最小使用资源与费用。

对于峰谷明显的业务系统，该模式一方面可以在需要时提供很高的资源规格应对压力，另一方面可以在低峰时降低资源使用，降低成本。

01测试结论概述

整体上，该Serverless版本的升/降配速度非常快，约10秒完成压力检测与变配，升配时性能表现非常平稳，降配时性能比较平稳。

具体的，在系统压力突增时，约10秒内就可以完成检测与变配，完成升配后系统压力立刻得到一定程度的缓解；与之前的Aurora Serverless v2测试中，升配的时间是差不多的，都是10秒以内

在系统压力下降时，降配的速度也非常快，约10秒完成检测与降配操作。另外，需要注意的是，当前的版本，因为降配非常快，也导致降配后，性能出现了一些波动，持续约10秒，波动幅度从约8毫秒的响应时间增长到30~50毫秒，在两次降配之后，都出现这样小波动。相比，Aurora降配更加“保守”，观测了50秒，之后才开始降配。在降配之后，Aurora的性能依旧非常平稳，没有任何波动。也就是说，降配过程中清除出内存池的数据页都是确确实实不再使用的，这里可能需要深入的观测InnoDB的Buffer Pool收缩时的表现，避免将可能使用数据页清理出内存。

目前只支持基础版（单节点实例），应用场景还比较有限，不过对于开发测试环境，种类可用性要求没那么高，且性能峰谷明显的场景，是可以轻松节省超过50%成本的，而且在实际使用时，性能还会非常不错（最高扩展到8*RCU）。

当然，现在阿里云RDS Serverless还是刚刚公测，申请公测资格通过后，可免费创建2个体验实例，最大规格为8*RCU，即约8c16g内存的实例，免费周期3个月，算是不错的羊毛了，具体的，可以通过RDS MySQL购买页找到公测申请链接。

02 测试方法说明

整体的测试方法与之前做Aurora Serverless v2类似。首先，启动一个单线程sysbench，作为测试“主进程”，程序运行900秒，在“主进程”运行300秒后，再启动一个“压力进程”（24并发的sysbench进程）向系统施压，该进程运行300秒后退出，在这个过程中，我们观测”主进程”的rt变化，以及整个过程中，实例规格的变化（依旧以buffer pool为指标）。更详细的描述可以参考：实测Aurora Serverless v2。

03 测试结果与分析

3.1 整体过程

下图黄点代表主进程每秒RT的变化；”蓝点”（连成线）代表秒级别buffer pool的变化。左侧纵坐标为响应时间，单位为毫秒；右边纵坐标为buffer pool大小，单位为GB

在第300秒，“压力进程”给出额外压力之后，系统开始升配，经过三次升配之后，到最大规格

在第600秒，“压力进程”退出，经过了4次降配，降级到最低规格

3.2 升配过程

从如下放大的图可以看到，在“压力线程”启动的第300秒，“主线程”的响应时间立刻增长到了300ms。

该实例在之后的7秒内完成升配，实例响应时间也立刻降了下来，降到约75毫秒

之后，再过10秒（约第317秒），完成了第二次升配，实例响应时间再次下降，约到30毫秒

再过约10秒（约第328秒），再次升配，但是此时响应时间不再有什么变化

3.3 降配过程

第600秒，压力进程退出，约11秒后，完成降配。但是，在第15秒性能出现明显波动，持续10秒

第650秒，完成第二次降配，4秒后性能出现波动，持续约5秒

第670秒，再次降配，性能再次波动，并出现一个异常点，响应时间非常大（约200ms）

之后，系统平稳运行

04 其他

当前RDS Serverless处于公测阶段，没有SLA保障，且仅支持基础版、区域支持也有限，虽然降配和升配都比较快，也比较稳定，但是还不适合生产环境。

当前，实例规格区间为0.5~8 RCU，最大规格也还比较小。

在这次对比测试中，也发现，相比AWS，阿里云在同一个可用区的网络延迟是更低的，仅5~10ms，而Aurora同可用区响应时间约为15~20ms。

据了解，阿里云今年还是会在这个方向加大投入，还会有一些大的版本和改进发出来，拭目以待吧。
云数据库行业动态@2022-05-13

2022-05-13
重要更新

Google云服务发布完全兼容PostgreSQL的云原生数据库AlloyDB ：AlloyDB是Google在云原生数据库领域的重要探索，其基于Google分布式文件系统，实现了存储计算分离的架构，提供一写多读的服务能力。通过引入向量化的列加速器及实现了in-memory column store，AlloyDB可以支持分析负载。据官方宣传，事务性能是AWS Aurora PostgreSQL的2倍，为原生PostgreSQL的4倍。同时，分析性能为原生PostgreSQL的100倍。从各种消息猜测GCP发力AlloyDB的主要目标是为Oracle存量市场客户提供迁移解决方案。[其数据库迁移产品DMS也刚刚发布了Oracle-to-PostgreSQL的结构迁移及数据复制能力] 。

GCP BigQuery BI Engine正式GA，有效加速大屏或报表等应用：BI Engine是一种架设在BigQuery之上的快速的内存分析服务，可为连接到 BigQuery 的仪表板和报告加速并提供亚秒级的查询性能。BI Engine具备智能弹性能力，其会根据业务访问情况自动优化内存大小。

TiDB Cloud 正式GA，重点服务中国出海或海外企业客户：PingCAP公司于5月11日宣布TiDB Cloud正式商用。TiDB Cloud围绕TiDB数据库提供了全托管的DBaaS（Database-as-a-Service）服务。TiDB Cloud提供了实例创建管理、备份恢复、SQL审计及监控报警等能力，基本上屏蔽了实例部署运维的复杂度，几分钟即可拉起整个集群，使用还比较简单。当前TiDB Cloud支持AWS、GCP两家云厂商，覆盖日本东京、新加坡、美国[弗吉尼亚]、美国[俄勒冈] 及印度[孟买]五个区域。TiDB Cloud提供了开发版本、概念测试版、标准版、企业版及旗舰版等多个版本，其中开发版本可免费测试1年，概念测试版提供14天免费测试周期，其他均为付费版本。产品按照计算、存储、流量及备份存储空间按需付费。

MySQL 8.0.29正式GA：主要新增功能包括InnoDB表的ALTER TABLE….DROP column支持ALGORITHM=INSTANT，实现不锁表在线变更。同时，在任意位置添加Column均支持不锁表在线变更。这个版本开始支持binlog文件的自动purge。

AWS RDS PG支持只读级联副本，最高可将读容量提高30倍：AWS RDS PG宣布在PostgreSQL 14.1版本开始支持级联只读同步，最多可以支持三层级联，每个节点可挂载5个只读实例，单个源实例最多可以支持155个只读副本。相较于之前的版本，最高提升30倍的读吞吐。基于AWS的只读级联能力，可以解决非级联情况下，只读副本对主实例的性能消耗，同时极大的扩展了实例的读吞吐能力。AWS是当前唯一拥有此特性的云厂商，对于读流量压力比较大的客户确实是一个福音。

更新详情

[AWS] ElastiCache 上线新版控制台，重新优化了实例创建体验

[AWS] RDS SQLServer在Express、Web、Standard和Enterprise版本上，支持SQLServer 2016 SP3、2017 CU27、2019 CU15，修复性能和安全问题

[AWS] RDS For PostgreSQL 支持级联只读副本，最高可将读容量提高30倍

[AWS] RDS 性能详情支持按照自定义查询时间范围进行性能数据的查询

[AWS] RDS ON AWS outposts现在支持手动及自动存储扩缩，用户设置“Enable storage autoscaling”并设置存储上限，RDS即会根据业务情况自动扩缩存储

[AWS] RDS已支持互联网协议版本6 IPv6。存量客户迁移到IPv6后，可以同时保持IPv4、IPv6

[AZURE] SQL Database HyperScale 提供99.99%的服务SLA

[GCP] 正式发布完全兼容PostgreSQL的云原生数据库AlloyDB

[GCP] BigQuery支持远程函数，用户可基于GCP cloud function定义外部函数，并在BigQuery中调用使用

[GCP] BigQuery BI Engine正式GA,在不牺牲数据时效性的情况下，有效加速大屏及报表等业务负载

[阿里云] 阿里云RDS MySQL发布企业级控制台，支持批量运维能力

[阿里云] 阿里云云数据库Redis支持实例回收站，适用于停机后希望保留数据的场景

[腾讯云] 腾讯云DTS增强能力，SQLServer迁移支持云联网，支持MongoDB多账号认证，同时支持付费实例销毁后恢复
云数据库行业动态@2022-04-29

2022-04-29
重要更新

01 Aurora Serverless GA，阿里云公测上线

本周，AWS Aurora提供了全新的Serverless能力（v2正式GA）；同时，阿里云RDS MySQL Serverless也已经公测上线，感兴趣的可以去申请试用。AWS Aurora新的Serverless将提供亚秒级（fraction of a second）的扩展能力，为系统压力峰谷明显的应用提供更低的成本。主要场景包括，压力难以预计的系统、多租户的SaaS系统、大型企业内复杂/混合的系统等。当前支持MySQL 8.0和PostgreSQL 13兼容版。不过，这个功能自2020年re:Invent宣布，到现在正式GA，历时一年半，比预期的要久很多。

02 常熟农商行核心系统上线OceanBase

据可靠消息确认，这次是的银行核心业务切换到OceanBase，还是有里程碑意义的，从公开材料看到，项目周期也非常长，从2018年开始，先是周边系统建立信任，再是十几个月的核心系统改造与测试验证，最终上线，恭喜OceanBase，代表国产数据库走出的坚实的一步。（不确定做业务改造团队是哪家，长亮？改造也是非常关键的一部分）

03 袋鼠云推出自主开源计划DTstackCon

开源主要产品包括：

chunjun(原名FlinkX)–批流一体大数据同步引擎：这是非常不错的项目，2900 stars，不过改名字还是对产品品牌有一定影响的，当然，这可能与Flink本身的品牌保护有关。

Taier–大数据分布式任务调度系统

molecule–轻量级Web IDE UI 框架

项目地址：https://github.com/DTStack

04 BigQuery支持LOAD DATA传输跨云数据

BigQuery Omni支持使用简单的LOAD DATA语句实现跨云数据传输。通过使用SQL的方式将AWS S3、Azure Blob中的数据安全、高效的导入BigQuery的存储和计算节点中。多云、开源是Google云的核心战略，作为美国市场第三的位置，Google在想各种策略将其他云的数据放到GCP上来计算，大概是Google版的“东数西算”战略吧。

LOAD DATA INTO `mydataset.test_csv` (Number INT64, Name STRING, Time DATE) PARTITION BY Time FROM FILES (format = 'CSV', uris = ['s3://test-bucket/sampled*'], skip_leading_rows=1) WITH CONNECTION `aws-us-east-1.test-connection`

05 华为云发布新的GaussDB品牌视频

目前华为云数据库应该算有两个品牌：GaussDB、openGauss，从品牌的角度还是比较容易混淆的，并不利于传播。似乎是这样：GaussDB是华为云上自研的统一数据库品牌，包括了GaussDB for MySQL、for Mongo等。openGauss则是一款开源关系型数据库，一方面外部生态在使用，另一方面华为云GaussDB也基于openGauss推出了对应的产品。另外，注意到，最近华为云正式对外宣布openGauss在邮储银行上线。

06 Azure Data Studio新增数据迁移扩展

Azure Data Studio新增数据迁移扩展，可以帮助用户便捷的将本地管理的SQL Server数据库迁移到Azure的云数据库SQL Server上。Azure Data Studio是由微软提供的开源的、跨平台的SQL Server管理工具。自家的工具都承载着为自家云引流的责任。

07 实时数仓SelectDB完成超3亿元融资

定位云原生实时数仓厂商，飞轮科技完成超3亿元天使轮和天使+轮融资。创始团队主要来自百度Doris、奇安信大数据等团队。做实时数仓这个方向的团队似乎已经非常多了，是“百家争鸣”还是“军阀混战”，还要再看一段时间。不过据小道报道，Doris后面还会有故事… 拭目以待

更新详情

[Azure] Azure Data Studio新增数据迁移扩展

[Azure] Cosmos DB for MongoDB提供通过API重建唯一索引的能力

[AWS] Aurora Serverless v2 正式GA

[AWS] Glue提供基于规则匹配和机器学习的敏感信息发现功能

[AWS] 图数据库Neptune提供免费试用

[GCP] BigQuery Omni支持使用简单的LOAD DATA语句实现跨云数据传输

[GCP] Cloud SQL for PostgreSQL开始支持大版本的原地升级功能

[GCP] BigQuery开始支持使用SEARCH函数的搜索功能

[OceanBase] OBCA进行了一次升级，更新了考试内容与教材

[OceanBase] 常熟农商银行核心系统开始上线OceanBase

[zCloud] 云和恩墨数据库云管平台 zCloud支持OceanBase

[阿里云] RDS PostgreSQL云盘版只读实例降价，其中包年包月降价幅度45%，按量付费降价幅度17%

[阿里云] RDS SQL Server企业集群版支持备库可读

[阿里云] RDS MySQL Serverless 正式上线，免费公测中

[腾讯云] 云数据库 MySQL支持智能参数调优（内测）

[腾讯云] 云数据库MySQL支持TXRocks引擎

[火山云] 云数据库MySQL支持了实例降配功能

[袋鼠云] 推出自主开源计划：DTstackCon

[华为云] 华为云数据库发布新的GaussDB品牌视频

最后，祝大家五一快乐，劳动节多劳动。