orczhou.com

  • 首页
  • 云数据库性能/架构与选型
    • 云数据库性能综述
    • AWS RDS架构与选型
    • 阿里云RDS架构与选型
    • 阿里云ARM/x86 RDS对比
    • 华为云鲲鹏/x86 RDS对比
    • AWS Graviton/x86 RDS对比
  • 关于MySQL
    • 读《高性能MySQL》
    • 如何学习MySQL
    • MySQL版本现状与选择
    • MySQL的历史版本
  • 其他
    • 云数据库行业动态
    • 关于生活
    • 归档页面
    • 管理页面
    • 关于orczhou
  • 云数据库行业动态@2025-07-04

    2025-07-04

    标题:华为云HDC发布TaurusDB PostgreSQL版;IDC报告发布阿里云数据库第一,华为云本地部署第一;OceanBase发布中文名“海扬数据库”

    重要更新

    华为云HDC大会,数据库发布:GaussDB Doer 基于AI的智能助手; TaurusDB for PostgreSQL 全新引擎于正式发布; GaussDB 透明多写功能发布[31]。

    IvorySQL 2025 生态大会暨 PostgreSQL 高峰论坛于6月27日—28日在济南成功举办。本次盛会汇聚了包括开源基金会/社区负责人、PostgreSQL国内外资深开发者、企业代表及资深开发者。[1]

    OceanBase CEO 杨冰全新发布 OceanBase 品牌中文名——“海扬数据库”。[2]

    IDC 2024下半年中国关系型数据库市场报告:阿里云数据库整体、公共云第一[15];华为云数据库本地部署市场份额第一![3];腾讯云增速第一[11]。

    今日,SIGMOD行业学术会议上:阿里云PolarDB数据库蝉联SIGMOD最佳论文奖[12];华为多篇论文成功入选,GaussDB同步亮相[19]。

    PingCAP 荣登 2025 AI Cloud 100 China 榜单,排名第四![22]

    更新详情

    • RDS PostgreSQL Serverless极致弹性免费体验功能发布,在瑶池数据库解决方案体验馆中,您无需购买任何资源,即可在线体验Serverless功能的智能弹性能力[4]
    • 云数据库RDS提供无感数据集成(Zero-ETL)功能,用于将RDS数据同步至数据仓库(AnalyticDB PostgreSQL),您无需搭建或维护数据同步链路,且数据同步链路不收费[5]
    • RDS 高性能云盘的基准IO性能提升,IOPS最高提升22400,IO带宽最高提升350 MB/s。[6]
    GCP(谷歌云)
    • Cloud SQL Enterprise Plus 版实例的写入端点功能现已正式发布 [14]
    • 数据库迁移服务支持异构 SQL Server 到 PostgreSQL 的迁移 [25]
    • Google云发布 Spanner CLI(内置于 Google Cloud CLI 的 Spanner 交互式 Shell)直接连接 Spanner 数据库并与其交互 [30]
    Oracle云
    • HeatWave:支持版本 9.3.2[39]
    火山云(字节)
    • 云数据库 MySQL 提供新的实例类型——多节点实例。多节点实例采用了一主多备的集群架构,支持自动故障切换和手动切换[13]。
    • 缓存数据库 Redis 优化大 Key 分析功能[16]
    • 文档数据库 MongoDB 支持更多 OpenAPI 接口 [17]
    百度云
    • 托管 PostgreSQL 支持跨地域备份恢复,从异地的BOS快速拉取已备份的文件恢复数据,保障业务连续性。[42]
    • 托管 PostgreSQL 支持跨地域备份。[43]
    • GaiaDB 新增独享型和通用型计算节点规格,超大规格(64核及88核)为白名单功能[44]
    • GaiaDB 支持一键从RDS实例同步数据至新的GaiaDB集群[45]
    AWS(亚马逊云)
    • Amazon Keyspaces(适用于 Apache Cassandra)现在支持变更数据捕获 (CDC) 流[48]
    • Amazon Aurora MySQL 和 Amazon RDS for MySQL 与 Amazon SageMaker 的集成现已推出[51]
    腾讯云
    • 云数据库 MySQL 只读分析引擎发布了全新的内核版本3.2503.1.0,支持了诸多全新的内核特性。[69]
    • 云数据库 MySQL 只读分析引擎新增支持了新加坡、成都地域。[70]
    • 云数据库 MySQL 5.7内核版本更新20250510。[71]
    • 云数据库 MySQL 只读分析引擎发布了全新的问题修复版本2.2410.8.0。[72]
    • 云数据库 MySQL 只读分析引擎发布了全新的内核版本2.2410.7.0,支持了诸多全新的内核特性。[73]
    • TDSQL-C MySQL 版只读分析引擎发布了全新的问题修复版本2.2410.8.0。[74]
    • TDSQL-C MySQL 版只读分析引擎发布了全新的内核版本2.2410.7.0,支持了诸多全新的内核特性。[75]

    参考链接

    • [1] https://mp.weixin.qq.com/s/F829NS9aM-Jj0uiDZ-Pm3A
    • [2] https://mp.weixin.qq.com/s/N1HgNddZSW4aebpTS26JGg
    • [3] https://mp.weixin.qq.com/s/71cgB8HxatIs3DsLNYVmKQ
    • [4] https://help.aliyun.com/zh/rds/apsaradb-rds-for-postgresql/free-experience-rds-postgresql-serverless-extreme-flexibility
    • [5] https://help.aliyun.com/zh/rds/apsaradb-rds-for-postgresql/zero-etl
    • [6] https://help.aliyun.com/zh/rds/apsaradb-rds-for-postgresql/product-function-change-general-cloud-disk-benchmark-io-performance-improvement
    • [11] https://mp.weixin.qq.com/s/qzYEAWSea_bPvAQdEgNYQw
    • [12] https://mp.weixin.qq.com/s/P7JotGsdD8-8uJ6kx3c6oQ
    • [13] https://www.volcengine.com/docs/6313/75366
    • [14] https://cloud.google.com/sql/docs/mysql/connect-to-instance-using-write-endpoint
    • [15] https://mp.weixin.qq.com/s/UPWbfFV-hs0HGBzqhu-Ohg
    • [16] https://www.volcengine.com/docs/6293/83049
    • [17] https://www.volcengine.com/docs/6447/100764
    • [19] https://mp.weixin.qq.com/s/ljJobQU50SoBRir-3nK-Eg
    • [22] https://mp.weixin.qq.com/s/J6v0PobLDgrXGpVxyLnyAg
    • [25] https://cloud.google.com/database-migration/docs/sqlserver-to-alloydb/scenario-overview
    • [30] https://cloud.google.com/spanner/docs/spanner-cli
    • [31] https://mp.weixin.qq.com/s/3TGIKrpPLeQ-gBHY67w0Eg
    • [39] https://docs.oracle.com/iaas/releasenotes/mysql-database/heatwave-932.htm
    • [40] https://docs.oracle.com/iaas/releasenotes/autonomous-database-serverless/2025-06-data-transforms-enhancements-1.htm
    • [41] https://docs.oracle.com/iaas/releasenotes/autonomous-database-serverless/2025-06-elastic-pool-support-for-child-tenancies.htm
    • [42] https://cloud.baidu.com/doc/RDS/s/jmcjypq12
    • [43] https://cloud.baidu.com/doc/RDS/s/rmciw3o9v
    • [44] https://cloud.baidu.com/doc/GaiaDB/s/elt5qt0i9
    • [45] https://cloud.baidu.com/doc/GaiaDB/s/Mmbz2f64q
    • [48] https://aws.amazon.com/about-aws/whats-new/2025/07/amazon-keyspaces-apache-cassandra-cdc-streams/
    • [51] https://aws.amazon.com/about-aws/whats-new/2025/07/amazon-aurora-rds-mysql-integration-sagemaker
    • [69] https://cloud.tencent.com/document/product/236/115774
    • [70] https://cloud.tencent.com/document/product/236/8458
    • [71] https://cloud.tencent.com/document/product/236/42539
    • [72] https://cloud.tencent.com/document/product/236/115774
    • [73] https://cloud.tencent.com/document/product/236/115774
    • [74] https://cloud.tencent.com/document/product/1003/109576
    • [75] https://cloud.tencent.com/document/product/1003/109576
  • 最近

    2025-06-29

    最近参加了很多的线下的活动,包括了ACMUG、AWS 中国峰会、华为云HDC、IvorySQL & PostgreSQL生态大会,另外,还泡了一些杨梅酒、看了《长安的荔枝》,公司的产品“NineData”社区版发布了4.2.0。

    最近下线的活动很多,包括OceanBase、TiDB、各个云数据库厂商、各个数据库社区等,都在积极的组织一些社区活动,总的感受是,活动虽然很多,但开发者们对线下活动的热情是在减退的,而如果一场活动与AI关系不大,那么来现场的人一般是对这个技术的“真爱”。

    华为云的 HDC

    在上周末,受华为云数据库的朋友邀请,去参加华为云的 HDC 大会(开发者大会)。最近几年,和华为云的数据库合作比较多,也结识了很多华为云数据库团队的人。虽然数据库技术都是一样的,但每家公司都有着自己非常独特的环境与基因,有这自己不一样的风格。华为云数据库,感受着更多来自客户与一线的炮火,有着更接地气的拼劲。而整个公司因为在全球范围内的制裁压力,反而激发了更强的凝聚力。这次HDC大会上,华为云数据库发布了:GaussDB业务透明多写能力、“GaussDB Doer”一个面向华为云数据库的运维助手、TaurusDB for PostgreSQL

    此外,这次的HDC是在华为的松山湖园区,这是一个非常有特色的欧洲式建筑园区,随手拍了几张石雕,感受一下:

    前面的骑马的女神,大概是雅典娜
    拿着美杜莎之盾,大概是伯尔修斯
    经周陌认证,中间大概是波塞冬
    奥古斯都 屋大维

    ACMUG

    今年是 MySQL 30 年,这次成都的线下活动算是特别盛大的一次了,成都虽然有点远,但 MySQL 领域很多的有影响力的人去了。活动本身除了白天严肃的分享议题之外,下午、晚上大家随意闲聊各种八卦似乎要更有趣一些,这大概也是更多人参加的动力吧。

    亚马逊中国峰会

    这是因 NineData 赞助而去参加的活动,是以合作伙伴的身份参加的。Amazon的峰会在2015年的时候曾在上海参过一次,2018年还曾去过Vagas参加过一次re:Invent。Amazon 在全球云计算领域的地位依旧遥遥领先,但中国是一个特别的地方,确实很特别,无论是 Oracle 还是现在的 Amazon ,在全球大杀四方的时候,在中国却寸步难行,到底是谁的问题,一时难下结论,但这也确实给中国的厂商们留下一些时间和机会。

    云计算是现代应用非常底层的基础技术,而亚马逊作为一家美国的企业,要在中国开荒拓地,如果国际合作关系没有好转,未来大概是难有好转的。

    社区版发布4.2.0

    此外,这段时间,NineData 的社区版也发布了4.2.0,这是一个免费的(但不开源)数据库迁移同步工具,该免费版本中可以非常方便的帮助开发者完成诸如MySQL迁移、PostgreSQL迁移、Doris同步等工作。但如果是重要的生产环境或者需要长期运行的关键链路,则依旧建议考虑采购企业版。

    IvorySQL & PostgreSQL 生态大会

    这次大会主要由“瀚高”数据库团队在背后主办,是非常赞的活动,大会上有着关于 PostgreSQL 数据库方方面面的技术话题。这次参会,也认识了更多的 PostgreSQL 方向的开发者们。

    正如自己数年的感受一样:“PostgreSQL 在经历一场慢热的崛起”。从过去两三个月的两场收购(Neon、Crunchy Data)来看,在 AI 时代,PostgreSQL 依旧是在潮头的。

    杨梅酒

    最近几年,越来越体会到,杨梅是一种极为美味的水果了。杨梅大概在每年的6月初成熟,到了月底则已经逐渐下架,又因为其运输和保存都非常困难,也让这口美味,更显难得。江浙一带的杨梅种植技术大概是非常强的,这里的杨梅品种是非常独特的,甜中带着酸、酸中偷着甜,早上从台州一带的树上摘下,中午或晚上送到杭州,简单清洗一下,吃上十个八个,实为人间难得的美味。

    杨梅因为表面没有保护的表皮,所以其运输的难度比起荔枝要难数十倍。“杨贵妃”大概是没有尝过江浙一带的杨梅的,否则,则可能每年下江南一次。想运到长安或洛阳,不要说古代,即便是现在,都有一些困难的。

    喝酒这件事情,我大概是“人菜瘾大”的那类。在听说可以用杨梅泡酒后,从去年起就做了一些尝试。今年的杨梅酒已经按经验泡制、封存,约两个月后就可以品尝了。届时,如果感兴趣的,可以来我家“尝一尝”。

    长安的荔枝

    今年,一个多年未见的小学同学给我寄了一箱来自岭南一带的荔枝,放了半箱再公司,剩下的自己和家人吃了部分,上下楼的邻居也送了一些些。在此,代这些吃上荔枝的人一并感谢这位多年未见的同学。

    公众号久不更新,甚是心慌,记录如上,算是交代。

  • 云数据库行业动态@2025-06-20

    2025-06-20

    标题:openGauss 发布 MCP Server支持SQL查询/运维管理等功能;阿里云PostgreSQL发布承诺型Serverless

    重要更新

    openGauss 发布 MCP Server[1],面相LLM提供更为便捷的SQL执行能力、此外还可以帮助开发者更为快捷的实现用户管理,安装,监控等能力(DataKit MCP Server)。

    更新详情

    • RDS高可用系列和集群系列提升多可用区部署实例的SLA,双可用区统一提升至99.995%,三可用区及以上统一提升至99.997%。[4]
    • RDS PostgreSQL发布承诺型Serverless能力,该能力是指在已购买的固定规格RDS PostgreSQL实例上(计费类型包括包年包月或按量付费)启用Serverless功能。[5]
    • RDS PostgreSQL 17新增支持插件AI(rds_ai)(1.0.0)、高速全文检索(RUM)(1.3)、定时任务(pg_cron)(1.6)和pg_partman(5.2.4);RDS PostgreSQL 14~15版本新增支持插件AI(rds_ai),版本为1.0.0。RDS PostgreSQL 13新增支持插件SQL限流(rds_ccl),版本为1.2[6]
    • RDS PostgreSQL支持全球多活数据库,该方案基于RDS PostgreSQL的原生物理复制与数据传输服务(DTS),实现了一站式、高性价比的异地灾备解决方案[7]
    • RDS PostgreSQL 高性能云盘的基准IO性能提升,IOPS最高提升22400,IO带宽最高提升350 MB/s。[8]
    • RDS SQL Server支持对外网链路强制进行SSL加密 [10]
    Azure(微软云)
    • Azure SQL 托管实例更快的管理操作[14]
    • Azure Database for PostgreSQL 17 迁移服务支持[17]
    GCP(谷歌云)
    • Cloud SQL for MySQL 之前的版本升级到8.4,提供了更加便捷升级方式.[20]
    • BigQuery 现在提供 Gemini 增强型 SQL 翻译功能
    Oracle云
    • Data Studio 增强功能:使用 SQL 语法查询远程目录[46]
    火山云(字节)
    • veDB MySQL 支持了跨地域备份[21]、支持修改最大连接数[22]、存储空间上限调整[23]等功能
    • 文档数据库 MongoDB 支持包年包月实例转为按量计费实例[24]、支持更多监控指标[25]
    AWS(亚马逊云)
    • Amazon RDS 在数据库预览环境中支持 MySQL 9.3 [50]
    • Amazon RDS for Db2 支持待机模式下的跨区域副本[51]
    腾讯云
    • 云数据库 MySQL、TDSQL-C MySQL 针对数据库审计优化了配置日志投递至 Ckafka 成功后的界面展示等功能[64]

    参考链接

    • [1] https://mp.weixin.qq.com/s/jEDXFwRYtAWmZ11HV-W-1w
    • [4] https://help.aliyun.com/zh/rds/apsaradb-rds-for-mysql/the-sla-for-rds-instances-deployed-across-multiple-zones-is-increased
    • [5] https://help.aliyun.com/zh/rds/apsaradb-rds-for-postgresql/assured-serverless-apsaradb-rds-for-postgresql-instances-in-public-preview
    • [6] https://help.aliyun.com/zh/rds/apsaradb-rds-for-postgresql/release-notes-for-alipg
    • [7] https://help.aliyun.com/zh/rds/apsaradb-rds-for-postgresql/global-active-database/
    • [8] https://help.aliyun.com/zh/rds/apsaradb-rds-for-postgresql/product-function-change-general-cloud-disk-benchmark-io-performance-improvement
    • [10] https://help.aliyun.com/zh/rds/apsaradb-rds-for-sql-server/configure-ssl-encryption-for-an-apsaradb-rds-for-sql-server-instance
    • [14] https://azure.microsoft.com/updates?id=496292
    • [17] https://azure.microsoft.com/updates?id=496125
    • [20] https://cloud.google.com/sql/docs/mysql/upgrade-major-db-version-inplace
    • [21] https://www.volcengine.com/docs/6357/1578691
    • [22] https://www.volcengine.com/docs/6357/1578663
    • [23] https://www.volcengine.com/docs/6357/73614
    • [24] https://www.volcengine.com/docs/6447/71015
    • [25] https://www.volcengine.com/docs/6447/1555171
    • [46] https://docs.oracle.com/iaas/releasenotes/autonomous-database-serverless/2025-06-data-studio-enhancements-2.htm
    • [47] https://docs.oracle.com/iaas/releasenotes/autonomous-database-serverless/2025-06-select-ai-enhancements-1.htm
    • [50] https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/MySQL.Concepts.VersionMgmt.html#mysql-preview-environment-version-9-3
    • [51] https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/db2-replication.html
    • [64] https://cloud.tencent.com/document/product/236/81406
    • [65] https://cloud.tencent.com/document/product/1003/61568

  • 云数据库行业动态@2025-06-06

    2025-06-06

    标题:MariaDB收购高可用产品Galera;ClickHouse融资$3.5亿;Snowflake $2.5亿收购Crunchy Data

    重要更新

    在Databricks以10 亿美元收购Neon后,Snowflake以2.5亿美元收购Crunchy Data,一家深度PostgreSQL产品服务商。来自“fairchild”的评论:“它预示着AI Agent将成为数据库资源的主要消费者和创建者,这将从根本上改变数据库的交互模式——从人类驱动转变为机器驱动”。[2]

    MariaDB 宣布收购高可用产品 Galera Cluster。这两个产品一直以来合作紧密,MariaDB通过此次收购,可以向客户提供更具竞争力的企业级高可用方案;而对于Galera Cluster则可以获得更多可靠的客户。[1]

    ClickHouse 宣布融资3.5亿美元C轮融资,本次融资将主要用于全球化业务推进、AI与分析能力增强等方向。

    其他建议关注的重要更新:

    • Amazon Neptune 宣布推出 MCP(模型上下文协议)服务器[75]
    • TDSQL-C MySQL 版发布全球数据库功能,帮助企业构建高可用、低延迟、强一致的全球数据库架构。[83]
    • Aurora DSQL 现已全面GA [78]

    更新详情

    阿里云
    • RDS MySQL标准版高可用云盘主实例新增128核512 GB规格(mysql.x4.16xlarge.2c)。[4]
    • RDS PostgreSQL支持创建集群系列实例。集群系列实例采用计算与存储分离、一主多备的架构[5]
    • RDS SQL Server新增异地容灾功能,该功能基于SQL Server分布式可用性组(Distributed Availability Groups,DAG)和DTS跨地域网络能力 [6]
    Azure(微软云)
    • Azure Database for PostgreSQL 在 PG 17 中支持 pg_cron 扩展 [9]
    • Azure Database for PostgreSQL 的 SSD v2 支持高可用性 [11]
    • Azure Database for PostgreSQL 支持原地升级到 PostgreSQL 17 [12]
    • Azure Cosmos DB for MongoDB (vCore) 触发器和 Azure Functions 的绑定 [14]
    GCP(谷歌云)
    • Cloud SQL for SQL Server 现在提供最大服务器内存推荐功能 [35]
    • Spanner 现已支持 BigQuery 的跨区域联合查询,这使得 BigQuery 用户能够从其 BigQuery 区域以外的区域查询 Spanner 表[36]
    • 您现在可以通过 BigQuery Sharing 功能共享 Pub/Sub 流数据[39]
    • Cloud SQL for SQL Server 现在将查询洞察和索引顾问支持扩展至读副本[43]
    Oracle云
    • HeatWave 支持版本 9.3.1[50]
    火山云(字节)
    • 云数据库 MySQL 版 对于本地盘实例,当实例的 CPU 核数大于等于 8 时,支持为实例配置最大 8T 的存储空间。[15]
    • 云数据库 MySQL 版 为 MySQL 5.7 实例提供 Statement Outline 能力 [16]
    • 云数据库 MySQL 版默认支持 InnoDB 存储引擎,不支持 MyISAM、Memory 或 Archive 存储引擎。并支持自动转换为 InnoDB 存储引擎的功能。[17]
    • 云数据库 PostgreSQL 支持克隆数据库[18]
    • 云数据库 PostgreSQL 支持创建逻辑备份并支持下载与恢复[19]
    • 云数据库 SQL Server 支持在创建数据库账号时指定 Login SID [20]
    • 缓存数据库 Redis 版支持 512MiB 规格 [21]
    • 缓存数据库 Redis 版 开放 Proxy 自研命令[22]
    • 文档数据库 MongoDB 版新增支持将包年包月实例转换为按量计费实例 [51]
    百度云
    • GaiaDB 更新相应计算节点规格集群的磁盘最大存储容量[59]
    • Redis内存型支持清空过期数据[60]
    AWS(亚马逊云)
    • ((2025-05-30)) Performance Insights 的生命周期结束信息(End-of-life information for Performance Insights)[61]
    • RDS 支持 MariaDB 10.11.13 和 11.4.7 [62]
    • Amazon RDS for PostgreSQL 扩展支持版本 R2 11.22-rds.20250508 和 12.22-rds.20250508[66]
    • 成本优化中心支持针对 Amazon Aurora 的建议[71]
    • Amazon Neptune 数据库现已在 AWS 加拿大西部(卡尔加里)和亚太地区(墨尔本)区域推出[74]
    • Amazon Neptune 宣布推出 MCP(模型上下文协议)服务器[75]
    • Aurora DSQL 现已全面推出[78]
    腾讯云
    • 云数据库 MySQL 发布新版本 CPU 弹性扩容功能,支持自动及自定义扩展 CPU,可轻松应对突发压力,保障线上业务稳定性[81]
    • TDSQL-C MySQL 版发布全球数据库功能,帮助企业构建高可用、低延迟、强一致的全球数据库架构。[83]
    • TDSQL-C MySQL 版8.0内核版本更新3.1.16.001,提升数据库性能与稳定性。[84]

    参考链接

    • [1] https://www.businesswire.com/news/home/20250527634819/en/MariaDB-Acquires-Galera-Cluster
    • [2] https://www.wsj.com/articles/snowflake-to-buy-crunchy-data-for-250-million-233543ab
    • [3] https://clickhouse.com/blog/clickhouse-raises-350-million-series-c-to-power-analytics-for-ai-era
    • [4] https://help.aliyun.com/zh/rds/apsaradb-rds-for-mysql/primary-apsaradb-rds-for-mysql-instance-types
    • [5] https://help.aliyun.com/zh/rds/apsaradb-rds-for-postgresql/rds-cluster-edition#cba0a8c4138u7
    • [6] https://help.aliyun.com/zh/rds/apsaradb-rds-for-sql-server/geo-disaster-recovery/
    • [9] https://azure.microsoft.com/updates?id=495130
    • [11] https://azure.microsoft.com/updates?id=491483
    • [12] https://azure.microsoft.com/updates?id=495135
    • [14] https://azure.microsoft.com/updates?id=491267
    • [19] https://www.volcengine.com/docs/6438/1554707
    • [20] https://www.volcengine.com/docs/6899/1253611
    • [21] https://www.volcengine.com/docs/6293/72111
    • [49] https://docs.oracle.com/iaas/releasenotes/mysql-database/heatwave-rest.htm
    • [50] https://docs.oracle.com/iaas/releasenotes/mysql-database/heatwave-931.htm
    • [51] https://www.volcengine.com/docs/6447/1555171
    • [59] https://cloud.baidu.com/doc/GaiaDB/s/elt5qt0i9
    • [60] https://cloud.baidu.com/doc/SCS/s/ym10cc9fw
    • [61] https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/USER_PerfInsights.html
    • [62] https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/MariaDB.Concepts.VersionMgmt.html
    • [66] https://aws.amazon.com/about-aws/whats-new/2025/06/amazon-rds-postgresql-extended-support-versions-r2-11-22-rds-20250508-12-22-rds-20250508
    • [71] https://aws.amazon.com/about-aws/whats-new/2025/06/cost-optimization-hub-recommendations-amazon-aurora
    • [74] https://aws.amazon.com/about-aws/whats-new/2025/05/amazon-neptune-database-aws-calgary-melbourne-regions
    • [75] https://aws.amazon.com/about-aws/whats-new/2025/05/amazon-neptune-mcp-server
    • [78] https://aws.amazon.com/about-aws/whats-new/2025/05/amazon-aurora-dsql-generally-available/
    • [81] https://cloud.tencent.com/document/product/236/96835
    • [83] https://cloud.tencent.com/document/product/1003/118899
    • [84] https://cloud.tencent.com/document/product/1003/61515

  • Protected: 自动化压测云数据库 PostgreSQL

    2025-06-01

    This content is password protected. To view it please enter your password below:

  • 使用Oracle云上的MySQL 9.x作为向量存储

    2025-05-25

    MySQL的向量处理现状

    向量数据库或者说向量处理是,个人认为,最为重要数据库AI能力。目前,各个数据库都在围绕着向量数据库构建更为丰富的LLM/AI相关功能。而MySQL 9最为重要的特性之一就是新增了向量处理能力。当前的版本主要包括了:(a) 向量数据类型;(b) 简单的向量处理函数。其中部分向量处理函数放在了MySQL的企业版或云版本中。

    因为当前MySQL 9系列的版本均为创新版(并不是稳定版),所以相关功能还会不断的迭代和发展。期待未来做出更多丰富功能:(a) 新增向量相似性搜索功能;(b) 并将完整的向量处理能力放到社区版中。后续依旧会持续关注这部分的产品能力。

    本文测试环境为Oracle Cloud,你可以参考在 Oracle 云上免费测试数据库[3]文中创建一个免费的MySQL实例进行测试。

    MySQL中的向量数据类型

    向量数据存储

    在MySQL 9中新增了数据类型vector用来存储向量数据[1],简单的使用方式如下:

    create table vector_t01 (
        id int,
        s_v_01 vector(390),
        s_v_02 vector(390)
    );

    这里表示s_v_01、s_v_02均为390维的向量,每个维度在MySQL中使用4 bytes的单精度浮点类型存储。

    写入向量数据

    为了测试使用方便,这里使用string_to_vector对向量进行转换并进行存储:

    insert into vector_t01 values (1,string_to_vector('[1,2,3]'),string_to_vector('[4,5,6]'));

    查询向量数据

    使用 VECTOR_TO_STRING

    使用 SELECT 直接查询向量数据的话,则返回的是二进制形式,可以使用函数VECTOR_TO_STRING做一次转换:

    select id,VECTOR_TO_STRING(s_v_01),VECTOR_TO_STRING(s_v_02) FROM vector_t01;
    +------+---------------------------------------+---------------------------------------+
    | id   | VECTOR_TO_STRING(s_v_01)              | VECTOR_TO_STRING(s_v_02)              |
    +------+---------------------------------------+---------------------------------------+
    |    1 | [1.00000e+00,2.00000e+00,3.00000e+00] | [4.00000e+00,5.00000e+00,6.00000e+00] |
    +------+---------------------------------------+---------------------------------------+

    如果不使用VECTOR_TO_STRING则返回的是底层的二进制存储内容:

    select id,s_v_01,s_v_02 FROM vector_t01;
    +------+--------------+--------------+
    | id   | s_v_01       | s_v_02       |
    +------+--------------+--------------+
    |    1 |   �?   @  @@  |   �@  �@  �@    |
    +------+--------------+--------------+

    十六进制查询

    如果使用十六进制展示,则有:

    select id,hex(s_v_01),hex(s_v_02) FROM vector_t01;
    +------+--------------------------+--------------------------+
    | id   | hex(s_v_01)              | hex(s_v_02)              |
    +------+--------------------------+--------------------------+
    |    1 | 0000803F0000004000004040 | 000080400000A0400000C040 |
    +------+--------------------------+--------------------------+

    这里的0000803F0000004000004040一共是3个bytes,每个byte表示一个分量,例如:0000803F表示第一个分量,即为单精度浮点型的1.0(感兴趣的可以尝试做个转换,这里不再详述)。

    计算向量距离

    目前,MySQL 支持最为常见的“距离”的计算,具体包括:点积(默认)、欧式距离、余弦距离的计算:

    -- s_v_01: (1,2,3)
    -- s_v_01: (4,5,6)
    SELECT 
      DISTANCE(s_v_01,s_v_02,"DOT") as dis_dot,
      DISTANCE(s_v_01,s_v_02,"COSINE") as dis_cos,
      DISTANCE(s_v_01,s_v_02,"EUCLIDEAN") as dis_ecu
    FROM vector_t01;
    
    +---------+----------------------+-------------------+
    | dis_dot | dis_cos              | dis_ecu           |
    +---------+----------------------+-------------------+
    |      32 | 0.025368213653564453 | 5.196152210235596 |
    +---------+----------------------+-------------------+

    需要注意的是,目前该距离计算函数(DISTANCE[2])仅在Oracle Cloud或MySQL企业版本中提供。后续还将持续关注MySQL所提供的向量产品能力、以及其他GenAI相关功能。

    参考链接

    • [1] MySQL 9.0 Reference Manual :: 13.3.5 The VECTOR Type
    • [2] MySQL 9.1 Reference Manual :: 14.21 Vector Functions
    • [3] 在 Oracle 云上免费测试数据库
Next Page→
  • “众鸟高飞尽 孤云独去闲”
  • —唐 李白

关于我

© 2022

orczhou.com

·

Theme by Brian Gardner

本作品采用知识共享许可协议 许可协议进行许可。