2025 云数据库年度总结

年度总结是从前两年开始写的,鉴于考虑把“行业动态”的发布频率改为“月度”的,所以,也就同时要求自己每年都写一个数据库的年度总结了。在总结时,大家总是倾向于赋予最近一年过多的意义,但如果放在更长的时间尺度里面,可能不尽然。过去的2025年,并不是属于数据库的,而依旧是属于“AI”的,摆正这个位置后,在这个大背景下,我们再来看看数据库的发展情况吧。

1. 数据库与 AI

数据库与AI结合的方向包含了向量数据库、Memory、以及如何使用 AI 用好数据库。

OceanBase 是可能是国内数据库厂商中 AI 投入最大的厂商[43],除了持续建设向量存储与搜索技术外,今年还全新发布轻量向量数据库 seekdb [41];全新发布 PowerMem[42](兼容Mem0);此外,ODC 发布 DataPilot、诊断Agent等能力。

新的向量数据库 VexDB 正式发布,该数据库由清华研发团队,能够支持百亿千维向量数据毫秒级查询,召回准确度高,并在国际权威的 DABSTEP 非结构化数据分析测试中,VexDB 的数据代理系统以领先第二名超 10 个百分点的成绩夺冠[24]

不约而同,在年底火山引擎 MySQL[50]、阿里云 MySQL[51]分别支持向量类型的索引与搜索能力,均使用 HNSW 索引,这非常大程度弥补了开源MySQL的弱项(仅能够进行向量存储,并不支持基于向ANN的检索算法)。

感受上,Google 也在各种方式尝试将AI技术更好的与数据库进行结合。具体的,在数据库与 AI 能力结合上,Google发布了 (1) MCP Toolbox for Databases[19] (2) 在控制台集成了Gemini 的 Text2SQL (3) 使用 Gemini 修复 Studio 中的错误[18] (4) 将数据库访问与管理集成到 Gemini CLI 中[20](说明:使用的是MCP Toolbox)。

阿里云数据库团队在 AI 结合上也做了大量探索,还是比较有意思的。包括尝试加速推理效率的 PolarKVCache [48];另外,Tair KVCache [56]团队似乎也在尝试通过文件系统、内存优化解决推理效率。目前,PolarKVCache 相关功能还处于内测阶段。LLM 推理过程中,在 Decoder 阶段由于KV Cache的问题,显存是巨大的瓶颈,如果通过硬件、软件结合的技术扩展缓存池的大小,可以大大增加推理的并发性,并更好的利用内存去加速推理。

此外,阿里云 RDS PostgreSQL 现推出AI插件“rds_ai”[6];PolarDB for AI [8][9]则内置了多种机器学习算法模型、NL2SQL等能力。

Zilliz Milvus 流行度进一步增强,GitHub Star 数量达到4万[60];Milvus 在过去一年则新增了如下的重要能力:RaBitQ 1-bit Quantization[57]、内置文本向量化[58]Decay Ranker[59]、增强了JSON支持、Geospatial Data Type 等功能。

2. 云数据库或厂商的重要发布

AWS RDS/Aurora 支持了 MySQL 9.4/9.5[69],PostgreSQL 18[75],InfluxDB 3 [70],SQL Server Developer Edition[71] ;Aurora DSQL 现已全面推出[72];主要的数据库实例均支持了新的 Gravition 4 实例 [73][74];Aurora DSQL正式GA[77],且支持在几秒钟内创建集群[76]; 继续使用 Zero-ETL 方式打通数据库与Redshift 、SageMaker等平台[11][13];Aurora PostgreSQL 现在支持与 Kiro powers(MCP)集成[78]

RDS 支持了 PostgreSQL 18[61]、SQL Server 2025 企业集群版、标准版[62]。RDS PostgreSQL、MySQL推出DuckDB分析实例[63][64][65];PolarDB 发布“文档数据库”MongoDB的访问能力[66]“PolarSearch”功能[4];阿里云 RDS 发布 Supabase 托管服务,帮助客户利用 Supabase / RDS PostgreSQL 能力快速构建全栈应用 [67];基于阿里云 DTS 构建了 RDS MySQL、PostgreSQL全球多活数据库(GAD)[7][68],Zero-ETL AnalyticDB等[5]

MySQL/veDB支持 RockDB [79],ARM 架构规格[80],Sequence Engine[81],Flashback Query[82],多节点实例[83];此外,还发布了DBCopilot[84]、NL2SQL[85]、MongoDB 8.0[86];补充细节竞争力,例如提供SSL加密传输[23]、varchar的Online DDL、提升IN谓词时的性能等[21];支持 veDB-Search 混合检索[87]

TDSQL-C MySQL 支持了创建“分析集群”(“LibraDB 内核”)[88]、全球数据库功能[89]、二级存储功能(Serverless 版)[90]。云数据库支持了PostgreSQL 18.0[91]、通过通过 SQL 调用大模型 API(PostgreSQL版 / tencentdb_ai )[92]、SQL Server 发布全新多节点架构(一主多备) [93]。TDSQL-C MySQL 版发布多项性能优化提升全缓存、大数据集等场景性能[94]

HeatWave MySQL 新增支持 9.2.0、8.4.4 和 8.0.41 [95]、9.3.2[97]等版本、规格 MySQL.96 [96]等。PostgreSQL 增加了对 PostgreSQL 16 、pg_cron 和 pgaudit 等支持[98];Autonomous AI Database 内支持 Select AI RAG[99]、 API for DynamoDB[100]、最新备份克隆数据库[101]、数据库恢复到特定的 SCN [102]等。

Cloud SQL 支持了 PostgreSQL/MySQL 读取池自动扩缩容[103][104]、PostgreSQL 18[105]、MySQL 8.4[107]、AI 辅助故障排除等;AlloyDB 支持了 C4 系列(288vCPU)[106]、更新 alloydb_scann 扩展[108]、自然语言查询功能[109]、自动向量化[112];Spanner 支持了向量索引和近似最近邻 [110]、更新了优化器[111]、预过滤向量索引 [113]

发布了“云原生”数据库HorizonDB[114][115]; 支持了Cassandra v5.0 [116]、MySQL 8.4[117]、PostgreSQL 机密计算[118]、PostgreSQL 18 正式发布[119]、Near-zero-downtime MySQL/PostgreSQL [120][121];Cosmos DB支持了全局二级索引[122]、Float16 的向量索引[123]、向量存储和搜索[124]、MCP工具[125]等。Azure DocumentDB 发布[126];SQL Server 2025 发布;Azure SQL 数据库 DiskANN 向量索引[127]

TaurusDB 发布 PostgreSQL 引擎支持[128]、Serverless支持冷热分离能力[129]、开放弹性策略自定义[130]、支持动态脱敏[131]、增强智能DBA SQL限流[132];RDS支持MySQL 8.4[133];GeminiDB Redis 接口性能版基于存算分离架构,单分片最高可支持百万QPS[134];GaussDB 透明多写功能发布[135];GaussDB Doer 基于AI的智能助手;openGauss 发布 MCP Server[136]

RDS 支持了数据库大版本升级[137]、线程池优化、持跨地域备份(PostgreSQL)[138];GaiaDB 支持双机房部署[139]、新增大规格[140]、一键从RDS同步[141];VectorDB 支持可视化[142]、新的CLI 支持[143]

发布新的中文名“海扬数据库”[137];发布PowerRAG、共享存储和桌面版(2c6g环境运行)[138]、轻量向量数据库 seekdb [139];seekdb 支持嵌入式、Server两种模式;发布 PowerMem[140](兼容Mem0);ODC 发布 DataPilot、诊断Agent等能力。

发布基于对象存储(例如:S3)的版本 “TiDB X” [144],使用对象存储天然具备的“扩展性”、快照等能力去实现一个具备“PB”级别扩展的 OLTP 数据库[145][146]

TeleDB 荣登 TPC-DS 全球测评总榜第二(10 TB)[147]

3. 其他

在今年国产数据库目录新增了两个新的国产数据库[33]:大云海山数据库(He3DB for PostgreSQL)、崖山数据库。去年新增的国产数据库包括[34]:GaussDB(集中式/分布式版)、TaurusDB、KingBase、神州通用、Vastbase,分布式数据库还有 TiDB、达梦、PolarDB、GBase、虚谷、TDSQL、GoldenDB、OceanBase。整个国产数据库的目录大抵就是在这个范围内了,后续相信不会再增加太多。而这些数据库也可能就组成了未来中国10~30年、甚至更长时间的数据库基础设施的格局。

Gartner 2025云数据库魔力象限发布[149],阿里云依旧处于 Leaders 象限、华为云在 Challengers 象限。Redis、Neo4j从 Visionaries 象限落入 Niche Players。

阿里云 PolarDB 打破 TPC-C 记录[3][4],以更高的性能、更好的性价比超越之前OceanBase、TDSQL创下的记录。PolarDB本次使用的使用的版本为多主集群(Limitless),总计使用2340个数据节点,56,160个cores,1170个处理器。

达梦数据库创始人冯裕才教授获2024年“CCF最高科学技术奖”[2]。获奖理由:“冯裕才教授是我国著名数据库科技工作者,长期致力于我国自主数据库的研发和产业化工作,突破了数据库共享存储集群技术,开发了达梦系列数据库,打造了国内首家数据库上市企业“达梦数据”,为推动我国基础软件产业的发展做出了重要贡献。”;达梦发布2024年度报告,该年年度营收达10.4亿,同比增长31.49%,净利润为3.6亿[148]

清华大学李国良入选ACM Fellow,以表彰其在人机协同(human-in-the-loop)数据集成与基于学习的数据库系统领域做出的重要贡献。此外,李国良还是 openGauss 社区技术委员会主席。[7]

4. 重要的收购与融资

在数据库领域,收购或融资相关的事件几乎都与“AI”相关。

MongoDB $2.2 亿收购 Voyage AI :Voyage AI 提供相比于通用模型效果更好的 Embedding 能力、以及 ReRank 模型等;这很好的补充了 MongoDB 在向量存储、搜索的能力[26][27]

Elastic 收购 Jina AI:通过收购“Jina AI”,Elastic 公司可以快速的具备更强的向量处理技术,包括更好的向量算法、更好的 ReRank 功能,可以让 ElasticSearch 在 RAG 场景(或类似场景)有更强的竞争力[25]

多云数据库平台服务商Tessell获 $6000万融资。此次融资将用于进一步扩大市场覆盖,并计划推出基于 AI 驱动的对话式数据库管理服务[150]

Databricks收购Neon[28],该产品则基于云基础设施提供Serverless的PostgreSQL服务,并且提供诸如快速Branching等能力。

Snowflake 以 $2.5 亿收购了CrunchyData[29][30],该公司提供云端企业级全托管的PostgreSQL服务,同时支持基于相关数据的分析能力;

Supabase 今年有两次重大的融资,分别是 $2 亿美元(估值$20亿)[32]、$1 亿美元(估值$50亿)[31]。凭借在开发者中良好的采用率,并随着 “Vibe coding”的流行,该公司快速起飞,可以将其理解为未来自然语言编程的基础组件。

IBM 110亿美元收购数据流厂商 Confluent[54],该公司创建于2014年,最初致力于 Apache Kafka 的商业化,逐步扩展为完整的实时数据流平台。

IBM 计划收购 DataStax,该公司基于 Apache Cassandra 提供企业级的数据库存储与AI方案[151]

MariaDB 宣布收购高可用产品 Galera Cluster。 通过此次收购,MariaDB可以向客户提供更具竞争力的企业级高可用方案;而对于 Galera 则可以获得更多可靠的客户[152]

 ClickHouse 宣布融资3.5亿美元C轮融资[153],主要用于全球化业务推进、AI与分析能力增强等方向。

5. 开源与商业

今年,Redis 将 SSPL 协议改成更容易被社区接受的 AGPL 协议, 并发布 8.0 版本[36]。但是,社区似乎已经开始逐步转向了Valkey,例如,Azure 已经计划于2027[15]、2028[16] 年停用Redis Enterprise与Azure Cache for Redis。Redis 在2024年将协议从 BSD 更改为了dual RSALv2+SSPLv1[37],而后多家大型公司“联合”起来fork了新的项目 Valkey 。

开源软件和商业软件的竞争,经过了MongoDB、Redis、ElasticSearch等与云厂商的探索,逐渐形成了某些模式:主线足够强大,则可以合作分润;主线如果稍有羸弱,则可能会被分叉出新分支;或者面临着云厂商的自研。因为对于云厂商来说,这部分收入与利润,足以支撑起在该方向的投入。

6. 相关阅读

Databases in 2025: A Year in Review

Andy Pavlo

……

Databases in 2024: A Year in Review

Andy Pavlo

Jan. 01, 2025

Databases in 2023: A Year in Review

Andy Pavlo

Jan. 04, 2024

Databases in 2022: A Year in Review

Andy Pavlo

Dec. 31, 2022

Databases in 2021: A Year in Review

Andy Pavlo

Dec. 28, 2021

What Goes Around Comes Around… And Around…

Michael Stonebraker, Andrew Pavlo

June 2024

What Goes Around Comes Around

Michael Stonebraker, Joey Hellerstein

2005

参考链接

Leave a Reply

Your email address will not be published. Required fields are marked *