2022云数据库技术年度盘点

引用80后初中英语课本中的一句话:“how time flies”。是不是还在突然放开后,全家感染的错(meng)愕(bi)中,是的,一年又过去了。在过去的一年中,云数据库技术行业动态一共发布了28期(参考),趁这会儿来做个年度的总结吧。

云数据库的年度发布

  • Google云发布AlloyDB(参考);火山引擎veDB公测上线
  • 阿里云数据库李飞飞发布全新品牌 “瑶池”,涵括PolarDB、AnalyticDB、Lindorm、DMS等产品,旨在打造云原生一站式数据管理与服务
  • TiDB发布了发布6.0.0版本,TiFlash正式开源,TiDB Cloud正式上线
  • OceanBase发布4.0版本,OceanBase Cloud上线
  • 腾讯云发布KeeWiDB,兼容Redis
  • SQL Server 2022发布,支持Windows和Linux,全面集成Azure云服务
  • Aurora Serverless v2 发布(参考)
  • 华为云GaussDB发布三大架构演进:Serverless、Regionless和Modeless
  • Gartner数据库魔力象限2022发布:阿里领先、腾讯再次进入、华为退出(参考)

盘点小结:可能很多开发者还没有真正摸清什么是云原生数据库,但是在云厂商一侧,云原生数据库已经是”现在进行时”了。自2014年AWS发布Aurora,2017年阿里云发布PolarDB,几乎所有的云厂商都跟进这一方向,今年,一向”高冷”的Google也发布了AlloyDB,火山引擎发布了veDB。华为云则有自己的GaussDB系列,腾讯云则是TDSQL系列。

今年,Aurora和阿里云RDS/PolarDB则又在云原生上再向前走了一大步,将数据库的Serverlss弹性能力提升到秒级别(参考)。

阿里云今年也则在数据库产品平台层面做了一个大动作,发布了全新的”瑶池”品牌,涵括PolarDB、AnalyticDB、Lindorm、DMS等产品,旨在打造云原生一站式数据管理与服务。

各个厂商都在All in Serverless

在这个充满变化的时代,数据库的Serverless是明确的。

  • AWS发布Opensearch Serverless之后,实现了整个分析类全线产品Serverless
  • AWS上线了“Neptune Serverless”
  • 阿里云RDS/PolarDB发布Serverless实现秒级弹性;几乎整个瑶池体系的数据库均在All In Serverless
  • PingCAP 推出 TiDB Cloud Serverless Tier BETA 版
  • TDSQL-C 的Serverless能力实现秒级”启停”
  • 中国信通院云大所联合阿里云发布《Serverless数据库技术研究报告》:详情

盘点小结:在AWS推出Lambda之后,就在全面的All In Serverless,整个基础服务从底层架构、基础计费、产品形态都在向Serverless发展。相比国内Serverless,AWS则有两层含义,一方面是产品规格与计费实现细粒度的按量付费;另一方面,则是全面的与AWS Lamdba等无服务产品的集成,面向用户提供一个完整的无服务的云计算服务。这一点,在阿里云近期的一篇文章中也有介绍,感兴趣的可以去阅读:关系型数据库与Serverless。国内大多数厂商的Serverless都更多的是偏向于实现前者,也就是更细粒度的变配与计费。今年,阿里云RDS在推出Serverless同时,也很快推出了Data API的能力。算是,走到了Serverless的第二层了,具体的可以参考这篇文章:云数据库RDS MySQL Serverless已来

不过,无奈,据了解,阿里云的”函数计算”使用率应该极低,与Lamdba在AWS的地位完全不可同日而语,所以,这里的Data API能够给用户提供的价值也是受限的,只能算是一个面向未来的布局吧。

开源:比看起来更困难

  • 6月,Apache IoTDB(Timecho)完成近亿元天使轮融资,专注于IoT领域时序数据存储:参考
  • 7月,开源一体化实时 HTAP 数据库 StoneDB正式发布:参考 参考
  • 8月,蚂蚁集团时序数据库CeresDB正式开源:参考
  • 9月,华为云正式开放时序数据库openGemini源代码,参考
  • 9月,火山引擎也计划将ByConity中部分模块开源:参考

盘点小结:在全球范围内,开源数据库在市场上占领着重要位置,也有非常多商业和市场成功的案例(MongoDB、ClickHouse等)。在国内,TiDB也凭借开源,在分布式关系型数据库领域取得比较高的市场知名度。在今年,也有部分大厂的数据库选择了开源,也有部分新的开源项目。值得一提的是,在之前StarRocks(原DorisDB)就是基于Apache Doris,今年SelectDB也基于Doris推出,如果围绕开源发展,其早期就要做好知识产权与品牌的管理,否则在产品发展到一定程度的时候,比较容易出问题。

近期,MariaDB 通过SPAC模式在美上市。上市后,市场预期情况并不理想,连续三个交易股价持续下跌。MySQL构筑的产品、市场、生态以及开发者心智已经非常强大,MariaDB想在这个方向再取得更大的战果,其实并不容易。

开源有多重含义,其中一重则是”市场”,通过开源培育市场,让初阶开发者、小的业务场景免费试用,然后通过原厂云服务降低用户使用成本、又或是通过企业级能力再进行盈利,从而形成商业的闭环。总的来看,这条路并不很容易。

2022中国数据库年度人物
(注:仅代表本文作者观点)

  • 阿里云数据库负责人李飞飞
  • OceanBase创始人阳振坤
  • 达梦数据库创始人冯裕才

没什么小结的,只有敬佩,他们已经/正在/将要影响中国数据库技术的发展。

虽然是寒冬,但数据库领域投资火热

虽然,在今年整个行业大环境遇冷,尤其是下半年,各个大厂纷纷裁员并收紧支出。但从投融资来看,基础软件投资与研发依旧非常火热,在今年的数据库项目方向,处于早期的项目融资就接近20亿。另外,据了解,今年还有很多项目有非常大额的融资,只是还没有公开。

整体来看,2022年可以说是一个中国数据基础软件创业的小高潮。

2020年snowflake在美国IPO,2021年Databricks融资估值达380亿美元。以这两家公司为代表的基础技术企业融资,可以说点燃了资本和技术创业的火苗,在2022年,虽然整体投资是在收缩,资本一定程度上,依旧延续了去年的势头,在基础领域资本依旧在增加下注,相比之前,只是更加谨慎了。而过去两年,消费市场投资虽然低迷了很多,但之前消费市场成长起来的大型企业,其背后的基础技术和团队都已经非常强大,这也是这波浪潮背后,除了国家基础设施被重视之外的另一个重要原因。

还可以看到,面向特定场景(图、时序、向量等)的数据库在兴起。除了经典的OLTP数据库以及分析方向,诸如图数据库NebulaGraph、时序数据库Timecho、向量数据库Milvus也在持续”发育”。

投融资的热闹,离产品的成功还有非常…非常(非常多的非常)远的距离。产品最终需要获得市场和用户的检验,非常期待这批初创企业,在未来能够成长出更多的参天大树:

  • 4月,实时数仓SelectDB完成超3亿元融资(天使和天使+轮)
  • 6月,DataStax获1.15亿美元投资,开始关注中国市场
  • 6月,开源时序数据库Timecho完成近亿元天使轮融资
  • 7月,达梦数据库科创板上市申请被受理
  • 8月,MariaDB收购地理信息技术提供商“CubeWerx”。
  • 8月,向量数据库公司 Zilliz 宣布完成 B+ 轮 6000 万美元融资
  • 8月,专注于云数据平台的大数据服务商「数新网络」完成数千万元Pre-A轮融资
  • 8月,YAOBASE云尧科技完成千万元种子轮融资,多位业内大咖作为天使投资人参与本轮融资
  • 9月,NebulaGraph获得获得数千万美元的A轮融资
  • 9月,「格睿云Greptime」完成数百万美元天使轮融资
  • 9月,「开云集致」完成千万元级别的Pre-A轮融资
  • 10月,国产数据库公司瀚高获浪潮数亿元战略投资
  • 10月,南大通用宣布完成数亿元新一轮融资
  • 10月,MonoGraphDB完成数千万元天使轮融资
  • 10月,星环科技成功登陆科创板
  • 11月,DuckDB 融资4750万美元
  • 11月,EdgeDB 宣布完成 1500 万美元A轮融资
  • 12月,达梦数据库科创板上市获批
  • 12月,MariaDB 通过SPAC模式在美上市

“脸谱化”的云数据库厂商

一直以来,文章风格都很严肃,这次轻松一点。”脸谱化”本来大多数时候是贬义词,不过这里是希望通过拟人的方式看看各个云数据库厂商的情况:如果各个云数据库厂商是一个班的同学,那么会是怎样?

  • 先说说领头羊AWS数据库。AWS像是班上的班长,成绩优秀,学习刻苦,为人诚恳,虽然已经每次考试都名列前茅,但是依旧非常努力。毕竟,后面的第二、三名各个都虎视眈眈。
  • Azure是一个回头浪子,原来对开源很抵触,云计算的起步也比较晚,但是非常有天赋,加上底子其实还是非常不错的,现在又极其努力,所以已经成为了班上的前几名。
  • GCP是一个走竞赛路线的极客,学习成绩一直一般,但是在“开源”“和“技术深度”上都非常强,一直希望通过“开源”、“数据分析”等技术能够保送到理想大学,超过前面同学。
  • Oracle像是一个数学竞赛特长生,在单个领域极其强,现在Oracle想要成为一个各个科目(云计算)都非常强的人,要和所有玩家一起参加全国统一高考,所以现在在全力的补课。不过,现在他的物理、化学(IaaS等服务)等学科落后比较多,追赶起来很吃力。
  • 阿里云是班上的学习委员,虽然出生在遥远的东方,但是学习一直非常刻苦,也很执着,加上天赋还可以,目前,也已经成为班级的前几名。
  • 火山引擎则是一个转学来的插班生,之前在机器学习、视频、分析技术上非常强,现在也进入了云计算领域,还在奋力追赶班上其他同学。
  • 华为云则是一个中等生,家境虽然殷实,但是危机不断。自己则重点发展openGauss和GaussDB和这两个方向。这个同学一直非常努力,也拿了很多的“国家奖学金”,不过因为家庭的其他事情很闹心,学习也时常分心。
  • 诸如人民云等国资云都是属于家里有矿的大户人家,也有着完全不一样的使命和目标,不过也因为身份特殊,不一定什么时候就回家继承家族产业去了。
  • 腾讯云则勉强算是班上的优等生,并在最近一次模拟考试中取得了不错的成绩。

不过,总的来说,云计算所在的学校,应该算是一个贵族学校。早期就需要非常大的投入,而且投入周期也很长,如果不是家里有矿的,则很难支撑。不过,目前,云计算的价值和其战略意义已经早就没有人质疑了,所以到底谁能够站到最后,还未可知。

其他

ARM vs x86:国内和国外云厂商都已经开始在加注ARM,不过两者的原因略有一些不同。AWS发布了新的Graviton3、Azure推出AMD实例、阿里云也发布了基于ARM的架构的RDS MySQL、PostgreSQL。在海外,推出ARM芯片核心在于从性价比角度去解决用户问题,而国内,除此之外,还在尝试去解决芯片依赖的问题。

多云:“Oracle的Larry和微软Azure的Satya宣布将进一步推进两家公司在多云战略上的合作”。多云已经是用户的必然选择,云厂商之间也在通过一些合作,增加用户使用多云的便利性。

PostgreSQL在经历一场持续的崛起:今年GCP的AlloyDB发布选择了优先支持PostgreSQL、Azure Cosmos DB也支持PostgreSQL、Google Spanner也提供了PostgreSQL接口、StackOverflow的调研等都明确显示了PostgreSQL正在经历一场慢热的崛起,大家可以考虑投入更多的关注。好了,就做这些小结吧。

祝大家自己和家人都快点从新冠中恢复过来,迎接全新的2023吧。

Leave a Reply

Your email address will not be published. Required fields are marked *