December 2022

  • 重要更新

    ClickHouse Cloud正式GA,同时,B轮融资得到进一步增加:这是由ClickHouse官方推出云服务,启用新域名:clickhouse.cloud ,类似于MongoDB的Atlas服务。目前支持在AWS构建,从Roadmap看,很快会推出GCP和Azure的版本。当前,官方会提供30天300$使用服务,感兴趣的可以去体验一下。另外,同时有消息显示ClickHouse在近期进一步增加了B轮融资的额度。

    openGauss社区新成员”兴业银行”加入,在墨天轮中国数据库排名也跃至第三:在国内,openGauss在数据库生态建设上应该是独树一帜的。可以说,在生态支持上,openGauss应该是最具诚意的国内数据库厂商。无论是用户自己基于开源进行改造,还是厂商基于openGauss发行自己的版本,openGauss都在全力支持,毫无保留。更底层的原因,大概是因为openGauss在华为所承载的使命和其他数据库厂商是所有不同的。详情

    PingCAP 成为中国唯一入选 Forrester Wave 数据库厂商:近日,国际研究机构 Forrester 发布「Forrester Wave™: Translytical Data Platforms, Q4 2022 」报告,PingCAP 作为中国唯一入围的数据库厂商,首次参评该报告即获评“Strong Performers”。Forrester 认为, TiDB 采用云原生架构,兼容 MySQL 从而减少了迁移工作量,并同时具备交易处理与数据分析能力,在多模态可扩展性和性能方面与其他供应商不相上下。详情

    动态详情

    • [阿里云] PolarDB O和PG 引擎发布多个函数和时间数据类型。
    • [阿里云] Elasticsearch 7.16版本上线北京和杭州地域,支持TimeStream时序增强引擎,并基于新技术实现集群创建及运管提效
    • [loTDB] 物联网数据库 Apache IoTDB 1.0 发布。
    • [Doris] Apache Doris 1.2.0 Release 版本正式发布,该版本提交了超过2400项优化和修复。详情
    • [AWS] Amazon Redshift在全球多个区域新增支持。
    • [AWS] DynamoDB新增支持直接从示例数据模型创建数据实例。
    • [GCP] 新增对 Bigtable 查询信息检索,帮助用户评估查询性能
    • [GCP] Spanner数据库存储度量异常,将对用户这部分账单进行调整。

    推荐阅读

    • ChatGPT 加图数据库预测 2022 世界杯冠军球队。详情
    • 杭州联合银行——大数据系列平台建设。详情
    • 你知道 SQL Server 是如何实现 MVCC 的吗?详情
    • Serverless 对数据库意味着什么?详情
    • 云原生时代数据库运维的挑战和应对措施。详情
    • 用OceanBase替换MySQL,实现高可用。详情
  • 今天晚上熬夜不是为了看伊朗对美国的比赛,而是为了AWS re:Invent 2022大会的一个分享:凌晨00:30由AWS CEO Adam Selipsky的Keynote。re:Invent是AWS最盛大的年度大会,面向AWS的开发者、生态企业、客户等,会发布未来一段时间内最重要的产品与特性。

    好了,已经很晚了,直奔主题,来看看关于数据库,AWS CEO都说了些什么。

    Amazon Opensearch Serverless (Preview)

    数据库与分析产品是整个Keynote的第一部分。首先提到的产品发布是 Opensearch Serverless,不过Adam并没有详细介绍该产品,而是强调,整个的数据分析产品体系全面实现了Serverless。

    Amazon Aurora 与 Redshift的无缝数据集成

    在介绍Integration部分的时候,Adam发布了Amazon Aurora 与 Redshift的无缝数据集成(Aurora zero-ETL integration with Redshift)。使用该特性:

    • 可以实现几乎实时的数据集成,从而实现实时分析和机器学习能力
    • 支持从多个Aurora数据库集成数据
    • 自动更新且持续可用
    • Serverless,无需维护基础设施

    Redshift支持Spark功能GA

    Adam介绍另一个Integration特性是:Redshift支持Spark。使用该特性,可以在EMR等平台上,直接运行Spark Queries对Redshift的数据进行计算,无需做任何的移动数据,支持多种语言(Java Python R等)。

    其他

    整体上,Keynote大致分成了几个部分:AWS整体价值概述、在线数据库、分析服务与产品、AI平台、集成产品与平台企业用户、权限、安全、合规管理、计算、容器、其他(供应链产品、生态体系产品、行业产品等)等。在其他部分也还有很多的产品发布,这里不一一详述,感兴趣的可以关注re:Invent官网:https://reinvent.awsevents.com 。

    个人小结

    整体上,数据库部分并没有特别大的发布。从平时的产品发布节奏来看,AWS在数据库方向的主要包括了Serverless(或者与Serverless生态的集成)、Graviton数据库实例的发布等。这次会上,CEO把在线数据和分析数据的集成单独拿出来讲,还是略感意外的。

    当下信息技术的大背景依旧是数字化,数字化带来的海量数据以及海量计算能力的需求依旧是当前企业面临的主要挑战之一。一方面,AWS在持续的、一致的通过Serverless技术去改进数据处理的模式,通过Serverless的模式去降低价格成本以及维护成本。所以这一次,发布了Opensearch Serverless之后,整个分析产品体系都实现了Serverless的支持属于预料之中。 

    另一方面,AWS也注意到ETL的困难已经在阻碍用户的数据价值发现,所以这次大会上提出了“A zero-ETL future”。同时,基于此理念(当然关系可能是反过来的),发布了“Aurora 与 Redshift无缝的数据集成”(Preview)、“Redshift支持Spark功能”(GA)。 

    个人认为,数据流动困难确实是当下企业数据价值发现的一个大的绊脚石,不过,云厂商发布的集成方案,只能是在云厂商内部,虽然可以解决局部的问题,但是,对于实际用户来说,其数据分布可能更加广泛,可能分布在多个云厂商、或者本地IDC、或者云厂商的自建环境(EC2、ECS等)等。另外,数据存储与数据分析产品的发展都非常快,远不是局限于在某个云厂商的一方产品。总的来说,通过发布一些产品的内部集成能力依旧还是很难解决当前企业的数据流动问题的。就像CloudFormation和 Terraform的关系。

    AWS re:Invent介绍

    方便理解,re:Invent大会之于AWS相当于云栖大会之于阿里云,Oracle Open Wolrd之于Oracle。在这个会上,AWS会宣布最新的产品发布和特性。从这里也通常可以看到AWS宏观上的产品规划方向。另外,这是一个盛大线下的大会,在美国的Las Vegas举行,今年大会号称约有5万人在线下参加。

    2018年线下参会回顾

    2018年11月份的时候,在前东家的支持下,与斗佛一起去参加那一年的re:Invent。虽然2015年,之前也参加过OOW,也参与和组织多次云栖大会,不过还是被re:Invent震撼了。 

    大会确实非常盛大,参加的开发者、生态企业非常多,即便是在Las Vegas,也没有一个酒店或者场所容纳这么多人,所以,大会在Vegas城区的数个大型酒店同时举行。不过,也因为酒店之间都是有一定距离的,所以,有时候需要听的session分布在不同的酒店,就会比较麻烦。当时的大会的主题是“Build”,可见,这是一个面向开发者的大会。除了主题分享,还有很多小型的workshop、培训认证、生态分享等,整体上,感觉对开发者比较友好,略微有趣,比较务实。另一个务实的体现,就是演讲内容很务实,CEO(当时是Andy Jassy)的Keynote也是非常的“干”,上来就讲技术、讲产品、讲产品特性,中间穿插几个客户案例,就结束了。这一点与国内区别非常大。 

    好了,就这些吧,真的有点晚了。

  • 重要更新

    openGauss社区技术委员会主席当选2023 IEEE FELLOW:近日,IEEE(Institute of Electrical and Electronic Engineers)公布了2023年度Fellow名单,openGauss社区技术委员会主席李国良教授当选。同时,李教授也是清华大学计算机系副主任、教授、博士生导师。当选理由:对人在环路数据管理和数据库系统的贡献。

    IEEE 是国际性的电子技术与信息科学工程师学会,在 160 多个国家拥有超过 40 万会员。IEEEFellow为学会最高等级会员,是IEEE授予成员的最高荣誉,在学术科技界被认定为权威的荣誉和重要的职业成就。详情

    2022 亚马逊云科技re:Invent全球大会:近日,在亚马逊云科技re:Invent全球大会上发布了多款数据库产品。其中, 发布了Amazon OpenSearch Serverless产品,该产品简化了运行 PB 级搜索和分析工作负载的过程,而无需配置、管理或扩展 OpenSearch 集群。在数据集成方面,重点提到了 ETL。AWS CEO 宣布  Aurora 将首次支持与 Redshift 的 Zero-ETL 集成,以实现对 Aurora PB 交易数据的近实时分析和机器学习。另外,AWS还发布了数据管理、数据洞察等方面的产品。详情阿里

    GanosV5.0发布,走向孪生全空间数据库:阿里推出了首个融合室内外、地上下多模多态数据的混合存储、查询与分析计算服务Ganos。Ganos V5.0实现了孪生全空间数据库的重磅升级,解决了全空间位置大数据使用流程复杂、使用门槛高、应用效率低等问题,为应对XG(5G/6G)、数字孪生与物联网快速发展,构建云上空天地网立体化、全空间数据管理提供了核心基础能力。作为跨数据库产品专业引擎插件,系统底层支持阿里云RDS PG、PolarDB PG、ADB PG、Lindorm等云上不同数据库产品。详情

    PingCAP DevCon 2022在12 月 1 日 至 3 日于线上精彩开启:本次大会特邀多位行业意见领袖、专家学者和技术大咖,共同探讨云原生、HTAP、Serverless、DB 微服务化等前沿数据技术趋势与发展方向,分享行业最佳实践,探索各行业云上业务和出海业务的多元化解决方案。其中 TIDB 分享了相关未来特性,如高性能全局单调递增的 AUTO_INCREMENT 列属性、TIME-To-Live 自动清理数据、Foreign Key以及TiFlash的等功能。详情

    动态详情

    • [阿里云] PolarDB-X 发布新版本,优化了超时、排序等问题。
    • [阿里云] RDS PostgreSQL 新增对透明数据TDE加密。
    • [阿里云] RDS MySQL 新增对5.7、8.0集群版实例的支持。
    • [阿里云] OceanBase发布MySQL一站式迁移OB的能力。
    • [阿里云] Redis 和 Tair 发布实例连接诊断功能。
    • [阿里云] 发布双节点架构的MongoDB,其成本低于副本集架构,可用性高于单节点架构。
    • [火山引擎] 云数据库 MySQL 发布多个功能,如更丰富的实例规格、更灵活的告警和binlog日志等策略。
    • [火山引擎] 数据传输服务 DTS GA,正式公开售卖。
    • [星环科技]正式发布5.1版本的ArgoDB,它是高性能分布式分析型数据库,在PB级数据量上提供极致的数据分析能力。详情
    • [Nebula] NebulaGraph 入选 Gartner 全球《图数据库管理系统市场指南》代表厂商。详情
    • [AWS] AWS Backup引入对 Redshift的支持。
    • [AWS] Apache Spark集成Amazon Redshift。
    • [AWS]  Redshift支持从 S3自动复制数据。
    • [Azure] Cosmos DB for PostgreSQL 支持V15。
    • [Azure] Azure 的Blob存储与 Cosmos DB for PostgreSQL 的打通,用户可以直接访问。
    • [Azure] SQL Database 和 SQL Managed Instance 对时间窗口函数增强了聚合和过滤能力。

    推荐阅读

    • Serverless时代已经全面到来。详情
    • 一文读懂火山引擎云数据库产品及选型。详情
    • DBA 角色转换的挑战与机遇。详情
    • 数据库落地实战:从分库分表到云原生的演进之路。详情
    • openGauss数据库源码解析系列文章——安全管理源码解析。详情
    • 阿里云李飞飞:用5年让PolarDB成为“国货之光”。详情