admin

  • DTCC 2025 的 AI 部分观察

    ·

    上一次写DTCC已经是15年前了(参考:DTCC关于MySQL的未来),今天又有写一点什么的冲动了。因为要“练摊”,所以也只能是“部分”观察。

    AI 到底会如何改变数据库领域

    这次会场上,对于“佰晟智算”和“银联”在AI方向的一些探索关注的多一些,其他时间,则主要是在NineData展台“练摊”。说说一些感受吧。“佰晟科技”主要聚焦于国产化数据库的优化、监控管理等方向,最为亮眼的创新在于,将大模型的能力与“运维知识”深度的结合起来。白鳝很早就在给产品做市场预热了,所以,在产品推出比较短的时间能,就快速的获得了一些早期的种子客户。

    “银联”则是在内部的数据库管理上,做了很多的探索。银联有非常强的自主研发能力,也做了很多的智能化探索,包括Text2SQL、SQL的性能诊断等。Text2SQL很多的企业做了探索,但由于表名、列名的识别对于大模型来说,是非常困难的(一方面由于列可能非常多、而且命名比较简短),会让大模型出现非常强的幻觉问题,这使得在复杂OLTP场景,Text2SQL依旧难以胜任。但对于一些较为简单的场景,例如比较比较少,表、列都使用非常规范的时候,对于部分开发者,依旧有帮助。也注意到,有很多的企业在BI或者“取数”、“报表”场景,做了非常多的探索。

    在SQL优化的方向,AI的能力,已经得到了开发者比较一致的认可,大模型虽然可能会给出一些不太实用的建议,但是“正确”的优化建议,也总是在大模型给出的建议列表之中。这对于,DBA渐少的时代,对开发者来说,确实非常友好。

    NineData 在这个方向上,也做了很多探索,从最早发布ChatDBA以来,后续持续在“DDL转换”、“SQL 优化”、“Text2SQL”、“国产化转换”等方向去尝试,这些功能随着基础大模型的增强,以及辅助以各种优化,确实可以让开发者的数据库管理变得简单一些。

    Memobase

    还听了一场 Memobase 的分享,是一个关于大模型“memroy”的产品。创始人非常技术,整个介绍听下来,如果稍不留神,甚至不知道演讲者是来介绍 Memobase 的,而是把业界的“memroy”产品以及相关的技术栈介绍了清楚。本以为这可能是一个略微冷门的话题,但从现场的问答环节来看,开发者们在这个方向上有很多的问题要解决。

    这个是一个依旧在快速发展的方向。无论是Memobase还是Mem0,这类产品,与数据或者数据库的关系比较有趣的。简单的数据存储,即便是多模态存储,是无法简单的解决此类问题的。此类问题,当前,依旧是比较偏场景化的解决方案,例如,当天讨论的最多的,包括问答机器人、智能对话陪伴等。这些具体的场景下,产品需要深入到场景之中,才能解决开发者的问题。至于存储方案,可能不是当前最为紧迫的问题,所以存储上,可以用S3、也可以用“EloqData”、也可以考虑类似于MongoDB等其他的产品。

    Memobase 比较强调自己在 Latency 方面的优势,但是,目前来看,在一个Chat的场景下,多个百毫秒的Latency,似乎并不是问题。

    之所以,这里比较强调多模态的存储,主要在于:在这个场景中,通常会使用如下的方案,包括,使用 Graph 存储一些关联关系,例如一个人的朋友、“属性”等信息;还会大量使用json存储诸如profile、conversation 历史等信息。此外,这类方案,与RAG类似,也非常依赖注入Embedding、bm25等相似搜索,用于处理历史消息等。

    总得来说,是一个场景化的,混合的存储方案,去应对业务场景。

    创新与迭代是唯一出路

    这次在现场也与很多朋友讨论了 AI 对数据库从业者(不限于)的影响,大家也都有着类似的看法,如果你不是做基础大模型的,那么,基本上,如果你能够更好的使用 AI,那么就有可能开发者出更好的产品;如果你的产品,能够更好的使用AI的能力,你的产品可能会在市场上有更强的竞争力。

    对于开发者来说,确实应该更加积极、甚至激进的去拥抱 AI 技术。LLM从出圈到现在,一共也就两三年时间,所以,“大家的起点都一样,不要犹豫,往前跑就可以了”。

    这个说法在当初ChatGPT刚出来时,Google也有类似的论断类似:““我们没有护城河,OpenAI也没有(We Have No Moat, And Neither Does OpenAI)”。事实上,经过也就两年的时间,Google Gemini 的能力、体验与市场,已经逐步在赶上ChatGPT。

    另一方面,现在整个社会最多的风投资金、最聪明的人都聚集到了这个领域,这个领域的发展和变化,可以说是“日新月异”,这个领域一定会出现很多新的商业模式和企业。但如果,跑得晚了,后面的追赶会更加吃力。从最近的Zack如此大价钱的挖掘 AI 人才,也可能看出,即便是,最头部的厂商,在这个势头下,也是非常焦虑的。

    向量数据库是AI还是数据库

    向量存储在搜索在多个AI场景都有这广泛的使用,这次大会上,包括腾讯、华为、中兴、Oracle等厂商都介绍自己自己在这个方向的探索,包括海量存储下的性能优化、标量与向量混合查询的性能、面相RAG常见的效果优化、高效的向量缓存方案等。

    最后

    DTCC 是一年一度的数据库领域朋友聚会,非常开心。因为要“练摊”的原因,错过了很多的主题分享,今年的DTCC就简单记录如上。

  • 大语言模型非常非常强大,但也有一些弱点。例如,需要精确推理与计算的场景、实时数据(如天气)获取等。MCP则是对这类外部能力扩展的一个接口,让大模型/Agent都能够便捷的接入外部工具解决此类问题。

    本文通过演示创建一个外部计算24点的程序(MCP Server),让Cursor Agent访问LLM时具备快速的24点计算能力,从而帮助开发者快速了解如何构建一个MCP Server。该24点计算的MCP Server也已经在🤗 Hugging Face对外发布,你也可以接入你的Cursor(或其他MCP Host)进行测试(参考本文小结:在Cursor中配置MCP工具)[1]

    创建 MCP Server

    现在各种工具框架已经把MCP入门构建的门槛降低非常低了,这里将使用Gradio构建一个24点计算的程序,并以MCP Server的方式提供给各MCP Host(本文是Cursor)使用,同时将该MCP Server发布在🤗 Hugging FaceSpace上,以供其他人测试和使用。

    创建24点计算的MCP Server

    使用Gradio创建MCP的代码如下:

    #
    # A project for mcp learning by orczhou
    #
    from solve_24_game import solve_24_game
    import gradio as gr
    
    def gradio_interface(a, b, c, d):
        return solve_24_game([a, b, c, d])
    
    # Create the Gradio interface
    demo = gr.Interface(
        fn=gradio_interface,
        title="solve the 24 game/puzzle",
        inputs=[
            gr.Number(label="Number 1", value=1),
            gr.Number(label="Number 2", value=2),
            gr.Number(label="Number 3", value=3),
            gr.Number(label="Number 4", value=4),
        ],
        outputs="text",
        flagging_mode="never",
        description="Solves the 24-point game. Given a list of four numbers, it attempts to find a mathematical expression using addition, subtraction, multiplication, and division that evaluates to 24. Each number must be used exactly once.",
        theme=gr.themes.Ocean()
    )
    
    # Launch the interface and MCP server
    if __name__ == "__main__":
        demo.launch(mcp_server=True)

    Gradio 不仅可以快速构建可视化的交互界面(通常用于机器学习领域),还可以非常简单的构建起MCP Server,并将其托管于🤗 Hugging Face

        demo.launch(mcp_server=True)

    在启动时,新增mcp_server=True即可以同时启动一个与此界面“相同”的MCP Server

    左侧的代码首先创建了一个如下Web服务:

    在创建了上述的Web服务的同时,Gradio还会同时创建了一个如下Endpoint的MCP Server:

    https://orczhou-solve-24-game.hf.space/gradio_api/mcp/sse

    如果是本地运行,Endpoint则可能是:

    http://127.0.0.1:7860/gradio_api/mcp/

    这里解决24点问题的代码存储在文件solve_24_game.py中,代码参考:solve_24_game.py。如何解决24点问题并不是本文的重点,这里不做详述。

    本地运行该MCP Server

    在本地,则只需要使用python3 app.py命令即可运行:

     python3 app.py
    * Running on local URL:  http://127.0.0.1:7860
    * To create a public link, set `share=True` in `launch()`.
    
    🔨 Launching MCP server:
    ** Streamable HTTP URL: http://127.0.0.1:7860/gradio_api/mcp/
    * [Deprecated] SSE URL: http://127.0.0.1:7860/gradio_api/mcp/sse

    在Hugging Face上发布 MCP Server

    🤗 Hugging Face上可以非常方便的创建并托管简单的MCP Server。详细的介绍可以参考:Spaces as MCP servers。这里演示如何进行操作。

    前提要求

    1. 首先,你要有一个🤗 Hugging Face的账号,注册即可
    2. (可选)可能还需要进行充值与信用卡绑定
    3. 准备好🤗 Hugging FaceToken,并配置好权限

    通常,Hugging Face运行程序的资源是需要付费的。但是也有部分免费资源,例如MCP托管的时候,提供了一个免费的CPU Basic(2 vCPU 16 GB RAM)的免费资源(当前免费,未来也可能是计费的)。

    在本地代码向Space上推送的时候,则需要通过Token的方式进行认证和权限管理。

    创建 Space

    进入🤗 Hugging Face,进入Space,点击“+ New Space”创建新的Space,则进入右侧的创建表单。

    注意到,在Space Hardware选项中,这里的CPU Basic 2 vCPU 16GB是免费规格,这里用作个人测试故选择免费。

    此外,这里选择了Gradio模板进行创建。

    可以看到,这里🤗 Hugging Face把相关操作的入门门槛降到了非常低的程度,对初学者非常友好。

    提交代码

    在完成创建后,可以使用 git想仓库中提交代码,Space则会根据代码架构,完全自动化的构建一个MCP Server向公网提供服务。

    代码提交可以参考如下命令:

    git clone https://huggingface.co/spaces/orczhou/solve_24_game
    cd solve_24_game
    git add solve_24_game.py app.py
    git commit -m "mcp for 24 point game"
    git remote add origin https://huggingface.co/spaces/orczhou/solve_24_game
    git push -u origin main

    补充说明:首先在Hugging Face托管则需要把程序命名为app.py,此外,还需要编写一个requirements.txt文件说明Pythone程序需要的一些模块,这里仅需要gradio[mcp]

    cat requirements.txt
    gradio[mcp]

    调试

    这里使用Hugging FaceGradio构建的MCP服务,可以非常方便的使用可视化的界面进行查看服务,例如,在这里可以通过,如下的URL来进行查看该服务是否正常:solve the 24 game/puzzle

    此外,可以通过curl命令进行调试,以确认MCP服务是否正常:

    curl -X POST \
      -H "Content-Type: application/json" \
      -H "Accept: application/json, text/event-stream" \
      -d '{
        "jsonrpc": "2.0",
        "id": 1,
        "method": "tools/list",
        "params": {}
      }' \
      -L \
      https://orczhou-solve-24-game.hf.space/gradio_api/mcp/
    data: {
      "jsonrpc":"2.0",
      "id":1,
      "result":{
        "tools":[{
          "name":"solve_24_game_gradio_interface",
          "description":"",
          "inputSchema":{
            "type":"object",
            "properties":{
              "a":{"type":"number", "default":1 },
              "b":{"type":"number", "default":2 },
              "c":{"type":"number", "default":3 },
              "d":{"type":"number", "default":4 }
            }
          }
    }]}}

    在Cursor中配置该MCP服务

    配置新的MCP服务

    CursorSettings->Tools & Integrations中找到MCP Tools,就可以通过New MCP Server处编辑mcp.json,从而增加MCP Tools

    具体的配置,参考如下:

    {
      "mcpServers": {
        "solve_24_game": {
          "type": "sse",
          "url": "https://orczhou-solve-24-game.hf.space/gradio_api/mcp/sse"
        }
      }
    } 

    查看Cursor中MCP配置状态

    首次测试和使用MCP时,还是比较容易出错的。可以通过上述的MCP Tools处(右图)可以查看MCP的状态,已经该MCP中可用的工具。

    在Cursor中使用该MCP服务

    Agent模式下进行对话,Cursor背后的大模型就可以使用该MCP的能力。为了避免Agent生成代码(Cursor的Agent总是倾向于生成代码解决问题),故使用如下提示词提问:

    不要生成任何代码,使用工具计算如下24点问题: 2 5 5 10”。

    返回的结果如右图。可以看到,大模型拿到返回的结果(5-(2/10))*5后,进行了必要的解释与回答。MCP详细的调用过程如下,包括了使用的参数、返回的结果:

    在我的Cursor上使用该MCP

    因为这里创建的MCP Server是运行在公网环境,故在你本地的Cursor或者其他MCP Host上也可以配置和使用该MCP服务,配置的方法参考上述小结“配置新的MCP服务”,这里不再赘述。

    其他

    更换Gradio的默认配色主题

    可以使用 theme=gr.themes.Ocean()选项更改主题选项:

    # Create the Gradio interface
    demo = gr.Interface(
        ...
        theme=gr.themes.Ocean()
    )

    更多的配色主题可以参考:Theming Guide

    最后

    大模型说:“我不需要帮助,愚蠢的人类!”

  • Sysbench QPS 详细数据

    dataaliyunawsazurebaidugooglehuaweioracletencent
    469343365161521641449235137016439
    8984266853018407928324284638711999
    16155971302855117360476776261012019864
    3223331227669761126337333132821135529928
    48267402636212245164429780170301160132940
    642928428181132611950511144194411255734154
    963103330829144182206611166198051228233711
    1283145032467150662291211191198261303032735
    1923228732558153142338611244204531267735476
    2563157131954154702329110963214891291036917
    3843141932047158922304511212228941324237473
    5123138232221159782298711399227501264337992

    Latency (Event) 详细数据

    如下表格分别为:平均延迟 和 95%延迟数据。单位为:毫秒/ms。

    dataaliyunawsazurebaidugooglehuaweioracletencent
    410.3821.3944.5633.2649.6830.6219.4911.18
    814.6321.5447.7135.3050.8333.6122.5412.00
    1618.4622.1052.2539.1360.4137.7628.4614.50
    3224.6925.3059.0045.5978.5343.3650.7219.24
    4832.3132.7770.5552.5488.3250.7374.4626.23
    6439.3440.8786.8659.05103.3459.2591.7333.73
    9655.6856.04119.8278.30154.7087.24140.6551.24
    12873.2570.95152.89100.54205.82116.19176.7670.37
    192107.02106.13225.58147.74307.27168.93272.5597.40
    256145.92144.17297.73197.78420.05214.36356.72124.79
    384219.91215.58434.67299.81615.95301.73521.43184.41
    512293.55285.85576.35400.66807.65404.86727.98242.43
    dataaliyunawsazurebaidugooglehuaweioracletencent
    412.3022.2851.9442.6175.8237.5628.6712.75
    819.2922.2856.8445.7982.9640.3736.2413.46
    1624.8324.8363.3251.02104.8445.7948.3416.71
    3235.5931.9471.8362.19132.4952.8994.1023.95
    4848.3444.1789.1673.13144.9762.19130.1333.72
    6461.0853.85116.8086.00161.5174.46155.8044.17
    9684.4774.46173.58116.80215.44134.90235.7482.96
    128106.75108.68235.74147.61277.21155.80267.41153.02
    192144.97164.45369.77207.82411.96253.35404.61173.58
    256189.93219.36511.33267.41569.67356.70502.20186.54
    384292.60314.45787.74390.30802.05511.33694.45257.95
    512390.30411.961050.76511.331050.76569.67960.30331.91

    MySQL 参数对比表格

    dataaliyunawsazurebaidugooglehuaweioracletencent
    have_sslDISABLEDYESYESDISABLEDYESDISABLEDYESDISABLED
    innodb_buffer_pool_size9.75GB11GB12GB12GB11GB9GB17GB12GB
    innodb_doublewriteONOFFOFFONONONONON
    innodb_flush_log_at_trx_commit11111111
    innodb_flush_methodO_DIRECTO_DIRECTfsyncfsyncO_DIRECTO_DIRECTO_DIRECTO_DIRECT
    innodb_io_capacity200002002002000500012000125020000
    innodb_read_io_threads44NA84424
    innodb_write_io_threads44NA84444
    log_binONOFFONONONONONON
    performance_schemaOFFOFFONOFFONOFFONOFF
    rpl_semi_sync_master_enabledONNANAONNAONNAON
    rpl_semi_sync_master_timeout1000NANA10000NA10000NA10000
    sync_binlog11110001111
    thread_pool_size8NA4NA4NA164
    version8.0.368.0.418.0.41-azure8.0.32-4.0.0.58.0.41-google8.0.28-2310038.0.40-u6-cloud8.0.30-txsql
    instance_typemysql.x4.large.2cdb.m7i.xlargeGP_Standard_D4ads_v54db-custom-4-16384rds.mysql.x1.xlarge.4.haMySQL.44c
    storage_typecloud_essdio1NAcloud_enhaNACLOUDSSDNAEXCLUSIVE
    storage_size100100100100100100100100
    storage_iopsNA30003000NANANANANA
    cpu_capacity97146.673.674.553.8154.8118.8107.3

    补充测试

    在最近的两次 MySQL 测试中,都补充进行了数据量更大的测试。在原测试的基础上,修改了sysbench的数据准备参数,补充测试参数:

        # cpu-io mixed benchmark
        tables=16
        run_time=300
        table_size=5000000
        # cpu intensive benchmark
        tables=10
        run_time=300
        table_size=1000000

    根据之前的计算,在该“cpu-io mixed benchmark”下,数据总量约18.4 GB,即,该压力测试则会成为一个读IO密集型的测试。各个云厂商在该模型下的性能表现如下图:

    Sysbench QPS 详细数据

    dataaliyunawsazurebaidugooglehuaweioracletencent
    4402714999461800144920047545689
    8471729801798328827023749357010257
    16564235882810572242756848712717248
    326464368929878380572912139748224535
    486854373330078789665114857771626788
    647052372430658982699015630806727617
    967292372230769204725915960829326969
    1287421386130659324759816162838026215
    1927556403030909675747416291852827930
    2567588401730809545760316336867628165
    38476354159310010147764110285872328725
    5127693436331131060278025391880928922

    Latency (Event) 详细数据

    如下表格分别为:平均延迟 和 95%延迟数据。单位为:毫秒/ms。

    dataaliyunawsazurebaidugooglehuaweioracletencent
    417.8848.0476.0540.0049.6835.9395.6212.66
    830.5248.3280.0943.7953.2938.4140.3314.04
    1651.0480.29102.4950.3267.3642.0540.4416.70
    3289.10156.14192.8068.73100.5347.4477.0623.47
    48126.02231.39287.2798.29129.8658.15111.9432.25
    64163.32309.23375.70128.24164.7573.71142.7641.71
    96236.90463.84561.46187.66237.92108.25208.3264.07
    128310.35596.25751.37247.10302.96142.51275.0087.88
    192457.04856.601117.62356.97462.11212.04405.03123.71
    256606.961145.531494.61482.24605.40281.92531.03163.56
    384904.341659.372226.85680.65903.58671.53792.11240.53
    5121196.512109.122954.89867.321179.101705.201044.82318.47
    dataaliyunawsazurebaidugooglehuaweioracletencent
    420.7455.82104.8458.9278.6043.39787.7414.73
    833.7253.85102.9773.1399.3347.4745.7916.71
    16150.29227.40142.3997.55170.4852.89102.9721.89
    32297.92325.98262.64139.85240.0263.32344.0833.12
    48350.33397.39397.39193.38287.3881.48450.7748.34
    64390.30467.30520.62235.74303.33215.44484.4462.19
    96458.96612.21802.05325.98363.18331.91559.50137.35
    128530.08759.881109.09411.96427.07376.49612.21167.44
    192669.891352.031678.14569.67634.66467.30707.07196.89
    256831.461973.382238.47787.74816.63539.71802.05235.74
    3841191.923095.383326.551050.761191.921836.241013.60320.17
    5121589.903911.794437.271327.911561.522082.911376.60411.96

    MySQL 参数对比表格

    dataaliyunawsazurebaidugooglehuaweioracletencent
    have_sslDISABLEDYESYESDISABLEDYESDISABLEDYESDISABLED
    innodb_buffer_pool_size9.75GB11GB12GB12GB11GB9GB17GB12GB
    innodb_doublewriteONOFFOFFONONONONON
    innodb_flush_log_at_trx_commit11111111
    innodb_flush_methodO_DIRECTO_DIRECTfsyncfsyncO_DIRECTO_DIRECTO_DIRECTO_DIRECT
    innodb_io_capacity200002002002000500012000125020000
    innodb_read_io_threads44NA84424
    innodb_write_io_threads44NA84444
    log_binONOFFONONONONONON
    performance_schemaOFFOFFONOFFONOFFONOFF
    rpl_semi_sync_master_enabledONNANAONNAONNAON
    rpl_semi_sync_master_timeout1000NANA10000NA10000NA10000
    sync_binlog11110001111
    thread_pool_size8NA4NA4NA164
    version8.0.368.0.418.0.41-azure8.0.32-4.0.0.58.0.41-google8.0.28-2310038.0.40-u6-cloud8.0.30-txsql
    instance_typemysql.x4.large.2cdb.m7i.xlargeGP_Standard_D4ads_v54db-custom-4-16384rds.mysql.x1.xlarge.4.haMySQL.44c
    storage_typecloud_essdio1NAcloud_enhaNACLOUDSSDNAEXCLUSIVE
    storage_size100100100100100100100100
    storage_iopsNA30003000NANANANANA
    cpu_capacity96.6152.173.272.849.3163.4119.9108

  • 标题:阿里云RDS发布全新Supabase托管服务; IDC发布中国金融集中数据库份额Oracle/达梦/华为云领跑

    重要更新

    阿里云 RDS 发布 Supabase 托管服务,帮助客户利用 Supabase 能力快速构建全栈应用,该方案可以帮助开发者简化应用构建过程中的后端开发。

    IDC 发布2024年《中国金融行业集中式关系型数据库市场份额》,总市场规模为:11.6亿元人民币,前三分别为:Oracle、达梦、华为云[1]

    更新详情

    阿里云
    • RDS PostgreSQL支持一键交换两个RDS PostgreSQL实例的连接地址,以减少在新旧实例替换等场景下进行连接地址交换所消耗的时间。[4]
    • RDS Supabase是云数据库RDS PostgreSQL提供的托管Supabase服务,您可以利用该能力快速构建基于RDS PostgreSQL的后端服务,适用于早期方案验证(MVP)、AI应用开发、SaaS平台等多种场景。当前仅对白名单用户开放 [5]
    • RDS SQL Server支持在手动备份时通过控制台或API指定备份集的保留时长。[7]
    GCP(谷歌云)
    • Cloud SQL for SQL Server 现已提供 Active Directory 写入端点支持 [28]
    • BigQuery中,GoogleSQL 将成为通过命令行界面 (CLI) 或 API 运行的查询的默认方言 [30]
    Oracle云
    • OCI 数据库与 PostgreSQL 增加了对 PostgreSQL 16 的支持 [37]
    火山云(字节)
    • 托管 Redis 支持过期 key 管理功能[38]
    百度云
    • GaiaDB 支持保定地域双机房部署,提升产品的同城容灾能力 [41]
    AWS(亚马逊云)
    • RDS for PostgreSQL 和 RDS for Oracle 的Redshift零 ETL 集成现已推出[42]
    • Amazon RDS for Db2 支持使用 Kerberos 进行组授权[43]
    • Timestream for InfluxDB 现支持 24xlarge 内存优化实例[46]
    • RDS for PostgreSQL、MySQL 和 MariaDB 现已在其他 AWS 区域支持 M8g 和 R8g 数据库实例[55]
    • Amazon RDS for PostgreSQL 18 Beta 2 现已在 Amazon RDS 数据库预览环境中推出[62]
    腾讯云
    • 云数据库 MySQL 发布数据库代理版本1.3.18。[70]
    • TDSQL-C MySQL 版发布数据库代理版本1.3.17。[71]
    • TDSQL-C MySQL 版8.0内核版本更新3.1.16.002,提升数据库性能与稳定性。[72]
    • TDSQL-C MySQL 版只读分析引擎发布了全新的内核版本3.2503.1.0,支持了诸多全新的内核特性。[73]
    • TDSQL-C MySQL 版本支持了创建“分析集群”。分析集群可为用户提供更加高效的数据分析查询与数据汇聚能力。分析集群可将多个数据源的库表数据实时同步到一个“只读分析引擎”实例中。分析集群采用“LibraDB 内核”,可提供高性能的复杂分析查询能力。[74]
    • 云数据库 SQL Server 支持设置事件告警,使用此功能便于用户第一时间获知运维事件及其他事件的动态。若系统检测到对应异常事件,将通过多种可选的方式向接收对象发送事件告警通知。[75]

    参考链接

  • 标题:华为云HDC发布TaurusDB PostgreSQL版;IDC报告发布阿里云数据库第一,华为云本地部署第一;OceanBase发布中文名“海扬数据库”

    重要更新

    华为云HDC大会,数据库发布:GaussDB Doer 基于AI的智能助手; TaurusDB for PostgreSQL 全新引擎于正式发布; GaussDB 透明多写功能发布[31]

    IvorySQL 2025 生态大会暨 PostgreSQL 高峰论坛于6月27日—28日在济南成功举办。本次盛会汇聚了包括开源基金会/社区负责人、PostgreSQL国内外资深开发者、企业代表及资深开发者。[1]

    OceanBase CEO 杨冰全新发布 OceanBase 品牌中文名——“海扬数据库”。[2]

    IDC 2024下半年中国关系型数据库市场报告:阿里云数据库整体、公共云第一[15];华为云数据库本地部署市场份额第一![3];腾讯云增速第一[11]

    今日,SIGMOD行业学术会议上:阿里云PolarDB数据库蝉联SIGMOD最佳论文奖[12];华为多篇论文成功入选,GaussDB同步亮相[19]

    PingCAP 荣登 2025 AI Cloud 100 China 榜单,排名第四![22]

    更新详情

    • RDS PostgreSQL Serverless极致弹性免费体验功能发布,在瑶池数据库解决方案体验馆中,您无需购买任何资源,即可在线体验Serverless功能的智能弹性能力[4]
    • 云数据库RDS提供无感数据集成(Zero-ETL)功能,用于将RDS数据同步至数据仓库(AnalyticDB PostgreSQL),您无需搭建或维护数据同步链路,且数据同步链路不收费[5]
    • RDS 高性能云盘的基准IO性能提升,IOPS最高提升22400,IO带宽最高提升350 MB/s。[6]
    GCP(谷歌云)
    • Cloud SQL Enterprise Plus 版实例的写入端点功能现已正式发布 [14]
    • 数据库迁移服务支持异构 SQL Server 到 PostgreSQL 的迁移 [25]
    • Google云发布 Spanner CLI(内置于 Google Cloud CLI 的 Spanner 交互式 Shell)直接连接 Spanner 数据库并与其交互 [30]
    Oracle云
    • HeatWave:支持版本 9.3.2[39]
    火山云(字节)
    • 云数据库 MySQL 提供新的实例类型——多节点实例。多节点实例采用了一主多备的集群架构,支持自动故障切换和手动切换[13]
    • 缓存数据库 Redis 优化大 Key 分析功能[16]
    • 文档数据库 MongoDB 支持更多 OpenAPI 接口 [17]
    百度云
    • 托管 PostgreSQL 支持跨地域备份恢复,从异地的BOS快速拉取已备份的文件恢复数据,保障业务连续性。[42]
    • 托管 PostgreSQL 支持跨地域备份。[43]
    • GaiaDB 新增独享型和通用型计算节点规格,超大规格(64核及88核)为白名单功能[44]
    • GaiaDB 支持一键从RDS实例同步数据至新的GaiaDB集群[45]
    AWS(亚马逊云)
    • Amazon Keyspaces(适用于 Apache Cassandra)现在支持变更数据捕获 (CDC) 流[48]
    • Amazon Aurora MySQL 和 Amazon RDS for MySQL 与 Amazon SageMaker 的集成现已推出[51]
    腾讯云
    • 云数据库 MySQL 只读分析引擎发布了全新的内核版本3.2503.1.0,支持了诸多全新的内核特性。[69]
    • 云数据库 MySQL 只读分析引擎新增支持了新加坡、成都地域。[70]
    • 云数据库 MySQL 5.7内核版本更新20250510。[71]
    • 云数据库 MySQL 只读分析引擎发布了全新的问题修复版本2.2410.8.0。[72]
    • 云数据库 MySQL 只读分析引擎发布了全新的内核版本2.2410.7.0,支持了诸多全新的内核特性。[73]
    • TDSQL-C MySQL 版只读分析引擎发布了全新的问题修复版本2.2410.8.0。[74]
    • TDSQL-C MySQL 版只读分析引擎发布了全新的内核版本2.2410.7.0,支持了诸多全新的内核特性。[75]

    参考链接

  • 最近

    ·

    最近参加了很多的线下的活动,包括了ACMUG、AWS 中国峰会、华为云HDC、IvorySQL & PostgreSQL生态大会,另外,还泡了一些杨梅酒、看了《长安的荔枝》,公司的产品“NineData”社区版发布了4.2.0。

    最近下线的活动很多,包括OceanBase、TiDB、各个云数据库厂商、各个数据库社区等,都在积极的组织一些社区活动,总的感受是,活动虽然很多,但开发者们对线下活动的热情是在减退的,而如果一场活动与AI关系不大,那么来现场的人一般是对这个技术的“真爱”。

    华为云的 HDC

    在上周末,受华为云数据库的朋友邀请,去参加华为云的 HDC 大会(开发者大会)。最近几年,和华为云的数据库合作比较多,也结识了很多华为云数据库团队的人。虽然数据库技术都是一样的,但每家公司都有着自己非常独特的环境与基因,有这自己不一样的风格。华为云数据库,感受着更多来自客户与一线的炮火,有着更接地气的拼劲。而整个公司因为在全球范围内的制裁压力,反而激发了更强的凝聚力。这次HDC大会上,华为云数据库发布了:GaussDB业务透明多写能力、“GaussDB Doer”一个面向华为云数据库的运维助手、TaurusDB for PostgreSQL

    此外,这次的HDC是在华为的松山湖园区,这是一个非常有特色的欧洲式建筑园区,随手拍了几张石雕,感受一下:

    前面的骑马的女神,大概是雅典娜
    拿着美杜莎之盾,大概是伯尔修斯
    经周陌认证,中间大概是波塞冬
    奥古斯都 屋大维

    ACMUG

    今年是 MySQL 30 年,这次成都的线下活动算是特别盛大的一次了,成都虽然有点远,但 MySQL 领域很多的有影响力的人去了。活动本身除了白天严肃的分享议题之外,下午、晚上大家随意闲聊各种八卦似乎要更有趣一些,这大概也是更多人参加的动力吧。

    亚马逊中国峰会

    这是因 NineData 赞助而去参加的活动,是以合作伙伴的身份参加的。Amazon的峰会在2015年的时候曾在上海参过一次,2018年还曾去过Vagas参加过一次re:Invent。Amazon 在全球云计算领域的地位依旧遥遥领先,但中国是一个特别的地方,确实很特别,无论是 Oracle 还是现在的 Amazon ,在全球大杀四方的时候,在中国却寸步难行,到底是谁的问题,一时难下结论,但这也确实给中国的厂商们留下一些时间和机会。

    云计算是现代应用非常底层的基础技术,而亚马逊作为一家美国的企业,要在中国开荒拓地,如果国际合作关系没有好转,未来大概是难有好转的。

    社区版发布4.2.0

    此外,这段时间,NineData 的社区版也发布了4.2.0,这是一个免费的(但不开源)数据库迁移同步工具,该免费版本中可以非常方便的帮助开发者完成诸如MySQL迁移、PostgreSQL迁移、Doris同步等工作。但如果是重要的生产环境或者需要长期运行的关键链路,则依旧建议考虑采购企业版。

    IvorySQL & PostgreSQL 生态大会

    这次大会主要由“瀚高”数据库团队在背后主办,是非常赞的活动,大会上有着关于 PostgreSQL 数据库方方面面的技术话题。这次参会,也认识了更多的 PostgreSQL 方向的开发者们。

    正如自己数年的感受一样:“PostgreSQL 在经历一场慢热的崛起”。从过去两三个月的两场收购(Neon、Crunchy Data)来看,在 AI 时代,PostgreSQL 依旧是在潮头的。

    杨梅酒

    最近几年,越来越体会到,杨梅是一种极为美味的水果了。杨梅大概在每年的6月初成熟,到了月底则已经逐渐下架,又因为其运输和保存都非常困难,也让这口美味,更显难得。江浙一带的杨梅种植技术大概是非常强的,这里的杨梅品种是非常独特的,甜中带着酸、酸中偷着甜,早上从台州一带的树上摘下,中午或晚上送到杭州,简单清洗一下,吃上十个八个,实为人间难得的美味。

    杨梅因为表面没有保护的表皮,所以其运输的难度比起荔枝要难数十倍。“杨贵妃”大概是没有尝过江浙一带的杨梅的,否则,则可能每年下江南一次。想运到长安或洛阳,不要说古代,即便是现在,都有一些困难的。

    喝酒这件事情,我大概是“人菜瘾大”的那类。在听说可以用杨梅泡酒后,从去年起就做了一些尝试。今年的杨梅酒已经按经验泡制、封存,约两个月后就可以品尝了。届时,如果感兴趣的,可以来我家“尝一尝”。

    长安的荔枝

    今年,一个多年未见的小学同学给我寄了一箱来自岭南一带的荔枝,放了半箱再公司,剩下的自己和家人吃了部分,上下楼的邻居也送了一些些。在此,代这些吃上荔枝的人一并感谢这位多年未见的同学。

    公众号久不更新,甚是心慌,记录如上,算是交代。