• Welcome to HiddenMerit - Clyde's Blog
  • Welcome to try the game Torn: Referral Link
  • If you are my relative, friend, or netizen, quickly press Ctrl+D to bookmark Clyde's Blog
  • This site has a like feature. If you read any article, please hit the like button so I know someone has visited
  • Email: hiddenmeritATgmail.com (replace AT with @)

第四期:云原生PostgreSQL的分布式架构演进

DBA Clyde Jin 4周前 (04-23) 16次浏览 0个评论

第四期:云原生PostgreSQL的分布式架构演进

从分片到存算分离,2026年PostgreSQL如何征服大规模数据挑战

在前三期技术专题的铺垫下,我们已经看到PostgreSQL 18/19的内核能力持续增强,向量检索与图查询等AI生态能力快速融合。而真正驱动PostgreSQL完成“单机数据库→综合性数据平台”这一角色跃迁的底层力量,源自云原生架构的深刻变革。

2026年的PostgreSQL分布式生态,正在经历一场从“分片扩展”到“存算分离”的范式迁移。当Citus、Apache Cloudberry等社区主力持续进化的同时,Google Cloud推动的逻辑复制向主动-主动架构演进、阿里云Serverless Pro模式对存算分离的工程化落地,以及EDB、Aurora、YugabyteDB等商业与开源力量的齐头并进,共同勾勒出一幅云原生时代的分布式PostgreSQL全景图。

一、Citus 14.0:将PG 18的力量带到分布式集群

作为PostgreSQL生态中应用最广泛的分片扩展,Citus在2026年2月迎来了14.0版本,其核心使命是完整适配PostgreSQL 18。

1.1 PG 18能力在分布式集群中的“免费午餐”

Citus的实现方式决定了它作为PostgreSQL扩展的本质:一个Citus集群本质上是多个独立PostgreSQL实例(协调器+多个工作节点)共同工作。这意味着,一旦Citus与新版PG完成兼容性适配,绝大多数上游改进无需额外开发即可“自动生效”。在Citus 14.0中,PG 18的以下能力被直接带入分布式场景:

  • 异步I/O:分片密集的分布式集群中,顺序扫描、位图堆扫描和VACUUM操作从AIO中获得显著加速;
  • 跳跃扫描:在多租户应用中,跳过分布列前缀的查询也能有效使用多列索引;
  • uuidv7():时间有序的UUID在各分片间生成,减少跨分片索引的随机写入开销。

1.2 仍需Citus定制的领域

尽管如此,某些复杂功能仍需Citus团队进行专项适配——包括JSON_TABLE()在分布式查询中的支持、DDL传播的正确性验证,以及PG 18新增时态约束在分片语义下的一致性保证。对于已经或计划采用Citus分片架构的企业而言,14.0是一个值得规划的升级节点。

二、Apache Cloudberry 2.1.0:MPP数据仓库的开源新力量

2026年4月,Apache Cloudberry(孵化中)发布了2.1.0版本,这是继2.0.0正式进入Apache孵化器后的首个重要更新。

Cloudberry的核心定位是MPP数据仓库,继承自Greenplum Database最后一代开源代码,专为大规模分析型工作负载和AI场景设计。2.1.0的核心突破包括:

  • UDP2互联协议:全新实现的计算节点间通信协议,提升分布式查询的执行效率;
  • ORCA优化器增强:支持CTE剪枝和部分聚合下推,多项正确性与内存修复;
  • PAX列存格式LZ4压缩:提升存储效率,配合I/O和内存管理优化;
  • 快速ANALYZE:针对追加优化表的统计信息收集加速,解决大规模环境中的运维瓶颈;
  • MCP服务器:便于与LLM工具和AI工作流集成。

Cloudberry的出现填补了PG生态在“分析型MPP数据仓库”领域的空白。与Citus侧重OLTP/HTAP场景的分片架构不同,Cloudberry沿袭了Greenplum的列式存储与大规模并行执行引擎,与PG 18/19的内核新特性形成互补。值得注意的是,其内核版本目前仍基于PG 14.x,团队正积极推进向PG 16.x的升级,未来内核版本的追赶将是Cloudberry的关键看点。

三、Google Cloud:推动逻辑复制迈向“主动-主动”架构

Google Cloud在2026年初发布的一份社区贡献报告,勾勒出一条清晰的演进路径:让PostgreSQL的逻辑复制从主-从模式走向主动-主动(active-active)架构。

3.1 自动冲突检测:打破双向复制的长期瓶颈

逻辑复制的传统局限在于双向写入场景下,冲突更新可能导致复制中断。Google Cloud工程师向PostgreSQL上游贡献的关键能力是自动冲突检测——数据库在复制过程中可自动识别行级冲突,无需人工干预。这一能力是多节点写入场景的核心突破,也是迈向主动-主动架构的前提条件。

3.2 序列复制与pg_upgrade优化

其他关键贡献包括:将逻辑复制范围从表数据扩展到序列,大幅减少迁移或版本升级时的手动同步需求;修复订阅管理中的自死锁问题;对pg_upgrade的大对象管理优化,缩短大规模部署的升级时间。此外,Google还正在研发复制结构化冲突日志、pg_dump并行数据导出等未来能力。

社区对此反响热烈:Franck Pachot指出,带冲突解决的双向逻辑复制与CockroachDB/YugabyteDB等分布式SQL存在不同的一致性模型基础——前者遵循“最后写入胜出”,后者提供严格ACID语义。但更多观点认为,当超大规模云厂商将主动-主动复制这类企业级特性贡献到上游时,标志着PostgreSQL已成为无可争议的企业默认选择。

四、阿里云Serverless Pro:存算分离的工程化落地

如果说Google Cloud从“复制”维度推动分布式演进,阿里云则从“架构”维度给出了另一条答案——Serverless Pro模式,以存算分离为底座,重塑云原生PostgreSQL的弹性边界。

4.1 从有状态到无状态:架构的范式迁移

传统AnalyticDB PostgreSQL版采用Master/Segment架构,计算节点绑定本地ESSD,数据增长带来存储成本的线性上涨,计算节点有状态导致扩缩容慢;一写多读只能通过“新建集群+复制数据”实现,周期长且存储成本成倍增加。

Serverless Pro模式将持久化数据统一沉降到OSS对象存储,本地ESSD仅用于缓存与临时数据,使计算层趋于无状态。计算与存储解耦后,算力可独立扩缩——峰值快速拉起,低谷及时回收,存储按需付费,避免被本地盘长期绑定。

4.2 Virtual Warehouse:读写分离的极致版本

基于共享存储底座,Serverless Pro支持“主集群+多Virtual Warehouse(VW)”的多集群共享存储架构。主集群处理写入任务,只读业务由独立VW承载,大查询不再抢占主集群资源。创建VW无需复制数据,读扩展从传统“天级数据复制”缩短为“分钟级资源拉起”;多个VW共享同一份底层数据,避免为每个只读集群重复购买存储。

4.3 Log-as-Database的设计思想

Serverless Pro的底层基于“Log-as-Database”思想:将数据库的“随机写Page”转化为WAL的“顺序写”,由存储侧异步回放WAL生成数据页,使最终数据长期驻留在OSS上。其四层架构(计算节点→Log Store→Page Store→OSS)清晰呈现了存算分离的工程全貌。

阿里云已于2026年3月30日正式下线旧版Serverless模式,Serverless Pro成为其云原生数据仓库的标准入口。

五、其他云原生分布式力量

方案 架构路线 关键特点 适用场景
EDB Postgres Distributed 原生分布式 高可用、性能与弹性,全球级分布式支持 企业级全球部署
CloudNativePG 1.29 Kubernetes Operator 8k+ GitHub星标,扩展模块化解耦,供应链安全 K8s环境PG运维
Stolon K8s HA管理器 etcd集群状态管理,自动故障切换 容器化高可用部署
Amazon Aurora PostgreSQL 云托管存算分离 5倍吞吐量,自动存储扩展,Blue/Green切换 云上托管OLTP
CockroachDB 协议兼容版 PG线缆协议兼容,Raft分布式共识,跨地域强一致 全球分布式事务
TiDB for PostgreSQL 协议兼容版 TiDB分布式架构 + PG兼容API层,代码迁移成本低 MySQL/PG混合迁移

协议兼容版指在API层面模拟PostgreSQL通信协议、底层为自研架构的产品类型。这类产品基于云原生基础设施构建,可提供跨区域强一致性与水平读写扩展等原生PG难以实现的能力。

六、总结与展望

回顾2026年云原生PostgreSQL分布式架构的演进全景,四条主线贯穿始终:

第一条主线:分片扩展的持续进化。 Citus 14.0完成了PG 18的完整适配,让异步I/O、跳跃扫描等底层性能红利在分布式集群中兑现。作为分片扩展的代表,Citus持续巩固其在OLTP/HTAP场景的领先地位。

第二条主线:MPP数据仓库的生态新生。 Apache Cloudberry 2.1.0的发布填补了PG生态在分析型MPP领域的空白。继承自Greenplum的列存引擎与大规模并行执行能力,为大数据分析提供了开源新选择。

第三条主线:云厂商驱动的基础能力跃迁。 Google Cloud推动逻辑复制迈向主动-主动架构,阿里云Serverless Pro以存算分离重塑弹性边界。云厂商不仅将PG作为服务对外提供,更将内部大规模运维的实践经验反向贡献给上游社区。

第四条主线:多样化分布式生态的百花齐放。 EDB Postgres Distributed面向企业级全球部署、CloudNativePG成为K8s上PG运维的事实标准、CockroachDB与TiDB等协议兼容版以自研分布式架构满足极端扩展需求——不同的架构路径服务于不同的场景诉求,共同构成了2026年PG分布式生态的完整图景。

回看过去一年的分布式架构演进,一个清晰的趋势正在浮现:PostgreSQL正在从“一个可以被分布式的数据库”演进为“一个原生具备分布式能力的数据平台”。 这种变化不仅体现在技术能力上——存算分离、主动-主动复制、MPP分析引擎;更体现在生态格局上——从单一的分片扩展,走向多种架构路线共存的分布式生态系统。

对于企业架构师和技术决策者而言,2026年的选择前所未有的丰富:是采用轻量级的分片扩展(Citus),还是部署完整的MPP数据仓库(Cloudberry);是依赖云厂商托管的Serverless模式,还是基于Kubernetes自建云原生运维体系——每一条路径都有成熟的开源生态和商业支持作为后盾。

这正是云原生PostgreSQL时代最值得关注的价值:企业可以在不牺牲PostgreSQL生态兼容性的前提下,根据自身的规模、场景和运维能力,选择最适合的分布式演进路径。

📌 下期预告:第五期——PostgreSQL扩展开发实战:用Rust构建自己的PG扩展 从pgvector到VectorChord,从ParadeDB到Citus,PG生态的强大生命力源自其可扩展的内核架构。第五期我们将深入扩展开发实战,以Rust为开发语言,从零构建一个完整的PG扩展,带你掌握PostgreSQL扩展开发的全流程——从环境搭建到Cargo integration,从数据类型定义到性能优化。

(本文数据截至2026年4月,最新动态请以各项目官方发布为准。)


绩隐金 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:第四期:云原生PostgreSQL的分布式架构演进
喜欢 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址