1. 活动背景与整体回顾
2025年12月6-7日,第十届中国开源年会(COSCon'25)在北京海淀区丽亭华苑酒店成功举办。作为同期重要活动,Pulsar Developer Day 2025汇聚了来自小红书、中原银行、360、中电金信、谙流科技及StreamNative等企业的技术专家,围绕Apache Pulsar的实践落地与技术创新展开深度交流。
这场为期两天的技术盛会呈现了以下几个显著特点:
- 聚焦企业级应用场景,覆盖金融、社交、互联网等多个行业
- 技术分享深度与实操性并重,包含大量可直接落地的解决方案
- 社区生态建设成果显著,展示了Pulsar在多领域的扩展能力
2. 核心议题与技术解析
2.1 小红书在线MQ的三层架构实践
小红书中间件团队分享了其MQ系统的特色架构设计,主要包含三个关键层级:
2.1.1 运维管控层
通过统一管控平台实现多维度的运维能力:
- 动态限流:基于实时监控的智能流量控制
- 消息追溯:支持按生产者、消费者、时间等多维度查询
- 健康检查:自动化故障检测与预警机制
技术亮点在于采用声明式API定义管控策略,通过CRD方式与Kubernetes生态深度集成。
2.1.2 Client SDK+Proxy层
该层的创新设计解决了以下痛点:
- 多语言支持:基于gRPC实现跨语言通信协议
- 协议转换:在Proxy层完成Thrift/HTTP到Pulsar协议的转换
- 流量治理:支持蓝绿发布、灰度分流等高级特性
团队特别分享了SDK治理的经验:通过改造NameServer实现接入标准化,半年内将规范覆盖率从30%提升至70%。具体措施包括:
- 新增接入强制走标准化流程
- 存量系统通过定时扫描逐步改造
- 建立SDK版本兼容性矩阵
2.1.3 MQ引擎层
团队对Pulsar核心的增强包括:
- 扩展事务API:支持更灵活的事务边界控制
- PullConsumer实现:优化特定场景下的消费模式
- 消息轨迹增强:完善端到端追踪能力
这些改进已回馈社区,成为pulsar-java-contrib的重要组成部分。
2.2 中原银行金融级消息平台建设
中原银行分享了从RabbitMQ迁移到Pulsar的完整历程,其架构演进可分为三个阶段:
2.2.1 第一代架构痛点
- 脑裂风险:RabbitMQ镜像队列在网络分区时的不可用问题
- 扩展瓶颈:单集群规模受限,扩容需要停机
- 性能局限:万级TPS下延迟显著上升
2.2.2 第二代Pulsar架构
核心组件包括:
- 定制化客户端SDK:集成金融级安全特性
- Pulsar Operator:实现声明式的集群管理
- 管控平台:提供可视化监控和运维能力
关键设计决策:
- 双活数据中心部署:基于Pulsar原生跨地域复制
- 秒级故障切换:通过健康检查与自动故障转移
- 资源隔离:利用命名空间实现业务隔离
2.2.3 智能化演进方向
银行正在探索的进阶功能:
- 智能诊断:基于历史数据的异常检测
- 预测性扩容:利用时序预测模型
- AI Agent通信:支持LLM应用的消息模式
2.3 360消息队列PaaS平台实践
360将Pulsar定位为核心在线消息平台,与Kafka形成场景互补。其技术实现有几个关键创新点:
2.3.1 性能优化
通过深度调优实现:
- 0.3ms端到端延迟(P99)
- 单分区150万条/秒吞吐量
- 50%磁盘利用率提升
优化手段包括:
- Bookie写路径优化(批处理+零拷贝)
- 分层存储策略(热温冷数据分离)
- 内存池化技术减少GC压力
2.3.2 弹性伸缩实现
自研ServerlessManager组件提供:
- 实时指标采集(毫秒级精度)
- 动态扩缩容策略(基于预测算法)
- 无感故障转移(会话保持机制)
实际效果使资源成本降低45倍,主要来自:
- 共享资源池提高利用率
- 按需分配避免过度配置
- 智能调度减少冗余副本
2.3.3 统一事件总线规划
未来架构将整合:
3. 技术创新与生态扩展
3.1 Kafka on Pulsar(KoP)深度实践
谙流科技分享的KoP方案实现了Kafka协议与Pulsar架构的无缝融合,其技术要点包括:
3.1.1 协议转换层
关键映射关系:
- Kafka topic → Pulsar topic with _kafka prefix
- 分区ID → Pulsar分区保持一致
- 偏移量 → 使用BookKeeper ledger ID+entry ID转换
3.1.2 性能优化手段
- 分片写入:提升并行度
- 零拷贝传输:减少内存复制
- 批处理优化:合并小消息
3.1.3 稳定性保障
通过混沌工程验证的故障场景:
3.2 Oxia元数据系统设计
StreamNative开源的Oxia项目针对元数据管理提供了创新解决方案:
3.2.1 架构特点
- 分片存储:水平扩展能力
- LSM Tree:高写入吞吐
- 法定人数写入:强一致性保证
3.2.2 核心API
- 条件更新:基于版本的乐观锁
- 事件通知:watch机制支持
- 会话管理:租约自动续期
3.2.3 运维特性
4. 延迟消息的混合架构实践
中电金信分享了Pulsar延迟消息的增强方案:
4.1 原生实现分析
两种模式的对比:
- InMemory:低延迟但易丢失
- Bucket:持久化但性能受限
4.2 Chronos集成方案
技术实现要点:
- 存储引擎:RocksDB优化KV存储
- 调度算法:时间轮+最小堆组合
- 推送机制:长轮询+服务端推送
4.3 混合架构优势
- 原生模式:简单场景
- Chronos:大规模延迟需求
- 可并存运行:平滑迁移
5. 社区发展与未来展望
Pulsar社区在2025年展现出强劲的发展势头:
- 企业采用率年增长80%
- 贡献者数量突破1500人
- 生态工具链日趋完善
技术演进方向重点关注:
- 云原生深度集成(Kubernetes/Wasm)
- 流批一体处理能力
- AI工作负载支持
对于开发者而言,参与社区建设有几个理想切入点:
- 协议插件开发(如MQTT、AMQP支持)
- 客户端SDK增强
- 运维工具贡献