亿级用户登录统计与签到优化方案

Zafka

1. 高并发场景下的登录统计与签到设计挑战

在用户量达到亿级规模的互联网产品中，每日登录统计和连续签到功能看似简单，实则暗藏玄机。我曾负责过一个日活1.2亿的社交平台用户系统改造，最初用传统关系型数据库记录这些数据时，每天光是签到记录就产生近20GB数据，内存消耗更是让服务器频频告警。

这类业务有三个典型特征：高频写入（用户登录/签到时集中操作）、低频读取（主要在查询统计时使用）、数据可丢失（个别记录缺失不影响整体统计）。传统方案用MySQL等关系型数据库直接存储每条记录，就像用集装箱运沙子——资源浪费严重。我们需要更精细化的存储策略。

2. 内存节省的核心设计思路

2.1 位图（Bitmap）的魔法

用位图存储登录状态是最经典的节省内存方案。假设我们为每个用户分配一个唯一数字ID，那么：

每个bit位代表一个用户当天的登录状态
1表示已登录，0表示未登录
按天分片存储，例如20230801这天所有用户的登录状态用一个bitmap存储

对于1亿用户，单个bitmap仅需：100,000,000 bits ≈ 12MB内存。相比传统方案（每条记录至少64字节）节省了99%以上空间。

Redis的BITMAP类型原生支持这种结构，以下是用Redis实现的示例：

bash复制# 用户ID 123456 在20230801登录
SETBIT login:20230801 123456 1

# 统计当天登录用户数
BITCOUNT login:20230801

2.2 概率数据结构的选择

对于只需要近似统计的场景，Bloom Filter和HyperLogLog是更节省空间的方案：

HyperLogLog：统计UV时误差率仅0.81%，1亿用户只需12KB内存
Bloom Filter：检查用户是否登录，1亿用户约114MB内存（误差率1%时）

bash复制# HyperLogLog 示例
PFADD login:20230801 123456 789012
PFCOUNT login:20230801

2.3 连续签到的特殊处理

连续签到需要记录用户最近一次签到日期和当前连续天数。采用"日期+计数器"的紧凑存储：

bash复制# 用户签到数据结构
HMSET user:123456 last_checkin 20230801 streak 5

# 签到逻辑伪代码
if (今天 - last_checkin == 1天) {
    streak++
} else if (今天 != last_checkin) {
    streak = 1
}
update last_checkin

3. 实战优化方案详解

3.1 分层存储架构

我们最终采用的混合架构：

code复制┌─────────────┐  ┌─────────────┐
│  实时计算层  │  │   存储层    │
│ (Redis集群) │  │ (冷数据归档)│
└─────────────┘  └─────────────┘

热数据：最近30天数据用Redis Bitmap存储
温数据：30-90天数据转存到压缩的Roaring Bitmap
冷数据：超过90天的统计结果归档到列式数据库

3.2 Redis内存优化技巧

分片策略：按用户ID范围分片，例如：

bash复制# 用户ID前2位作为分片键
SETBIT login:{shard}:20230801 {user_id} 1

过期策略：设置自动过期避免堆积

bash复制EXPIRE login:20230801 2592000  # 30天后过期

内存编码：Redis会自动选择最优编码方式，但可以手动干预：
```
bash复制CONFIG SET hash-max-ziplist-entries 512
```

3.3 数据一致性保障

采用双写+校验机制：

先写Redis Bitmap
异步写入Kafka消息队列
消费者将数据落地到HBase做持久化
定时任务校验两边数据一致性

4. 性能对比与实测数据

我们在1.2亿用户的生产环境进行了AB测试：

方案	内存占用	QPS	误差率
传统MySQL	320GB	1,200	0%
Redis Bitmap	1.8GB	85,000	0%
HyperLogLog	144KB	92,000	0.81%
分层存储(我们的方案)	4.2GB	78,000	0%

5. 避坑指南与经验总结

位图稀疏性问题：当用户ID不连续时，Roaring Bitmap比普通Bitmap更省空间
大Key风险：单个Bitmap过大时会导致Redis阻塞，建议：
- 按用户ID范围分片
- 禁用KEYS命令，改用SCAN遍历

缓存穿透防护：

bash复制# 对不存在的日期初始化空Bitmap
EXISTS login:20230801 || 
SETBIT login:20230801 0 0
EXPIRE login:20230801 86400

数据迁移技巧：从旧系统迁移时：

python复制# 批量转换旧数据到Bitmap
for user in mysql.query("SELECT id FROM users"):
    redis.setbit('login:20230801', user.id, 1)
# 使用pipeline提升效率
pipe = redis.pipeline()
for i in range(1000000):
    pipe.setbit('login:20230801', i, 1)
pipe.execute()