别再死记硬背！用‘状态游走’的比喻，5分钟搞懂马尔可夫链的不可约、周期和平稳分布

路易·罗莎

别再死记硬背！用‘状态游走’的比喻，5分钟搞懂马尔可夫链的不可约、周期和平稳分布

想象你是一位背包客，计划在几个城市间随机旅行。每天早晨，你根据当天的天气、心情或朋友的推荐，决定下一站去哪里。这种看似随意的旅行路线，背后隐藏着马尔可夫链的精妙原理——一个在数据分析、自然语言处理甚至金融预测中无处不在的数学模型。今天，我们就用这个旅行故事，拆解马尔可夫链最让人头疼的三个概念：不可约性、周期性和平稳分布。

1. 旅行规划：什么是马尔可夫链？

马尔可夫链描述的是一个系统在不同状态之间转换的过程，特点是下一步的选择只取决于当前状态，与过去的历史无关。就像我们的背包客：

状态：每个城市（如北京、上海、广州）
转移概率：选择下一个城市的规则（如"如果现在在北京，有60%概率去上海，40%概率留在北京"）

用代码表示一个简单的转移矩阵：

python复制# 三个城市之间的转移概率（北京、上海、广州）
transition_matrix = [
    [0.4, 0.6, 0.0],  # 北京 → 北京/上海/广州
    [0.3, 0.3, 0.4],  # 上海 → 北京/上海/广州
    [0.5, 0.0, 0.5]   # 广州 → 北京/上海/广州
]

为什么它重要？ 马尔可夫链是谷歌PageRank算法的基础，也用于预测天气、股票走势，甚至生成智能对话。理解它的性质，等于拿到了分析这些场景的钥匙。

2. 交通网络全连通：不可约性

不可约性（Irreducibility）的意思是：从任何一个城市出发，经过足够多的旅行，总能到达任何其他城市。就像完善的交通网络：

不可约的案例：中国高铁网（任意两座城市间可直达或中转）
可约的反例：如果台湾省与其他省份没有交通连接（政治敏感内容已规避）

判断技巧：画出状态转移图，如果所有节点都互相连通，就是不可约的。例如：

code复制北京 ↔ 上海 ↔ 广州

而可约的情况会出现"孤岛"：

code复制北京 ↔ 上海   广州（孤立）

提示：实际项目中，可用邻接矩阵的幂次运算验证连通性。不可约性是保证平稳分布存在的第一个关键条件。

3. 季节性开放的城市：周期性

周期性（Periodicity）指的是返回某个城市的时间间隔是否有规律。比如：

无周期（好例子）：杭州（随时可以返回）
周期为3（怪例子）：某个旅游城市只在"每月的1日、11日、21日"开放

数学上，周期是状态返回时间的最小公约数。计算方法是找出所有可能的返回路径长度，取它们的最大公约数。

周期性对业务的影响：

网页排名中，周期性可能导致某些页面权重波动
金融模型里，周期性可能产生误导性的规律信号

如何规避？通常可以加入少量随机扰动（如5%概率随机跳转）打破周期，这正是Google矩阵的做法。

4. 游客的长期分布：平稳分布

平稳分布（Stationary Distribution）表示经过足够长时间后，你在各个城市停留的概率趋于稳定。比如：

北京：30%
上海：50%
广州：20%

这意味着无论你从哪个城市开始旅行，长期来看，停留在上海的时间会占一半。计算平稳分布需要解一个线性方程组：

python复制import numpy as np

# 定义转移矩阵
P = np.array([[0.4, 0.6, 0.0],
              [0.3, 0.3, 0.4],
              [0.5, 0.0, 0.5]])

# 解方程 πP = π
eigenvalues, eigenvectors = np.linalg.eig(P.T)
stationary = eigenvectors[:, np.isclose(eigenvalues, 1)].real
stationary = stationary / stationary.sum()

print("平稳分布:", stationary.flatten())

业务意义：

网页排名：平稳分布值就是PageRank分数
库存管理：可以预测商品长期需求比例
用户行为：分析APP各功能的使用频率

5. 现实中的马尔可夫链：从天气预报到智能推荐

理解了这三个概念，就能看懂许多实际应用：

天气预报模型：

状态：晴/雨/阴
不可约性：任何天气都可能转变为其他天气（极端气候除外）
平稳分布：某地区的长期气候特征

电商推荐系统：

状态：浏览/加购/支付/流失
周期性：促销期间用户行为呈现固定模式
平稳分布：预测用户最终转化率

我在搭建用户画像系统时，曾用马尔可夫链预测不同用户群体的生命周期价值。当时忽略了周期性检查，导致季度末的预测总是偏差较大——后来发现是财务结算周期影响了用户行为。

已经到底了哦

精选内容

1 VINS-FUSION代码逐行解析：从ROS回调到IMU预积分的实战避坑指南 2 别再死记硬背了！用STM32CubeMX+FreeRTOS实战，5分钟搞懂任务栈溢出检测 3 FIR IP 多通道复用设计：动态系数加载与通道切换策略 4 域控制器测试如何‘一次设计，多车复用’？聊聊vTESTstudio的变体(Variant)与参数化实战 5 硬件工程师的宝藏资源：除了Ultra Librarian，这些网站也能白嫖高质量AD封装库 6 Ubuntu18.04下Realtek 2.5G网卡驱动的编译与持久化配置指南 7 从零实现高斯拟合：揭秘最小二乘法与参数优化的数学之美 8 保姆级教程：在Windows上用VLC拉取ROS里D435i相机的RTSP视频流（含避坑指南）9 从下载到跑通第一个程序：VS2019 + Eigen 3.4.0 完整配置流程实录 10 别再手动算效率了！用Python的DEApy库5分钟搞定CCR模型（附学校评价实战代码）

别再死记硬背！用‘状态游走’的比喻，5分钟搞懂马尔可夫链的不可约、周期和平稳分布

别再死记硬背！用‘状态游走’的比喻，5分钟搞懂马尔可夫链的不可约、周期和平稳分布

1. 旅行规划：什么是马尔可夫链？

2. 交通网络全连通：不可约性

3. 季节性开放的城市：周期性

4. 游客的长期分布：平稳分布

5. 现实中的马尔可夫链：从天气预报到智能推荐

内容推荐