MATLAB实现Leslie人口模型：原理与实战应用

Niujiubaba

1. 项目背景与核心价值

Leslie人口模型是1945年由Patrick H. Leslie提出的经典矩阵模型，它通过考虑不同年龄段的生育率和死亡率，实现了对人口结构的动态预测。这个模型在人口学研究中具有里程碑意义，特别适合进行10-50年的中长期人口预测。

我在区域发展规划项目中多次应用该模型，发现相比传统的人口预测方法（如指数增长模型），Leslie模型具有三个独特优势：

能够反映人口年龄结构变化对整体增长的影响
可以模拟政策干预（如生育率调整）的长期效果
输出结果包含各年龄段人口分布，便于细分分析

MATLAB作为科学计算的标准工具，其矩阵运算能力与Leslie模型的需求完美契合。下面我将分享完整的实现过程，包含几个经过实战检验的改进技巧。

2. 模型原理深度解析

2.1 核心矩阵结构

Leslie模型的核心是构建一个n×n的转移矩阵L，其中n表示划分的年龄组数。矩阵包含两类关键参数：

code复制L = [ f₁   f₂   ...  f_{n-1}  f_n
      s₁    0   ...     0       0
      0    s₂   ...     0       0
      ...  ...  ...    ...     ...
      0     0   ...   s_{n-1}   0 ]

生育率参数fᵢ：第i年龄组女性平均生育女儿数
存活率参数sᵢ：第i年龄组存活到i+1年龄组的比例

注意：实际应用中通常使用5岁年龄组（0-4,5-9,...,95-99岁），这样n=20。过细的分组会导致数据获取困难，过粗则影响精度。

2.2 预测方程推导

设t时刻的人口年龄分布向量为N(t)=[N₁(t), N₂(t), ..., Nₙ(t)]ᵀ，则预测方程为：

N(t+1) = L × N(t)

通过迭代计算，我们可以得到任意年份的人口结构。长期来看，系统会趋向稳定状态，其特征由矩阵L的主特征值决定。

2.3 关键假设与局限

模型建立在三个核心假设上：

封闭人口系统（无迁移影响）
生育率和死亡率保持稳定
性别比恒定

在实际应用中需要注意：

城镇化进程会打破假设1
政策变化会影响假设2
需要单独计算男女人口时，应建立双性别模型

3. MATLAB实现详解

3.1 数据准备与预处理

首先需要准备基础数据表格，建议使用CSV格式存储：

csv复制age_group,fertility_rate,survival_rate,initial_population
0-4,0.000,0.985,1200000
5-9,0.002,0.992,1100000
...
95-99,0.000,0.000,5000

读取和处理数据的MATLAB代码：

matlab复制data = readtable('population_data.csv');
f = data.fertility_rate';    % 转换为行向量
s = data.survival_rate';     
N0 = data.initial_population; % 初始人口列向量

3.2 构建Leslie矩阵

使用循环构造更清晰，但MATLAB的向量化操作效率更高：

matlab复制n = length(f);
L = zeros(n);
L(1,:) = f;          % 第一行为生育率
L(2:n+1:end) = s(1:end-1); % 次对角线为存活率

技巧：对于大型矩阵（n>50），建议使用sparse格式节省内存：
matlab复制L = sparse(n,n);
L(1,:) = f;
L = spdiags(s(1:end-1),-1,L);

3.3 预测计算与可视化

实现50年预测的完整代码：

matlab复制years = 50;
result = zeros(n, years+1);
result(:,1) = N0;

for t = 1:years
    result(:,t+1) = L * result(:,t);
end

% 可视化
figure;
subplot(2,1,1);
plot(0:years, sum(result));
title('总人口变化趋势');
xlabel('年份'); ylabel('人口数');

subplot(2,1,2);
area(0:years, result'./sum(result));
title('年龄结构变化');
xlabel('年份'); ylabel('比例');

4. 实战改进技巧

4.1 动态参数调整

现实中的生育率会随时间变化，我们可以引入衰减因子：

matlab复制fertility_decay = 0.98; % 每年生育率下降2%
for t = 1:years
    if mod(t,5)==0  % 每5年调整一次
        L(1,:) = L(1,:) * fertility_decay^5;
    end
    result(:,t+1) = L * result(:,t);
end

4.2 结果校验方法

通过计算特征值验证模型合理性：

matlab复制[V,D] = eig(L);
lambda = max(diag(D)); % 获取主特征值
stable_growth = log(lambda); % 稳定增长率

正常情况应满足：

0.95 < lambda < 1.05（极端值说明参数有问题）
特征向量应呈金字塔分布（若出现振荡需检查数据）

4.3 常见问题排查

人口爆炸或锐减：
- 检查生育率单位是否正确（应为每位女性生育数）
- 验证存活率是否包含在正确位置
年龄结构异常：
- 确认初始人口数据质量
- 检查是否有年龄组跨度不一致
收敛速度慢：
- 尝试增大年龄组跨度
- 检查是否有存活率异常高的年龄组

5. 扩展应用场景

5.1 政策模拟分析

通过修改参数模拟政策影响：

matlab复制% 生育鼓励政策（前5年生育率提升20%）
L_policy = L;
L_policy(1,:) = L(1,:) * 1.2; 

% 医疗改善（60岁以上存活率提升5%）
L_policy(13:end,12:end-1) = L(13:end,12:end-1) * 1.05;

5.2 经济影响评估

结合抚养比计算经济负担：

matlab复制working_age = sum(result(4:13,:)); % 20-64岁
dependency_ratio = (sum(result) - working_age) ./ working_age;

5.3 区域差异比较

加载不同地区数据进行比较分析：

matlab复制[urban, rural] = deal(load('urban.mat'), load('rural.mat'));
figure;
plot(0:years, sum(urban.result), 'b', ...
     0:years, sum(rural.result), 'r');
legend('城镇','农村');

6. 性能优化建议

对于省级以上大规模人口预测：

并行计算：使用parfor循环加速迭代

matlab复制parfor t = 1:years
    result(:,t+1) = L * result(:,t);
end

GPU加速：适合超大规模矩阵

matlab复制gpuL = gpuArray(L);
gpuResult = gpuArray(result(:,1));
for t = 1:years
    gpuResult(:,t+1) = gpuL * gpuResult(:,t);
end
result = gather(gpuResult);