从KDD2021看生鲜零售：因果推断与反事实预测如何驱动动态定价

王羽翊

1. 生鲜零售的动态定价难题

生鲜零售行业一直面临着一个棘手的挑战：如何在商品保质期内实现利润最大化？想象一下，你经营着一家生鲜超市，货架上的蔬菜、水果、肉类都在与时间赛跑。这些商品的新鲜度就是它们的生命线，一旦过了最佳销售期，不仅价值骤减，还会造成直接的经济损失。

传统定价策略在这里显得力不从心。大多数生鲜商品的历史价格数据非常稀疏——一个商品可能只有1-2个历史价格点。这就好比试图用两三个数据点画出一条准确的曲线，几乎是不可能的任务。更复杂的是，价格变动会引发连锁反应：折扣力度变化会影响销量，而销量变化又会影响库存周转速度，进而影响最终的利润。

盒马鲜生的研究团队在KDD2021上发表的论文，正是针对这一行业痛点提出了创新解决方案。他们巧妙地将因果推断与反事实预测技术应用于动态定价，通过半参数模型和MDP（马尔可夫决策过程）框架，实现了在不确定性环境下的最优定价决策。

2. 因果推断：破解价格与销量的因果关系

2.1 从观测数据中挖掘因果

要制定科学的定价策略，首先需要准确理解价格变动如何影响销量。这听起来简单，实则充满陷阱。因为在实际经营中，我们只能观察到某种价格下实际发生的销量，而不知道如果采用其他价格会发生什么——这就是著名的"反事实问题"。

盒马的解决方案是构建一个半参数模型，巧妙结合了机器学习的预测能力和经济学模型的可解释性。模型的核心思想是将销量变化分解为两部分：基础销量（由商品特征决定）和价格弹性（由折扣力度决定）。具体来说，他们使用XGBoost等非参数模型预测基础销量，同时设计了一个参数化的价格弹性模型来捕捉折扣的影响。

2.2 价格弹性模型的精妙设计

价格弹性模型的设计体现了业务洞察与技术创新的完美结合。考虑到不同品类商品对价格敏感度不同，模型引入了品类层级结构：

一级品类（如生鲜）
二级品类（如水果）
三级品类（如苹果）

这种层级结构使得模型能够共享相似商品的数据，解决了单个SKU数据稀疏的问题。模型公式看起来可能有些复杂，但核心思想很简单：销量变化与价格变化呈对数线性关系，且不同品类有不同的斜率（弹性系数）。

实际应用中，这个模型可以回答关键业务问题："如果我将这款商品打8折，销量会增加多少？"而不仅仅是"在当前价格下，预计能卖多少"。

3. 反事实预测：看见未发生的可能性

3.1 从"是什么"到"如果...会怎样"

传统预测模型只能告诉我们"在当前情况下可能会发生什么"，而商业决策更需要知道"如果采取某种行动，结果会怎样"。这就是反事实预测的价值所在。

盒马的模型通过构建反事实需求曲线，能够预估在任何可能的折扣下的销量情况。这就像拥有了一个虚拟实验室，可以在实施定价策略前测试各种可能性。技术实现上，他们采用了双重机器学习框架，有效控制了混杂变量的影响。

3.2 处理数据稀疏性的创新方法

生鲜零售的一个典型特征是很多商品只有很短的生命周期，可能只有几天甚至几小时。这意味着我们很难积累足够的历史数据来训练模型。

研究团队的解决方案颇具创意：利用商品类目信息进行数据聚合。虽然单个苹果的数据很少，但所有水果的数据结合起来就能揭示更普遍的价格-销量关系。然后通过品类层级结构，这些知识可以传递到具体商品上。这就像用整个森林的特征来推断一棵树的行为。

4. 多阶段优化：在不确定性中寻找最优解

4.1 将预测转化为决策

有了准确的销量预测只是第一步，如何将其转化为最优定价策略是更大的挑战。盒马团队采用了MDP框架，将定价问题建模为多阶段决策过程。

在这个框架中：

状态：商品的当前库存量
行动：选择的折扣力度
奖励：实现的利润
状态转移：销量带来的库存变化

这种建模方式自然地考虑了时间维度上的决策影响，避免了短视的局部最优。

4.2 处理预测的不确定性

任何预测都有误差，在生鲜零售中尤其如此。传统的优化方法往往忽略这种不确定性，导致方案在实际中表现不佳。

盒马的创新之处在于明确建模了需求的不确定性。他们假设实际销量服从以预测值为参数的泊松分布，从而可以计算各种可能结果出现的概率。基于此，他们设计了一个两阶段优化算法：

反向求解：从最后一天倒推计算每个状态的最优价值
联合优化：综合考虑所有门店的情况确定全局最优定价

这种方法在实践中表现出色，能够平衡探索（尝试新价格）和利用（选择已知好价格）的矛盾。

5. 实战效果与行业启示

5.1 显著的商业价值

根据论文报告，这套系统在实际应用中带来了接近20%的GMV提升。在零售行业，特别是利润率本就薄弱的生鲜领域，这样的改进堪称革命性。

具体来说，系统实现了：

更精准的折扣力度：避免过度降价导致的利润损失
更快的库存周转：减少商品过期浪费
更灵活的策略调整：根据实时数据更新定价

5.2 广泛的应用前景

这套方法论的价值不仅限于生鲜零售。任何面临以下特征的商业问题都可以借鉴：

决策会影响关键结果（如价格影响销量）
历史决策数据有限或存在偏差
需要在多阶段中做序列决策
结果存在显著的不确定性

典型的应用场景包括：

电商平台的优惠券发放
服务行业的动态定价
营销预算的分配优化
客户服务的补偿方案设计

6. 技术落地的关键考量

6.1 模型的可解释性与业务信任

在商业场景中，最好的模型如果不能被业务方理解也很难被采纳。盒马的半参数模型设计在这方面很有优势——价格弹性部分有明确的经济学解释，而基础销量预测则利用了强大的机器学习能力。

实施这类系统时，建议：

提供直观的可视化（如价格-销量曲线）
设计AB测试框架验证效果
保留人工override的通道

6.2 系统架构与实时性要求

生鲜定价对时效性要求极高，特别是保质期短的商品可能需要每小时更新价格。这对系统架构提出了挑战：

特征工程的效率
模型更新的频率
决策响应的速度

在实践中，可以采用分层架构：

离线层：训练基础模型
近线层：周期性更新参数
在线层：实时预测与决策

7. 未来发展方向

虽然盒马的解决方案已经相当成熟，但仍有改进空间。几个值得关注的方向包括：

商品间相互影响的建模：当前模型主要考虑单个商品的价格弹性，而实际上商品之间存在替代和互补关系。比如苹果降价可能影响梨的销量。
更精细的不确定性建模：泊松分布假设可以进一步优化，特别是对于销量波动大的商品。
个性化定价：结合用户画像数据，实现因人而异的动态定价，同时考虑公平性约束。
强化学习的应用：MDP框架已经很接近RL，可以探索更先进的RL算法来优化长期收益。

这套方法论最令人兴奋的地方在于它的通用性。随着技术的不断成熟，我们有望看到更多行业从"经验定价"转向"智能定价"，实现资源配置效率的全面提升。对于从业者来说，理解这些技术背后的思想，比掌握具体公式更为重要。毕竟，在快速变化的商业环境中，适应力和创新力才是最持久的竞争力。

已经到底了哦

精选内容

1 从零到一：在Win11与VS2022上部署OpenSceneGraph 3.6.5的避坑实战指南 2 别再只盯着Mask R-CNN了！用Panoptic FPN在Cityscapes上实战全景分割（附代码）3 别再死记硬背ROC曲线了！用Python+Sklearn手把手带你画一遍，彻底搞懂AUC 4 STM32 ADC+DMA实战：手把手教你驱动XGZP6847A压力传感器（附完整代码）5 SAP ALV 数字格式化：从例程到字段属性的优雅实践 6 Uni-app 之uParse 富文本解析实战避坑与性能优化指南 7 保姆级教程：用busctl命令行工具玩转OpenBMC的D-Bus（附传感器查询实战）8 【机器学习实战】从理论到实践：用sklearn决策树构建你的第一个分类器 9 别让LDO在你板子上自嗨：手把手教你用波特图分析环路稳定性（附仿真文件）10 C# WinForm实战：利用ScottPlot从零构建动态数据可视化应用