Regret in the Newsvendor Model with Partial Information

发表在 Operations Research, 2008. DOI: https://doi.org/10.1287/opre.1070.0486

Subject classifications: distribution-free inventory policy; newsvendor model; robust optimization; entropy; value of information; semi-infinite linear optimization.

Area of review: Manufacturing, Service, and Supply Chain Operations.


文章研究部分需求分布信息下的 Newsvender 问题。

值得一提的贡献有两点:

  1. 在经典的报童模型的基础上,假定需求分布虽然是未知的,但是可以获取到部分统计信息(矩、单峰等),给出了一个 robust 的解。
  2. 在给定的统计信息下,最大化信息熵的分布,往往是鲁棒优化眼中的 worst case distribution.

设 $\Pi_F(y)$ 是订货量 $y$ 在需求分布为 $F$ 下的期望利润,经典的鲁棒优化的优化目标是让最坏情况下的利润最大:

$$ \max_{y \geqslant 0} \min_{F \in \mathscr{D}} \Pi_F(y) $$

但是这样子做决策会导致过于保守。当需求的均值易知,缺货成本为0时,鲁棒优化给出的最优订货量是0。

文章用的决策准则是 regret:

$$ \rho^{\ast}=\min _{y \geqslant 0} \rho(y)=\min _{y \geqslant 0} \max _{F \in \mathscr{D}} \max _{z \geqslant 0}\left\{\Pi_{F}(z)\right\}-\Pi_{F}(y) $$

分布集 $\mathscr{D}$ 包含我们对需求分布的 initial beliefs。这种决策方式使最大的遗憾最小化。

这提示我们建立鲁棒优化目标函数的时候也许可以跟 regret 结合起来。

文章提取出了一个内层的无穷维的最优化问题:

$$ \begin{aligned} \max _{F \in \mathscr{D}} & \int_{\Omega}(\min \{x, z\}-\min \{x, y\}) d F(x) \\ \text { s.t. } & \int_{\Omega} x^{i} d F(x)=q_{i} \quad \forall i=0, \ldots, n . \end{aligned} $$

已知分布的各阶矩,要找到一个最优的分布 $F$.

如果 Slater's condition 成立,那么强对偶性成立,且它的对偶是一个 semi-infinite 的线性规划:

$$ \begin{aligned} \min _{\alpha_{0}, \ldots, \alpha_{n}} & \sum_{i=0}^{n} \alpha_{i} q_{i} \\ \text { s.t. } & \sum_{i=0}^{n} \alpha_{i} x^{i}-(\min \{x, z\}-\min \{x, y\}) \in \mathscr{C}^{\ast}, \end{aligned} $$

Bertsimas and Popescu (2002, 2005) showed that problem, when $\mathscr{D}$ has only moment constraints, can be formulated as a semidefinite optimization problem and be therefore efficiently solved.

有文献说明了这类优化问题能够得到很好的求解。

接下来,文章对各类需求分布的统计信息下的最优订货量做了具体而细致的推导和阐述:

如果只知道需求分布的 support,那么 worst case 的需求分布恰好是均匀分布,这恰好是最大熵的情况。

接着文章还讨论了,只知道需求分布的 mean、mean and median、mean and symmetry、unimodality, mode and median 等情况。证明过程在 e-companion 里,非常长。

updatedupdated2023-01-262023-01-26