发表在 Operations Research Letters,2005. DOI: https://doi.org/10.1016/j.orl.2004.08.003
文章较简短,但是对于 newsvendor 问题给出了一个较为深刻的结论:
The traditional approach of separating the parameter estimation and the maximization of the expected profit leads to a suboptimal inventory policy.
需求服从一个确定但是未知的分布,其它设定与经典的报童模型一致。
经典的做法可能是积累需求的样本,然后用参数式/非参数统计拟合出一个分布,再代入到报童模型求解 $q^\ast = \bar{F}^{-1}(c/p).$
但是,这样做可能导致一个严格非最优的订货量。
文章以指数分布为例:
假定需求服从均值 $\theta$ 的指数分布,则最优订货量是 $x^\ast(\theta) = \theta \ln (p/c)$.
$\theta$ 的无偏估计由需求样本的均值给出:$\bar{D}=\displaystyle\frac{1}{n} \sum_{k=1}^{n} D_{k}$.
所以经典统计方法给出的订货量是:
$$ \hat{X}_{\mathrm{sm}}=\bar{D} \ln \left(p/c\right) \tag{sample mean} $$
然而,如果把样本均值的线性函数 $\hat{X}(z)=z \bar{D}$ 代入到利润函数里面,对 $z$ 进行优化:
$$ \begin{aligned} \eta(z) &=E\left[p \theta\left(1-\exp \left\{-\frac{z \bar{D}}{\theta}\right\}\right)-c z \bar{D}\right] \\ &=p \theta\left(1-\left(\frac{n}{n+z}\right)^{n}\right)-c z \theta, \quad z \geqslant 0 . \end{aligned} $$
可以得到:
$$ \hat{X}_{\mathrm{os}: \mathrm{sm}}=\hat{X}\left(z^{\ast}\right)=n\left(\left(\frac{p}{c}\right)^{1 /(n+1)}-1\right) \bar{D} \tag{operational statistics} $$
当 $p \gg c$ 时,$\hat{X}_{\mathrm{os}: \mathrm{sm}} > \hat{X}_{\mathrm{sm}}$
在我看来,估计需求分布的过程中没有考虑进多订、少订带来的不一样的影响,可能是 suboptimality 的原因。
直接把订货量当成需求样本的函数,代入到利润函数里,再计算得到订货量的这种方法,文章称作是 operational statistics。
可以严格证明 $\hat{X}_{\text{os:sm}}$ 产生的利润严格大于 $\hat{X}_{\text{sm}}$ !
类似的影响出现于具有尺度参数(scale parameter)的分布族中。
注:文章中售价使用的是字母 $s$,而本文使用的是 $p$。