椭球算法最早于 1977 年由俄罗斯数学家 Shor 提出用于解决一般的凸优化问题,后在 1979 年被 Leonid Khachiyan 用于线性规划。椭球算法是第一个解线性规划的多项式时间的算法,虽然效果不好,但是在组合优化中有理论价值。
Ellipsoid
欧式空间中的一个椭球,可以用一个正定矩阵和一个向量来表示: $$ \begin{aligned} E(A, c) &= \{ x \in \mathbb{R}^n : (x-c)^T A^{-1} (x-c) \leq 1\} \\ &= A^{1/2}S(0, 1) + c \end{aligned} $$ 任何一个椭球都可以看成是单位球 $S(0, 1)$ 在线性变换的作用下的像再平移的结果。
椭球的体积: $$ \operatorname{vol} (E(A, c)) = \sqrt{\det A} \cdot \operatorname{vol}(S(0, 1)) = \sqrt{\det A} \cdot\frac{\pi^{n/2}}{\Gamma(n/2+1)} $$
Ellipsoid Algorithm
Ellipsoid algorithm 意在解决这样一个问题: $$ \text{Given a bounded polytope } P \in \mathbb{R}^n \text{ find } x \in P \text{ or assert } P \text{ empty} $$ 假设我们有这样一个 separation oracle:
给定一个 $x$,oracle 返回结果:$x \in P$ 或者一个 violated constraint $c^T x \leq d$ .
其实就是当 $x \notin P$ 的时候返回一个 weakly seperating hyperplane between $x$ and $P$ . 这个 Oracle 能在多项式时间内运行是椭球法多项式时间结论的基本要求。
椭球算法的基本思想如下: $$ \begin{aligned} & \text{ Let } E_{0} \text{ be an ellipsoid containing } P. \\ & \textbf{ While } \text{center } a_{k} \text{ of } E_{k} \text{ is not in } P \text{, do: } \\ & \qquad \text{Let } c^{T} x \leq c^{T} a_{k} \text{ be such that } \left\{x: c^{T} x \leq c^{T} a_{k}\right\} \supseteq P . \\ & \qquad \text{Let } E_{k+1} \text{ be the minimum volume ellipsoid containing } E_{k} \cap\left\{x: c^{T} x \leq c^{T} a_{k}\right\} \supseteq P. \\ & \qquad k \leftarrow k+1 \end{aligned}\notag $$ 一次迭代的过程如下图所示:

能这样迭代地找到满足条件的椭球的理论依据是 Löwner-John theorem
对于 $\mathbb{R}^n$ 中的一个凸紧集 $S$,存在最小的椭球 $E(S) \supseteq S$,且 $E(S) \supseteq S \supseteq \displaystyle\frac{1}{n} E(S)$ .
由 $E_k(A_k, a_k)$ 确定 $E_{k+1}(A_{k+1}, a_{k+1})$ 的过程如下: $$ \begin{aligned} & \textbf{While} \text{ $a\_{k} \\notin P$ do:} \\ & \qquad \text{Let } c^{T} x \leq d \text{ be an inequality that is valid for all } x \in P \text{ but } c^{T} a_{k}>d. \\ & \qquad \text{Let } b=\frac{A_{k} c}{\sqrt{c^{T} A_{k} c}}. \\ & \qquad \text{Let } a_{k+1}=a_{k}-\frac{1}{n+1} b. \\ & \qquad \text{Let } A_{k+1}=\frac{n^{2}}{n^{2}-1}\left(A_{k}-\frac{2}{n+1} b b^{T}\right). \end{aligned}\notag $$ 每一轮迭代都能将椭球的体积缩小,成立关系: $$ \frac{\operatorname{vol}\left(E_{k+1}\right)}{\operatorname{vol}\left(E_{k}\right)}<\exp \left(-\frac{1}{2(n+1)}\right) < 1 $$ 缩小的比例只于维数有关,而与迭代步数是无关的。
当算法的迭代步数很大的时候,便可以认为 $P$ 是空集了。因为,一般来说 $P=\{x: Cx \leq d\}$,$\displaystyle\frac{\operatorname{vol}(E_0)}{\operatorname{vol}(P)}$ 关于 encoding length ($\langle C, d \rangle$) 是多项式的。
From feasibility to Optimization
上述算法能检验线性不等式组的可行性 (feasibility),要求解 $\max \{c^T x : x \in P\}$,只需令 $Q_t=P\cap \{c^T x \leq t\}$,对 $t$ 进行二分查找即可。
所以,总的来说,椭球算法的时间复杂度就是多项式的。(weakly polynomial)
椭球法还能解决一般的凸优化问题。
Oracles and Computational Complexity
椭球算法可以分解为:calls to a separation oracle + basic arithmetic operations.
事实上,separation 和 optimization 在计算上是等价的 (computationally equivalent),给定凸集 $K$,对于:
- Separate $({K}):$ Given as input a vector $\vec{x}$, output yes if $\vec{x} \in {K}$, or a hyperplane separating $\vec{x}$ from ${K}$.
- Optimize $({K}):$ Given as input a vector $\vec{w}$, output $\arg \max _{\vec{x} \in {K}}\{\vec{x} \cdot \vec{w}\}$.
椭球算法实质上说明了,如果能在多项式时间内计算 Separate $({K})$ ,那么也能在多项式时间内计算 Optimize $({K})$。
除了 separation oracle,还有其它的 oracle,比如:
- Violation oracle
- Optimization oracle
- Validity oracle
- Membership Oracle
见:https://en.wikipedia.org/wiki/Separation_oracle