最优化方法Python计算：BFGS算法

按秩1法（详见博文《最优化方法Python计算：秩1拟牛顿法》）计算的修正矩阵 $\boldsymbol{Q}_{k+1}=\boldsymbol{Q}_k+\boldsymbol{E}_k$ 无法保证其正定性。这时， $\boldsymbol{d}_{k+1}=-\boldsymbol{Q}_{k+1}\boldsymbol{g}_{k+1}$ 可能不是 $f(\boldsymbol{x})$ 在 $\boldsymbol{x}_{k+1}$ 处的下降方向，致使算法失败。要摆脱秩1法的这一窘境，需另辟蹊径。很自然的想法是“秩2”修正：设 $\boldsymbol{Q}_k$ 对称正定，令修正矩阵
$\boldsymbol{E}_k=\frac{\Delta\boldsymbol{x}_k\Delta\boldsymbol{x}_k^\top}{\Delta\boldsymbol{x}_k^\top\Delta\boldsymbol{g}_k}-\frac{\boldsymbol{Q}_k\Delta\boldsymbol{g}_k\Delta\boldsymbol{g}_k^\top\boldsymbol{Q}_k}{\Delta\boldsymbol{g}_k^\top\boldsymbol{Q}_k\Delta\boldsymbol{g}_k}$
于是得到 $\boldsymbol{Q}_{k+1}$ 的秩2修正公式
$\boldsymbol{Q}_{k+1}=\boldsymbol{Q}_k+\boldsymbol{E}_k=\boldsymbol{Q}_k+\frac{\Delta\boldsymbol{x}_k\Delta\boldsymbol{x}_k^\top}{\Delta\boldsymbol{x}_k^\top\Delta\boldsymbol{g}_k}-\frac{\boldsymbol{Q}_k\Delta\boldsymbol{g}_k\Delta\boldsymbol{g}_k^\top\boldsymbol{Q}_k}{\Delta\boldsymbol{g}_k^\top\boldsymbol{Q}_k\Delta\boldsymbol{g}_k}.\quad\quad(1)$
利用式(1)作为正定阵 $\boldsymbol{Q}_{k+1}$ 修正公式的拟牛顿法是由Broyden，Fletcher，Goldfarb和Shanno在20世纪70年代各自独立提出来的，故常称为BFGS算法。可以证明：
定理1 （1）设 $\boldsymbol{Q}_k$ 对称正定，由式(1)确定的 $\boldsymbol{Q}_{k+1}$ 正定，当且仅当 $\Delta\boldsymbol{x}_k^\top\Delta\boldsymbol{g}_k>0$ 。
（2）设目标函数 $f(\boldsymbol{x})$ ， $\boldsymbol{x}\in\text{R}^n$ 一阶连续可微，且有极小值点 $\boldsymbol{x}_0$ 。则BFGS算法每次迭代均有 $\Delta\boldsymbol{x}_k^\top\Delta\boldsymbol{g}_k>0$ 。
BFGS算法是一个改进了的拟牛顿算法，读者可作为练习用Python实现BFGS算法。Python的scipy.optimize为用户提供了BFGS方法，只需要在调用minimize时将’BFGS’传递给method参数即可用BFGS方法计算目标函数的最优解。
例1 用scipy.optimize提供的BFGS方法计算Rosenbrock函数的最优解，给定初始点 $\boldsymbol{x}_1=\begin{pmatrix}100\\100\end{pmatrix}$ 。
解：下列代码完成本例计算。

import numpy as np                                      #导入numpy
from scipy.optimize import rosen, minimize              #导入rosen, minimize
x=np.array([100,100])                                   #设置初始点
res=minimize(rosen,x,method='BFGS')                     #计算最优解
print(res)

运行程序，输出

      fun: 1.8831204186846363e-11hess_inv: array([[0.49113161, 0.98272927],[0.98272927, 1.97132641]])jac: array([ 2.16488885e-06, -9.42470479e-07])message: 'Optimization terminated successfully.'nfev: 1488nit: 385njev: 496status: 0success: Truex: array([0.99999566, 0.99999131])

这意味着BFGS方法从初始点 $\boldsymbol{x}_1=\begin{pmatrix}100\\100\end{pmatrix}$ 起，迭代385次算得Rosenbrock函数的最优解 $\boldsymbol{x}_0$ 的近似值为 $\begin{pmatrix}0.99999566\\0.99999131\end{pmatrix}$ 。虽然运行效率未必优于秩1算法（见博文《最优化方法Python计算：秩1拟牛顿法》中例），但根据定理1，算法运行的可靠性得到了保证。