最优化方法Python计算：求解约束优化问题的罚函数算法

设等式约束优化问题
$\begin{cases} \text{minimize}\quad f(\boldsymbol{x})\\ \text{s.t. }\quad\quad\boldsymbol{h}(\boldsymbol{x})=\boldsymbol{o} \end{cases}\quad\quad{(1)}$
其中 $f:\text{R}^n\rightarrow\text{R}$ ， $\boldsymbol{h}:\text{R}^n\rightarrow\text{R}^l$ ，在 $\text{R}^n$ 上连续。可行域 $\Omega=\{\boldsymbol{x}|\boldsymbol{h}(\boldsymbol{x})=\boldsymbol{o}\}$ 。构造罚函数
$P(\boldsymbol{x})=\frac{1}{2}\boldsymbol{h}(\boldsymbol{x})^\top\boldsymbol{h}(\boldsymbol{x})$
称 $\text{R}^n\rightarrow\text{R}$ 函数
$F(\boldsymbol{x},\sigma)=f(\boldsymbol{x})+\sigma P(\boldsymbol{x})$
为问题(1)的增广目标函数，其中 $\sigma>0$ ，称为罚因子。注意到 $F(\boldsymbol{x},\sigma)=f(\boldsymbol{x})$ ，当且仅当 $\boldsymbol{x}\in\Omega$ 。考虑无约束优化问题
$\begin{cases} \text{minimize}\quad F(\boldsymbol{x},\sigma)\\ \text{s.t.\ \ }\quad\quad\boldsymbol{x}\in\text{R}^n \end{cases},\quad\quad{(2)}$
称为(1)的子问题。给定罚因子 $\sigma>0$ ，设子问题(2)最优解 $\boldsymbol{x}_{\sigma}=\arg\min\limits_{\boldsymbol{x}\in\text{R}^n}F(\boldsymbol{x},\sigma)$ 。若 $\boldsymbol{x}_{\sigma}\in\Omega$ ，则 $\sigma P(\boldsymbol{x}_{\sigma})=0$ ，且 $F(\boldsymbol{x}_{\sigma},\sigma)=f(\boldsymbol{x}_{\sigma})$ 。故 $\boldsymbol{x}_{\sigma}$ 可以视为 $f(\boldsymbol{x})$ 最优解的近似值。否则，即 $\boldsymbol{x}_{\sigma}\not\in\Omega$ ，则 $\sigma P(\boldsymbol{x}_\sigma)$ 是一个正数，其存在是对 $\boldsymbol{x}_\sigma$ 脱离 $\Omega$ 的一种“惩罚”。此时，若加大 $\sigma'>\sigma$ ，再次尝试求解子问题 $\boldsymbol{x}_{\sigma'}=\arg\min\limits_{\boldsymbol{x}\in\text{R}^n} F(\boldsymbol{x},\sigma')$ ，意欲迫使 $\boldsymbol{x}_{\sigma'}$ 向 $\Omega$ 靠拢。可以证明以下命题
定理1：若约束优化问题(1)存在唯一最优解 $\boldsymbol{x}_0$ ，子问题(2)对任意 $\sigma>0$ ，均有最优解 $\boldsymbol{x}_\sigma$ 。给定序列 $0<\sigma_1<\sigma_2<\cdots<\sigma_k<\cdots$ ，且 $\lim\limits_{k\rightarrow\infty}\sigma_k=+\infty$ 。按迭代式
$\boldsymbol{x}_k=\arg\min_{\boldsymbol{x}\in\text{R}^n}F(\boldsymbol{x},\sigma_k)$
算得序列 $\{\boldsymbol{x}_k\}$ ，则必有
$\begin{cases} \lim\limits_{k\rightarrow\infty}\boldsymbol{x}_k=\boldsymbol{x}_0\\ \lim\limits_{k\rightarrow\infty}\sigma_k P(\boldsymbol{x}_k)=0 \end{cases}.$
对一般的有约束优化问题
$\begin{cases} \text{minimize}\quad f(\boldsymbol{x})\\ \text{s.t.\ \ }\quad\quad\boldsymbol{h}(\boldsymbol{x})=\boldsymbol{o}\\ \quad\quad\quad\quad\boldsymbol{g}(\boldsymbol{x})\geq\boldsymbol{o} \end{cases}\quad\quad{(3)}$
其中， $f:\text{R}^n\rightarrow\text{R}$ ， $\boldsymbol{h}:\text{R}^n\rightarrow\text{R}^l$ ， $\boldsymbol{g}:\text{R}^n\rightarrow\text{R}^m$ 。 $f(\boldsymbol{x})$ ， $\boldsymbol{h}(\boldsymbol{x})$ ， $\boldsymbol{g}(\boldsymbol{x})$ 在 $\text{R}^n$ 上连续。可行域 $\Omega=\{\boldsymbol{x}|\boldsymbol{h}(\boldsymbol{x})=\boldsymbol{o},\boldsymbol{g}(\boldsymbol{x})\geq\boldsymbol{o}\}$ 。定义罚函数
$P(\boldsymbol{x})=\boldsymbol{h}(\boldsymbol{x})^\top\boldsymbol{h}(\boldsymbol{x})+\boldsymbol{g}_1(\boldsymbol{x})^\top\boldsymbol{g}_1(\boldsymbol{x}).$
其中， $\boldsymbol{g}_1(\boldsymbol{x})=\boldsymbol{\min}(\boldsymbol{o},\boldsymbol{g}(\boldsymbol{x}))=\begin{pmatrix}\min(0,g_1(\boldsymbol{x}))\\\vdots\\\min(0,g_m(\boldsymbol{x}))\end{pmatrix}$ 。不难证实
$\begin{cases} P(\boldsymbol{x})=0&\boldsymbol{x}\in\Omega\\ P(\boldsymbol{x})>0&\boldsymbol{x}\not\in\Omega \end{cases},$
且在 $\text{R}^n$ 上连续。取罚因子 $\sigma>0$ ，定义增广目标函数：
$F(\boldsymbol{x},\sigma)=f(\boldsymbol{x})+\sigma P(\boldsymbol{x}).$
及子问题
$\begin{cases} \text{minimize}\quad F(\boldsymbol{x},\sigma)\\ \text{s.t.}\quad\quad\quad\boldsymbol{x}\in\text{R}^n \end{cases}\quad\quad{(4)}$
则关于等式约束优化问题(1)及其子问题(2)的定理1的结论对问题(3)及其子问题(4)均成立。根据定理1，对问题(4)给定罚因子初始值 $\sigma_1>0$ （典型值为10）、放大系数 $c > 1$ （典型值为2.5）及容错误差 $\varepsilon>0$ ，按
$\boldsymbol{x}_{k+1}=\arg\min_{\boldsymbol{x}\in\text{R}^n}F(\boldsymbol{x},\sigma_k)$
做迭代，直至 $\sigma_k P(\boldsymbol{x}_k)<\varepsilon$ 为止。所得当前 $\boldsymbol{x}_k$ 即为问题(3)的最优解近似值。由于罚函数是关于约束函数的二次式，故此算法常称为二次罚函数算法。该算法以一系列子问题的最优解来逼近问题的最优解，也被称为序列无约束极小化方法简记为SUMT方法。
下列代码实现罚函数算法。

import numpy as np													#导入numpy
from scipy.optimize import minimize,OptimizeResult					#导入minimize,OptimizeResult
def sumt(f, x1, h = None, g = None, eps = 1e-5):if not callable(h):												#没有等式约束h = lambda x: np.zeros(1)									#置零if callable(g):m = g(x1).size												#g的维数zero = np.zeros(m)g1 = lambda x: np.minimum(zero, g(x))						#转换不等式约束else:															#没有不等式约束g1 = lambda x: np.zeros(1)									#置零sigmak = 10.0													#初始罚因子c = 2.5															#罚因子放大系数sPk = 10.0														#初始罚项k = 0															#初始迭代数xk = x1															#初始迭代解向量P = lambda x: 0.5 * (np.dot(h(x), h(x)) + np.dot(g1(x), g1(x)))	#罚函数F = lambda x: f(x) + sigmak * P(x)								#子问题目标函数while sPk >= eps:												#迭代k += 1														#迭代次数自增1result = minimize(F,xk)										#求解子问题xk = result.x												#子问题最优解sPk = result.fun - f(xk)									#罚项sigmak *= c													#放大罚因子return OptimizeResult(fun = f(xk), x = xk, nit = k)

程序的第3~25行定义的sumt函数实现求解一般约束优化问题的二次罚函数算法（序列无约束极小化SUMT方法）。该函数的参数f，x1表示约束优化问题的目标函数 $f(\boldsymbol{x})$ 和初始解向量 $\boldsymbol{x}_1$ 。h表示等式约束函数 $\boldsymbol{h}(\boldsymbol{x})$ 缺省值为None，表示优化问题无等式约束。g表示不等式约束函数 $\boldsymbol{g}(\boldsymbol{x})$ ，缺省值为None，表示问题无不等式约束。参数eps表示容错误差 $\varepsilon$ 。
函数体内第4~5行对无等式约束的情况将h置为零函数，以便统一代码。第6~11行的if-else语句根据是否有不等式约束，设置表示 $\boldsymbol{g}_1(\boldsymbol{x})=\boldsymbol{\min}(\boldsymbol{g}(\boldsymbol{x}),\boldsymbol{o})$ 便于统一代码的形式。第12~16行分别对罚因子 $\sigma_k$ 、罚因子放大系数 $c$ 、罚项 $\sigma_kP(\boldsymbol{x}_k)$ 、迭代次数 $k$ 及解向量 $\boldsymbol{x}_k$ 作初始化操作。第19~24行的while语句完成算法的迭代。其中，第21行调用scipy.optimize模块中的minimize函数求解子问题，返回值赋予result。第22行读取迭代解向量xk，第23行计算罚项 $\sigma_kP(\boldsymbol{x}_k)=F(\boldsymbol{x}_k,\sigma_k)-f(\boldsymbol{x}_k)$ ，赋予sPk。第24行放大罚因子 $\sigma_k=c\times\sigma_k$ 。迭代结束，第25行返回问题的最优解近似值 $\boldsymbol{x}_k$ 、最优值近似值 $f(\boldsymbol{x}_k)$ 和迭代次数 $k$ 。
例1：用函数sumt求解求解线性规划
$\begin{cases} \text{minimize}\quad\quad x_1-x_2\\ \text{s.t.\ \ \ \ \ }\quad\quad -x_1+2x_2+x_3\leq2\\ \quad\quad\quad\quad\quad -4x_1+4x_2-x_3=4\\ \quad\quad\quad\quad\quad x_1-x_3=0\\ \quad\quad\quad\quad\quad x_1,x_2,x_3\geq0 \end{cases},$
给定初始迭代点 $\boldsymbol{x}_1=\boldsymbol{o}$ 。
解：这个线性规划的数据矩阵为
$\boldsymbol{c}=\begin{pmatrix}1\\-1\\0\end{pmatrix},\boldsymbol{A}_{eq}=\begin{pmatrix}-4&4&-1\\1&0&-1\end{pmatrix},\boldsymbol{b}_{eq}=\begin{pmatrix}4\\0\end{pmatrix},\boldsymbol{A}_{iq}=\begin{pmatrix}1&-2&-1\\1&0&0\\0&1&0\\0&0&1\end{pmatrix},\boldsymbol{b}_{iq}=\begin{pmatrix}-2\\0\\0\\0\end{pmatrix}.$
于是
$f(\boldsymbol{x})=\boldsymbol{c}^\top\boldsymbol{x},\quad\boldsymbol{h}(\boldsymbol{x})=\boldsymbol{A}_{eq}-\boldsymbol{b}_{eq},\quad\boldsymbol{g}(\boldsymbol{x})=\boldsymbol{A}_{iq}-\boldsymbol{b}_{ip}.$
利用这些数据，下列代码完成计算。

import numpy as np					#导入numpy
c = np.array([1, -1, 0])			#向量c
Ae = np.array([[-4, 4, -1],			#矩阵Aeq[1, 0, -1]])
be = np.array([4, 0])				#向量beq
Ai = np.array([[1, -2, -1],			#矩阵Aiq[1, 0, 0],[0, 1, 0],[0, 0, 1]])
bi = np.array([-2, 0, 0, 0])		#向量biq
f = lambda x: np.dot(c, x)			#目标函数
h = lambda x: np.matmul(Ae, x) - be	#等式约束函数
g = lambda x: np.matmul(Ai, x) - bi	#不等式约束函数
x1 = np.zeros(3)					#初始迭代点
print(sumt(f, x1, h, g))

借助代码内的注释信息，不难理解本程序。第15行调用sumt函数，计算问题最优解近似值并输出。运行程序，输出

 fun: -1.0000094540269446nit: 8x: array([-6.39954354e-06,  1.00000305e+00,  6.29523189e-06])

意味着经过8次迭代，算得本问题的最优解为 $\boldsymbol{x}_0=\begin{pmatrix}0\\1\\0\end{pmatrix}$ ，最优解处函数值为 $f(\boldsymbol{x}_0)=-1$ 。
例2：用sumt函数求解二次规划
$\begin{cases} \text{minimize}\quad x_1^2+x_1x_2+2x_2^2+x_3^2-6x_1-2x_2-12x_3\\ \text{s.t.\ \ }\quad\quad\quad x_1+x_2+x_3-2=0\\ \quad\quad\quad\quad\quad x_1-2x_2+3\geq0\\ \quad\quad\quad\quad\quad x_1,x_2,x_3\geq0 \end{cases},$
给定初始可行解 $\boldsymbol{x}_1=\begin{pmatrix}1\\1\\0\end{pmatrix}$ 。
解：本二次规划的数据矩阵为
$\begin{array}{l} \boldsymbol{H}=\begin{pmatrix}2&1&0\\1&4&0\\0&0&2\end{pmatrix},\boldsymbol{c}=\begin{pmatrix}-6\\-2\\-12\end{pmatrix}\\ \boldsymbol{A}_{eq}=\begin{pmatrix}1&1&1\end{pmatrix},\boldsymbol{b}_{eq}=(2)\\ \boldsymbol{A}_{iq}=\begin{pmatrix}1&-2&0\\1&0&0\\0&1&0\\0&0&1\end{pmatrix},\boldsymbol{b}_{iq}=\begin{pmatrix}-3\\0\\0\\0\end{pmatrix} \end{array}$
下列代码完成计算。

import numpy as np													#导入numpy
H = np.array([[2, 1, 0],											#矩阵H[1, 4, 0],[0, 0, 2]])
c = np.array([-6, -2, -12])											#向量c
Ae = np.array([[1, 1, 1]])											#矩阵Aeq
be = np.array([2])													#向量beq
Ai = np.array([[-1, -2, 0],											#矩阵Aiq[1, 0, 0],[0, 1, 0],[0, 0, 1]])
bi = np.array([-3, 0, 0, 0])										#向量biq
x1 = np.array([1, 1, 0])											#初始迭代点
f = lambda x: 0.5 * np.matmul(x, np.matmul(H, x)) + np.matmul(c, x)	#目标函数
h = lambda x: np.matmul(Ae, x) - be									#等式约束函数
g = lambda x: np.matmul(Ai, x) - bi									#不等式约束函数
print(sumt(f, x1, h, g))

对照代码内的注释信息，不难理解程序。运行程序，输出

 fun: -20.000011166902542nit: 16x: array([-2.22198421e-07, -6.51694981e-07,  2.00000173e+00])

这意味着经过16次迭代，算得本问题的最优解 $\boldsymbol{x}_0=\begin{pmatrix}0\\0\\2\end{pmatrix}$ ，最优值 $f(\boldsymbol{x}_0)=-20$ 。
例3：用sumt函数求解优化问题
$\begin{cases} \text{minimize}\quad x_1^2+x_2^2-16x_1-10x_2\\ \text{s.t.\ \ }\quad\quad\quad -x_1^2+6x_1-4x_2+11\geq0\\ \quad\quad\quad\quad\quad x_1x_2-3x_2-e^{x_1-3}+1\geq0\\ \quad\quad\quad\quad\quad x_1,x_2\geq0 \end{cases},$
给定初始迭代点 $\boldsymbol{x}_1=\boldsymbol{o}$ 。
解：下列代码完成计算：

import numpy as np												#导入numpy
f = lambda x: x[0] ** 2 + x[1] ** 2 - 16 * x[0] - 10 * x[1]		#目标函数
g = lambda x: np.array([-x[0] ** 2 + 6 * x[0] - 4 * x[1] + 11,	#不等式约束函数x[0] * x[1] - 3 * x[1] - np.exp(x[0] - 3) + 1,x[0],x[1]])
x1 =  np.zeros(2)												#初始迭代点
print(sumt(f, x1, g = g))

借助代码内注释信息，不难理解本程序。需要注意，本问题只有不等式约束g，第8行调用sumt时应表示等式约束的参数h使用缺省值，在其后的不等式约束参数g须使用赋值形式传递。运行程序，输出

 fun: -79.80782889081777nit: 11x: array([5.23961012, 3.74603874])

意味着经过11次迭代，算得线性规划问题最优解近似值 $\boldsymbol{x}_0=\begin{pmatrix}5.3296\\3.7460\end{pmatrix}$ ，最优值 $f(\boldsymbol{x}_0)\approx-79.8078$ 。
写博不易，敬请支持：
如果阅读本文于您有所获，敬请点赞、评论、收藏，谢谢大家的支持！

最优化方法Python计算：求解约束优化问题的罚函数算法

相关资讯

热文排行

最新新闻

推荐新闻

热搜词