其他分享
首页 > 其他分享> > 凸优化第三章凸函数 3.4 拟凸函数

凸优化第三章凸函数 3.4 拟凸函数

作者:互联网

3.4 拟凸函数

  1. 定义及例子
  2. 基本性质
  3. 可微拟凸函数

定义及例子

定义

函数f:R^n\rightarrow R称为拟凸函数,如果其定义域和所有下水平集S_\alpha =\left \{ x\in dom(f) |f(x)\leq \alpha \right \},\alpha \in R,都是凸集。

如果f(x)是拟凸函数,则-f(x)是拟凹函数。拟凹函数:每个上水平集均为凸集。如果一个函数既是拟凸函数又是拟凹函数,其为拟线性函数。

如上图,S_\alpha=[a,b],S_\beta=(-\infty ,c],两个下水平集均为凸集。

而上图,S_a=[c,d]\cup [e,g],S_b=[h,i],显然S_a不是凸集,f(x)不是拟凸函数。

结论:凸函数具有凸的下水平集,即凸函数也是拟凸函数,但从第一个图可以看出拟凸函数未必是凸函数。

对于上下水平集是否是凸集的判断,主要在于区间是否连续。

例子

\sqrt{|X|}是拟凸函数,可以看出对任意的\alpha,下水平集是凸集,而上水平集不是凸集。

log(x)是拟线性函数,从下图可以看出,可以看出对任意的\alpha,下水平集上水平集都是凸集。

f(x_1,x_2)=x_1x_2R_{++}^2上是拟凹函数,因为其上水平集是凸集。

线性分式f(x)=\frac{a^Tx+b}{c^Tx+d},dom(f)=\left \{ x|c^Tx+d>0 \right \}也是拟线性函数,因为其下水平集

S_\alpha =\left \{ x|c^Tx+d>0,(a^Tx+b)/(c^Tx+d)\leq \alpha \right \} =\left \{ x|c^Tx+d>0,(a^Tx+b)\leq \alpha(c^Tx+d) \right \} =\left \{ x|c^Tx+d>0,(a^T-\alpha c^T)x\leq \alpha d-b \right \}

可以看出其下水平集是一个开半平面c^Tx+d>0和闭半平面(a^T-\alpha c^T)x\leq \alpha d-b的交集,是凸集。

ceil(x)的上水平集合下水平集均为凸集,故ceil(x)为拟线性函数。

距离比函数:

a,b\in R^n,f(x)=\frac{||x-a||_2}{||x-b||_2},dom(f)=\left \{ x|\, \, ||x-a||_2\leq ||x-b||_2 \right \},是拟凸函数,根据定义域可知f(x)\leq 1,因此\forall \alpha >1其对应的下水平集跟\alpha=1一样,故只需证明\alpha \leq 1时,其对应下水平集为凸集,

S_\alpha =\left \{ x\in dom(f)|\, \, ||x-a||_2\leq \alpha||x-b||_2 \right \}

||x-a||_2\leq \alpha||x-b||_2

对上述式子两边去平方,得到

(x-a)^T(x-a)\leq \alpha (x-b)^T(x-b)

整理得到:

(1-\alpha^2)x^Tx-2(a-\alpha^2b)^Tx+a^Ta-\alpha^2 b^Tb\leq 0\, \, \, \, (1)

现证明S_\alpha为凸集:

\forall x_1,x_2 \in S_\alpha,\forall \theta \in[0,1],x^{'}=\theta x_1+(1-\theta )x_2

现证x^{'}\in S_a,即满足(1),将其代入(1),得到:

(1-\alpha^2)(\theta x_1+(1-\theta)x_2)^T(\theta x_1+(1- \theta)x_2)-2(a-\alpha^2b)^T(\theta x_1+(1- \theta)x_2)+a^Ta-\alpha^2 b^Tb\leq 0

整理左边:

(1-\alpha^2)(\theta x_1+(1-\theta)x_2)^T(\theta x_1+(1- \theta)x_2)-2(a-\alpha^2b)^T(\theta x_1+(1- \theta)x_2)+a^Ta-\alpha^2 b^Tb

=(1-\alpha^2)\left\{\theta^2 x_1^Tx_1+(1-\theta)^2x_2^Tx_2+2\theta(1-\theta)x_1^Tx_2\right\}-2(a-\alpha^2b)^T\theta x_1-2(a-\alpha^2b)^T(1- \theta)x_2+a^Ta-\alpha^2 b^Tb

=(1-\alpha^2)\left\{\theta^2 x_1^Tx_1+\theta x_1^Tx_1-\theta x_1^Tx_1+(1-\theta)x_2^Tx_2-(1-\theta) x_2^Tx_2+(1-\theta)^2x_2^Tx_2+2\theta(1-\theta)x_1^Tx_2\right \}-2(a-\alpha^2b)^T\theta x_1-2(a-\alpha^2b)^T(1- \theta)x_2+a^Ta-\alpha^2 b^Tb

=(1-\alpha^2)\left\{\theta^2 x_1^Tx_1-\theta x_1^Tx_1-(1-\theta) x_2^Tx_2+(1-\theta)^2x_2^Tx_2+2\theta(1-\theta)x_1^Tx_2\right \}+(1-\alpha^2)\theta x_1^Tx_1-2(a-\alpha^2b)^T\theta x_1+(1-\alpha^2)(1-\theta)x_2^T x_2-2(a-\alpha^2b)^T(1- \theta)x_2+a^Ta-\alpha^2 b^Tb

=(1-\alpha^2)\left\{\theta^2 x_1^Tx_1-\theta x_1^Tx_1-(1-\theta) x_2^Tx_2+(1-\theta)^2x_2^Tx_2+2\theta(1-\theta)x_1^Tx_2\right \}+(1-\alpha^2)\theta x_1^Tx_1-2(a-\alpha^2b)^T \theta x_1+(1-\alpha^2)(1-\theta)x_2^T x_2-2(a-\alpha^2b)^T(1- \theta)x_2+\theta( a^Ta-\alpha^2 b^Tb)+(1-\theta) (a^Ta-\alpha^2 b^Tb)

=(1-\alpha^2)\left\{\theta^2 x_1^Tx_1-\theta x_1^Tx_1-(1-\theta) x_2^Tx_2+(1-\theta)^2x_2^Tx_2+2\theta(1-\theta)x_1^Tx_2\right \}+\theta{\color{Red} \left\{ (1-\alpha^2) x_1^Tx_1-2(a-\alpha^2b)^T x_1+a^Ta-\alpha^2 b^Tb\right\}}+(1- \theta){\color{Red} \left\{(1-\alpha^2)x_2^T x_2-2(a-\alpha^2b)^Tx_2+a^Ta-\alpha^2 b^Tb\right\}}

由于x_1,x_2\in S_\alpha,故x_1,x_2满足(1),故上式红色部分均小于等于0,故

(1-\alpha^2)\left\{\theta^2 x_1^Tx_1-\theta x_1^Tx_1-(1-\theta) x_2^Tx_2+(1-\theta)^2x_2^Tx_2+2\theta(1-\theta)x_1^Tx_2\right \}+\theta{\color{Red} \left\{ (1-\alpha^2) x_1^Tx_1-2(a-\alpha^2b)^T x_1+a^Ta-\alpha^2 b^Tb\right\}}+(1- \theta){\color{Red} \left\{(1-\alpha^2)x_2^T x_2-2(a-\alpha^2b)^Tx_2+a^Ta-\alpha^2 b^Tb\right\}}

\leq (1-\alpha^2)\left\{\theta^2 x_1^Tx_1-\theta x_1^Tx_1-(1-\theta) x_2^Tx_2+(1-\theta)^2x_2^Tx_2+2\theta(1-\theta)x_1^Tx_2\right \}

= (1-\alpha^2)\left\{(\theta^2-\theta) x_1^Tx_1+((1-\theta)^2-(1-\theta)) x_2^Tx_2+2\theta(1-\theta)x_1^Tx_2\right \}

=(1-\alpha^2)\left\{\theta(\theta-1) x_1^Tx_1+(1-\theta)((1-\theta)-1) x_2^Tx_2+2\theta(1-\theta)x_1^Tx_2\right \}

=(1-\alpha^2)\left\{\theta(\theta-1) x_1^Tx_1-(1-\theta)\theta x_2^Tx_2+2\theta(1-\theta)x_1^Tx_2\right \}

=(1-\alpha^2)\theta(1-\theta) (-x_1^Tx_1-x_2^Tx_2+2x_1^Tx_2)\leq 0

x^{'}=\theta x_1+(1-\theta) x_2\in S_\alpha,S_\alpha为凸集,函数为拟凸函数。

基本性质

修正的Jensen不等式

函数f是拟凸函数的充分必要条件是:dom(f)是凸集,且

\forall x,y\in dom(f),\forall \theta \in[0,1],f(\theta x+(1-\theta)y)\leq max\left \{ f(x),f(y) \right \}

即线段中任意一点的函数值不超过其断电函数值中最大的那个。

R上的拟凸函数

连续函数f:R^n\rightarrow R是拟凸的,当且仅当下述条件至少有一个成立:

  1. f是非减的
  2. f是非增的
  3. \exists c\in dom(f),\forall t \leq c,t\in dom(f),f非增,\forall t\geq c,t\in dom(f),f非减。

可微拟凸函数

一阶条件

设函数f:R^n\rightarrow R可微,则函数f是拟凸函数的充要条件,dom(f)是凸集,且

\forall x,y\in dom(f),f(y)\leq f(x)\Rightarrow \bigtriangledown ^Tf(x)(y-x)\leq 0

几何上,表示在每个\bigtriangledown f(x)在点x处定义了水平集\left \{ y|f(y)\leq f(x) \right \}的一个支撑超平面。

多个拟凸函数的和不一定是拟凸函数。

 

来源:https://blog.csdn.net/wangchy29/article/details/86546606

标签:拟凸函数,凸集,d%,凸函数,5ETx,3.4,20%,plus
来源: https://blog.csdn.net/hyl1181/article/details/111304077