其他分享
首页 > 其他分享> > 证明Ax=0的最小二乘解是ATA的最小特征值对应的特征向量(||x||=1)

证明Ax=0的最小二乘解是ATA的最小特征值对应的特征向量(||x||=1)

作者:互联网

证明: 当 ||x||=1时,Ax=0的最小二乘解是ATAA^TAATA的最小特征值对应的特征向量

证:上式等同于证明如下命题:ATAA^TAATA的最小特征值所对应的特征向量可使||Ax||最小。
(1) 若x为ATAA^TAATA的特征向量,则
ATAx=λx A^TAx=\lambda x ATAx=λx
可得
Ax=(Ax)T(Ax)=xTATAx=xTλx=xTxλ=λ \begin{aligned} ||Ax|| & =(Ax)^T(Ax) \\ &=x^TA^TAx \\ &=x^T\lambda x\\ &=x^Tx\lambda \\ &=\lambda \end{aligned} ∣∣Ax∣∣​=(Ax)T(Ax)=xTATAx=xTλx=xTxλ=λ​

由上式可见,取ATAA^TAATA的最小特征值λ\lambdaλ可使Ax||Ax||∣∣Ax∣∣最小。

(2)若xxx不为ATAA^TAATA的特征向量,则可对AAA做SVD分解,得

A=UΛVT A=U \Lambda V^T A=UΛVT


Ax=(Ax)T(Ax)=xTATAx=xTVΛTUTUΛVTx=xTVΛTΛVTx \begin{aligned} ||Ax||&=(Ax)^T(Ax)=x^TA^TAx\\ &=x^TV\Lambda^TU^TU\Lambda V^Tx\\ &=x^TV\Lambda^T\Lambda V^Tx \end{aligned} ∣∣Ax∣∣​=(Ax)T(Ax)=xTATAx=xTVΛTUTUΛVTx=xTVΛTΛVTx​

又因为
ΛTΛ=[λ12λ22λn2] \Lambda^T\Lambda=\begin{bmatrix} \lambda_1^2 &&& \\ & \lambda_2^2&&& \\ &&\cdots&&\\ &&&\lambda_n^2&\\ \end{bmatrix} ΛTΛ=⎣⎢⎢⎡​λ12​​λ22​​⋯​λn2​​​⎦⎥⎥⎤​

且在svd分解中VVV为一组n维的正交基,即
V=[v1v2vn] V=\begin{bmatrix}v_1& v_2& \cdots &v_n\end{bmatrix} V=[v1​​v2​​⋯​vn​​]

因此,n维向量x可用该组基来表示:
x=α1v1+α2v2++αnvn=[v1v2vn][α1α2αn] \begin{aligned} x&=\alpha_1v_1+\alpha_2v_2+\cdots+\alpha_nv_n &=\begin{bmatrix} v_1 & v_2 &\cdots & v_n \end{bmatrix}\begin{bmatrix} \alpha_1 \\ \alpha_2 \\ \cdots\\ \alpha_n \end{bmatrix} \end{aligned} x​=α1​v1​+α2​v2​+⋯+αn​vn​​=[v1​​v2​​⋯​vn​​]⎣⎢⎢⎡​α1​α2​⋯αn​​⎦⎥⎥⎤​​

将上述两个式子代入,可得
Ax=xTVΛTΛVTx=[α1α2αn][v1v2vn][v1v2vn][λ12λ22λn2][v1v2vn][v1v2vn][α1α2αn]=[α1α2αn][λ12λ22λn2][α1α2αn]=α12λ12+α22λ22++αn2λn2 \begin{aligned} ||Ax||&=x^TV\Lambda^T\Lambda V^Tx \\ &=\begin{bmatrix} \alpha_1&\alpha_2&\cdots&\alpha_n \end{bmatrix} \begin{bmatrix} v_1\\ v_2\\ \cdots\\ v_n \end{bmatrix} \begin{bmatrix} v_1&v_2&\cdots&v_n \end{bmatrix} \begin{bmatrix} \lambda_1^2 && \\ & \lambda_2^2&& \\ &&\cdots&\\ &&&\lambda_n^2\\ \end{bmatrix}\\ &\begin{bmatrix} v_1\\ v_2\\ \cdots\\ v_n \end{bmatrix} \begin{bmatrix} v_1&v_2&\cdots&v_n \end{bmatrix} \begin{bmatrix} \alpha_1\\ \alpha_2\\ \cdots\\ \alpha_n\\ \end{bmatrix}\\ &=\begin{bmatrix} \alpha_1&\alpha_2&\cdots&\alpha_n \end{bmatrix} \begin{bmatrix} \lambda_1^2 && \\ & \lambda_2^2&& \\ &&\cdots&\\ &&&\lambda_n^2\\ \end{bmatrix} \begin{bmatrix} \alpha_1\\ \alpha_2\\ \cdots\\ \alpha_n\\ \end{bmatrix}\\ &=\alpha_1^2\lambda_1^2+\alpha_2^2\lambda_2^2+\cdots+\alpha_n^2\lambda_n^2 \end{aligned} ∣∣Ax∣∣​=xTVΛTΛVTx=[α1​​α2​​⋯​αn​​]⎣⎢⎢⎡​v1​v2​⋯vn​​⎦⎥⎥⎤​[v1​​v2​​⋯​vn​​]⎣⎢⎢⎡​λ12​​λ22​​⋯​λn2​​⎦⎥⎥⎤​⎣⎢⎢⎡​v1​v2​⋯vn​​⎦⎥⎥⎤​[v1​​v2​​⋯​vn​​]⎣⎢⎢⎡​α1​α2​⋯αn​​⎦⎥⎥⎤​=[α1​​α2​​⋯​αn​​]⎣⎢⎢⎡​λ12​​λ22​​⋯​λn2​​⎦⎥⎥⎤​⎣⎢⎢⎡​α1​α2​⋯αn​​⎦⎥⎥⎤​=α12​λ12​+α22​λ22​+⋯+αn2​λn2​​

不是一般性,可令λ1λN\lambda_1\cdots\lambda_Nλ1​⋯λN​的降序排列,则
α12λ12+α22λ22++αn2λn2λN2(α12+α22++αn2) \alpha_1^2\lambda_1^2+\alpha_2^2\lambda_2^2+\cdots+\alpha_n^2\lambda_n^2 \geq \lambda_N^2(\alpha_1^2+\alpha_2^2+\cdots+\alpha_n^2) α12​λ12​+α22​λ22​+⋯+αn2​λn2​≥λN2​(α12​+α22​+⋯+αn2​)

因为x1||x||=1∣∣x∣∣=1,因此
(α12+α22++αn2)=1 (\alpha_1^2+\alpha_2^2+\cdots+\alpha_n^2)=1 (α12​+α22​+⋯+αn2​)=1
所以
AxλN2(α12+α22++αn2) ||Ax||\geq \lambda_N^2(\alpha_1^2+\alpha_2^2+\cdots+\alpha_n^2) ∣∣Ax∣∣≥λN2​(α12​+α22​+⋯+αn2​)

因此,取ATAA^TAATA的最小特征值λ\lambdaλ可使Ax||Ax||∣∣Ax∣∣最小

综上,取ATA的最小特征值对应的特征向量可使Ax=0得到最优解,命题得证。

参考自:
博主:emilycs09
博文地址:https://blog.csdn.net/emilycs09/article/details/84929192
来源:CSDN

标签:特征向量,ATA,最小,cdots,Ax,bmatrix,alpha,amp,lambda
来源: https://blog.csdn.net/baidu_38172402/article/details/89520326