the-matrix-cookbook(1-1)

Claire ·
更新时间:2024-09-20
· 724 次阅读

UTF8gbsn

Trace

Tr⁡(A)=∑iAii\operatorname{Tr}(\mathbf{A})=\sum_{i} A_{i i}Tr(A)=∑i​Aii​
这是迹的定义,这里无需证明.

Tr⁡(A)=∑iλi,λi=eig⁡(A)\operatorname{Tr}(\mathbf{A})=\sum_{i} \lambda_{i}, \quad \lambda_{i}=\operatorname{eig}(\mathbf{A})Tr(A)=∑i​λi​,λi​=eig(A)

这个证明实际上较为复杂.我们来看看如何一步一步里证明.

∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0

我们知道一个n阶多项式方程,具有n个根(这里不做证明).也就是说,一个n阶矩阵具有n个特征值(包含重根).那么来看看为什么∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0的根就是矩阵A的特征值.

我们先来为什么方正A的特征值就是∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0的根.

首先从特征值,和特征向量的定义出发
Av=λv⇒(A−λI)v=0Av=\lambda v \Rightarrow (A-\lambda I)v=0Av=λv⇒(A−λI)v=0

上面右边的方程组要想解出非 0
解的话.必须满足∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0.于是乎,我们发现只要是能使∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0的λ\lambdaλ都是特征值.因为一定可以找到非0的v使得Av=λvAv=\lambda vAv=λv成立.

至于为什么齐次方程组的行列式为0,方程组就有非0解.这里不做证明.请参考线代的书籍.

∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0正是一个n次方程,故而有n个根(包含重根).而这些根都是A的特征值.

再来看看如何证明∑i=1λi=∑i=1aii\sum_{i=1}\lambda_i=\sum_{i=1}a_{ii}∑i=1​λi​=∑i=1​aii​.证明这个东西其实也比较简单.需要运用多项式的系数.

首先来看看∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0,因为这个方程在复数域有n个根,那么我们可以把它改写为
(λ−λ1)(λ−λ2)⋯(λ−λn)=0(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_n)=0(λ−λ1​)(λ−λ2​)⋯(λ−λn​)=0
其中λ1,λ2,⋯ ,λn\lambda_1,\lambda_2,\cdots, \lambda_nλ1​,λ2​,⋯,λn​就是n个特征值.

我们来看看这个方程的λn−1\lambda^{n-1}λn−1的系数.通过上面的方程,我们可以很容易计算λn−1\lambda^{n-1}λn−1为

−(λ1+λ2+⋯+λn)λn−1-(\lambda_1+\lambda_2+\cdots+\lambda_n)\lambda^{n-1}−(λ1​+λ2​+⋯+λn​)λn−1

再次的我们可以通过∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0来求λn−1\lambda^{n-1}λn−1项.

(a11−λa12⋯a1na21a22−λ⋯a2n⋮⋮⋮an1an2⋯ann−λ)=0\left( \begin{array}{cccc} a_{11}-\lambda & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22}-\lambda & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1}& a_{n2} & \cdots & a_{nn}-\lambda \end{array} \right)=0⎝⎜⎜⎜⎛​a11​−λa21​⋮an1​​a12​a22​−λ⋮an2​​⋯⋯⋯​a1n​a2n​⋮ann​−λ​⎠⎟⎟⎟⎞​=0

这个式子的λn−1\lambda^{n-1}λn−1的系数是什么?

其实很简单,根据行列式的定义我们可以知道.非住对角元素的乘积.其他的累加项的次数最高为λn−2\lambda^{n-2}λn−2,所以这个式子的λn−1\lambda^{n-1}λn−1项只会出现在

(a11−λ)(a22−λ)⋯(ann−λ)(a_{11}-\lambda)(a_{22}-\lambda)\cdots(a_{nn}-\lambda)(a11​−λ)(a22​−λ)⋯(ann​−λ)

这个式子的λn−1\lambda^{n-1}λn−1项的系数为

−(a11+a22+⋯+ann)λn−1-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}−(a11​+a22​+⋯+ann​)λn−1

有因为

(λ−λ1)(λ−λ2)⋯(λ−λn)=∣A−λI∣(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_n)=|A-\lambda I|(λ−λ1​)(λ−λ2​)⋯(λ−λn​)=∣A−λI∣

所以原式得证.

PS:一个n阶方正A的非线性相关的特征向量不一定有n个.这样的矩阵都是不能对角化的.因为可以对角化的方正A,正好会含有n个非线性相关的特征向量.比如矩阵

(1111000000000000)\left( \begin{array}{cccc} 1 & 1 & 1 & 1 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{array} \right)⎝⎜⎜⎛​1000​1000​1000​1000​⎠⎟⎟⎞​

就不能对角话

Tr⁡(A)=Tr⁡(AT)\operatorname{Tr}(\mathbf{A})=\operatorname{Tr}\left(\mathbf{A}^{T}\right)Tr(A)=Tr(AT)

转置矩阵于原来的矩阵对角线元素相同.(得证)

Tr⁡(AB)=Tr⁡(BA)\operatorname{Tr}(\mathbf{A B})=\operatorname{Tr}(\mathbf{B A})Tr(AB)=Tr(BA)

AB的对角线元素为dii=∑k=1nai,kbk,id_{ii}=\sum_{k=1}^{n}a_{i,k}b_{k,i}dii​=∑k=1n​ai,k​bk,i​,而累加的结果为∑i=1ndii=∑i=1n∑k=1nai,kbk,i\sum_{i=1}^{n}d_{ii}=\sum_{i=1}^{n}\sum_{k=1}^{n}a_{i,k}b_{k,i}∑i=1n​dii​=∑i=1n​∑k=1n​ai,k​bk,i​

BA的对角线元素为dii=∑k=1nbi,kak,id_{ii}=\sum_{k=1}^{n}b_{i,k}a_{k,i}dii​=∑k=1n​bi,k​ak,i​,而累加的结果为∑i=1ndii=∑i=1n∑k=1nbi,kak,i\sum_{i=1}^{n}d_{ii}=\sum_{i=1}^{n}\sum_{k=1}^{n}b_{i,k}a_{k,i}∑i=1n​dii​=∑i=1n​∑k=1n​bi,k​ak,i​

我们可以对BA的累加结果进行变换,如果我们交换i,k的label.可得
∑k=1n∑i=1nbk,iai,k=∑k=1n∑i=1nai,kbk,i=∑i=1n∑k=1nai,kbk,i\sum_{k=1}^{n}\sum_{i=1}^{n}b_{k,i}a_{i,k}=\sum_{k=1}^{n}\sum_{i=1}^{n}a_{i,k}b_{k,i}=\sum_{i=1}^{n}\sum_{k=1}^{n}a_{i,k}b_{k,i}k=1∑n​i=1∑n​bk,i​ai,k​=k=1∑n​i=1∑n​ai,k​bk,i​=i=1∑n​k=1∑n​ai,k​bk,i​

由此可见原式得证.

Tr⁡(A+B)=Tr⁡(A)+Tr⁡(B)\operatorname{Tr}(\mathbf{A}+\mathbf{B})=\operatorname{Tr}(\mathbf{A})+\operatorname{Tr}(\mathbf{B})Tr(A+B)=Tr(A)+Tr(B)

左边等于∑i=1n(aii+bii)\sum_{i=1}^{n}(a_{ii}+b_{ii})∑i=1n​(aii​+bii​)

右边等于∑i=1naii+∑i=1nbii=∑i=1n(aii+bii)\sum_{i=1}^{n}a_{ii}+\sum_{i=1}^{n}b_{ii}=\sum_{i=1}^{n}(a_{ii}+b_{ii})∑i=1n​aii​+∑i=1n​bii​=∑i=1n​(aii​+bii​)

原式得证

Tr⁡(ABC)=Tr⁡(BCA)=Tr⁡(CAB)\operatorname{Tr}(\mathbf{A B C})=\operatorname{Tr}(\mathbf{B C A})=\operatorname{Tr}(\mathbf{C A B})Tr(ABC)=Tr(BCA)=Tr(CAB)

可以利用14的结论来证明即可.

aTa=Tr⁡(aaT)\mathbf{a}^{T} \mathbf{a}=\operatorname{Tr}\left(\mathbf{a a}^{T}\right)aTa=Tr(aaT)

左边∑i=1naiai\sum_{i=1}^{n}a_ia_{i}∑i=1n​ai​ai​

右边对角线元素为dii=aiai⇒Tr=∑i=1naiaid_{ii}=a_{i}a_i \Rightarrow Tr=\sum_{i=1}^{n}a_{i}a_idii​=ai​ai​⇒Tr=∑i=1n​ai​ai​

原式得证


作者:luixiao1220



matrix

需要 登录 后方可回复, 如果你还没有账号请 注册新账号