UTF8gbsn
Trace
Tr(A)=∑iAii\operatorname{Tr}(\mathbf{A})=\sum_{i} A_{i i}Tr(A)=∑iAii
这是迹的定义,这里无需证明.
Tr(A)=∑iλi,λi=eig(A)\operatorname{Tr}(\mathbf{A})=\sum_{i} \lambda_{i}, \quad \lambda_{i}=\operatorname{eig}(\mathbf{A})Tr(A)=∑iλi,λi=eig(A)
这个证明实际上较为复杂.我们来看看如何一步一步里证明.
∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0
我们知道一个n阶多项式方程,具有n个根(这里不做证明).也就是说,一个n阶矩阵具有n个特征值(包含重根).那么来看看为什么∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0的根就是矩阵A的特征值.
我们先来为什么方正A的特征值就是∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0的根.
首先从特征值,和特征向量的定义出发
Av=λv⇒(A−λI)v=0Av=\lambda v \Rightarrow (A-\lambda I)v=0Av=λv⇒(A−λI)v=0
上面右边的方程组要想解出非 0
解的话.必须满足∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0.于是乎,我们发现只要是能使∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0的λ\lambdaλ都是特征值.因为一定可以找到非0的v使得Av=λvAv=\lambda vAv=λv成立.
至于为什么齐次方程组的行列式为0,方程组就有非0解.这里不做证明.请参考线代的书籍.
∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0正是一个n次方程,故而有n个根(包含重根).而这些根都是A的特征值.
再来看看如何证明∑i=1λi=∑i=1aii\sum_{i=1}\lambda_i=\sum_{i=1}a_{ii}∑i=1λi=∑i=1aii.证明这个东西其实也比较简单.需要运用多项式的系数.
首先来看看∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0,因为这个方程在复数域有n个根,那么我们可以把它改写为
(λ−λ1)(λ−λ2)⋯(λ−λn)=0(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_n)=0(λ−λ1)(λ−λ2)⋯(λ−λn)=0
其中λ1,λ2,⋯ ,λn\lambda_1,\lambda_2,\cdots, \lambda_nλ1,λ2,⋯,λn就是n个特征值.
我们来看看这个方程的λn−1\lambda^{n-1}λn−1的系数.通过上面的方程,我们可以很容易计算λn−1\lambda^{n-1}λn−1为
−(λ1+λ2+⋯+λn)λn−1-(\lambda_1+\lambda_2+\cdots+\lambda_n)\lambda^{n-1}−(λ1+λ2+⋯+λn)λn−1
再次的我们可以通过∣A−λI∣=0|A-\lambda I|=0∣A−λI∣=0来求λn−1\lambda^{n-1}λn−1项.
(a11−λa12⋯a1na21a22−λ⋯a2n⋮⋮⋮an1an2⋯ann−λ)=0\left( \begin{array}{cccc} a_{11}-\lambda & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22}-\lambda & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1}& a_{n2} & \cdots & a_{nn}-\lambda \end{array} \right)=0⎝⎜⎜⎜⎛a11−λa21⋮an1a12a22−λ⋮an2⋯⋯⋯a1na2n⋮ann−λ⎠⎟⎟⎟⎞=0
这个式子的λn−1\lambda^{n-1}λn−1的系数是什么?
其实很简单,根据行列式的定义我们可以知道.非住对角元素的乘积.其他的累加项的次数最高为λn−2\lambda^{n-2}λn−2,所以这个式子的λn−1\lambda^{n-1}λn−1项只会出现在
(a11−λ)(a22−λ)⋯(ann−λ)(a_{11}-\lambda)(a_{22}-\lambda)\cdots(a_{nn}-\lambda)(a11−λ)(a22−λ)⋯(ann−λ)
这个式子的λn−1\lambda^{n-1}λn−1项的系数为
−(a11+a22+⋯+ann)λn−1-(a_{11}+a_{22}+\cdots+a_{nn})\lambda^{n-1}−(a11+a22+⋯+ann)λn−1
有因为
(λ−λ1)(λ−λ2)⋯(λ−λn)=∣A−λI∣(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_n)=|A-\lambda I|(λ−λ1)(λ−λ2)⋯(λ−λn)=∣A−λI∣
所以原式得证.
PS:一个n阶方正A的非线性相关的特征向量不一定有n个.这样的矩阵都是不能对角化的.因为可以对角化的方正A,正好会含有n个非线性相关的特征向量.比如矩阵
(1111000000000000)\left( \begin{array}{cccc} 1 & 1 & 1 & 1 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{array} \right)⎝⎜⎜⎛1000100010001000⎠⎟⎟⎞
就不能对角话
Tr(A)=Tr(AT)\operatorname{Tr}(\mathbf{A})=\operatorname{Tr}\left(\mathbf{A}^{T}\right)Tr(A)=Tr(AT)
转置矩阵于原来的矩阵对角线元素相同.(得证)
Tr(AB)=Tr(BA)\operatorname{Tr}(\mathbf{A B})=\operatorname{Tr}(\mathbf{B A})Tr(AB)=Tr(BA)
AB的对角线元素为dii=∑k=1nai,kbk,id_{ii}=\sum_{k=1}^{n}a_{i,k}b_{k,i}dii=∑k=1nai,kbk,i,而累加的结果为∑i=1ndii=∑i=1n∑k=1nai,kbk,i\sum_{i=1}^{n}d_{ii}=\sum_{i=1}^{n}\sum_{k=1}^{n}a_{i,k}b_{k,i}∑i=1ndii=∑i=1n∑k=1nai,kbk,i
BA的对角线元素为dii=∑k=1nbi,kak,id_{ii}=\sum_{k=1}^{n}b_{i,k}a_{k,i}dii=∑k=1nbi,kak,i,而累加的结果为∑i=1ndii=∑i=1n∑k=1nbi,kak,i\sum_{i=1}^{n}d_{ii}=\sum_{i=1}^{n}\sum_{k=1}^{n}b_{i,k}a_{k,i}∑i=1ndii=∑i=1n∑k=1nbi,kak,i
我们可以对BA的累加结果进行变换,如果我们交换i,k的label.可得
∑k=1n∑i=1nbk,iai,k=∑k=1n∑i=1nai,kbk,i=∑i=1n∑k=1nai,kbk,i\sum_{k=1}^{n}\sum_{i=1}^{n}b_{k,i}a_{i,k}=\sum_{k=1}^{n}\sum_{i=1}^{n}a_{i,k}b_{k,i}=\sum_{i=1}^{n}\sum_{k=1}^{n}a_{i,k}b_{k,i}k=1∑ni=1∑nbk,iai,k=k=1∑ni=1∑nai,kbk,i=i=1∑nk=1∑nai,kbk,i
由此可见原式得证.
Tr(A+B)=Tr(A)+Tr(B)\operatorname{Tr}(\mathbf{A}+\mathbf{B})=\operatorname{Tr}(\mathbf{A})+\operatorname{Tr}(\mathbf{B})Tr(A+B)=Tr(A)+Tr(B)
左边等于∑i=1n(aii+bii)\sum_{i=1}^{n}(a_{ii}+b_{ii})∑i=1n(aii+bii)
右边等于∑i=1naii+∑i=1nbii=∑i=1n(aii+bii)\sum_{i=1}^{n}a_{ii}+\sum_{i=1}^{n}b_{ii}=\sum_{i=1}^{n}(a_{ii}+b_{ii})∑i=1naii+∑i=1nbii=∑i=1n(aii+bii)
原式得证
Tr(ABC)=Tr(BCA)=Tr(CAB)\operatorname{Tr}(\mathbf{A B C})=\operatorname{Tr}(\mathbf{B C A})=\operatorname{Tr}(\mathbf{C A B})Tr(ABC)=Tr(BCA)=Tr(CAB)
可以利用14的结论来证明即可.
aTa=Tr(aaT)\mathbf{a}^{T} \mathbf{a}=\operatorname{Tr}\left(\mathbf{a a}^{T}\right)aTa=Tr(aaT)
左边∑i=1naiai\sum_{i=1}^{n}a_ia_{i}∑i=1naiai
右边对角线元素为dii=aiai⇒Tr=∑i=1naiaid_{ii}=a_{i}a_i \Rightarrow Tr=\sum_{i=1}^{n}a_{i}a_idii=aiai⇒Tr=∑i=1naiai
原式得证