线性代数（3）

Iola ·

更新时间:2024-11-10

· 739 次阅读

目录Ax=bAx=bAx=b无解时的求解空间投影最小二乘上的应用正交矩阵Gram-Schmidt正交化A=QR分解A=QR分解A=QR分解 Ax=bAx=bAx=b无解时的求解

从线性代数（1）列空间的讨论可知，如果bbb不在AAA的列空间C(A)C(A)C(A)内，那么Ax=bAx=bAx=b无解

在实际应用中这种无解的情况很多：
1）因为观察/测量的数据总会有误差，无法保证每个bib_ibi都是精确的；
2）未知数少，而限制条件多

先说结论：将Ax=bAx=bAx=b转为求
ATAx^=ATb(1)A^TA\hat{x}=A^Tb \tag{1}ATAx^=ATb(1)

式(1)的解是Ax=bAx=bAx=b的最优解如果C(A)C(A)C(A)线性无关，那么ATAA^TAATA必然可逆 空间投影

先探讨一维向量空间的情况
在这里插入图片描述
如图1，p⃗\vec{p}p是b⃗\vec{b}b在a⃗\vec{a}a上的投影，有
p⃗=xa⃗e⃗=b⃗−p⃗(2)\vec{p}=x\vec{a}\\\vec{e}=\vec{b}-\vec{p} \tag{2}p=xae=b−p(2)
显然，e⃗\vec{e}e垂直于a⃗\vec{a}a，根据正交向量点积为0的定理，有
aT(b−xa)=0⇒x=aTbaTa ⇒p=xa=aaTbaTa⇒P=aaTaTa(3)a^T(b-xa)=0\\\Rightarrow x=\frac{a^Tb}{a^Ta}\\\ \ \ \ \ \ \ \ \ \ \ \Rightarrow p=xa=a\frac{a^Tb}{a^Ta}\\\Rightarrow P=\frac{aa^T}{a^Ta} \tag{3}aT(b−xa)=0⇒x=aTaaTb ⇒p=xa=aaTaaTb⇒P=aTaaaT(3)
式(3)中PPP为投影矩阵，将b⃗\vec{b}b投影到a⃗\vec{a}a上

投影矩阵3条性质：
1.秩为1（如式3，投影矩阵为列向量与行向量乘积，满足秩1矩阵的性质）
2.转置不变：PT=PP^T=PPT=P，说明投影矩阵是对称矩阵
3.平方不变：P2=PP^2=PP2=P（投影2次和投影1次结果一样）

现在在二维空间中讨论Ax=bAx=bAx=b解的问题
假设AAA的列空间基为a1a_1a1、a2a_2a2，那么当bbb不在a1a_1a1和a2a_2a2确定的平面内时，Ax=bAx=bAx=b无解

现在假设ccc是bbb在a1a_1a1和a2a_2a2确定的平面上的投影，即
c=x^1a1+x^2a2(4)c=\hat{x}_1a_1+\hat{x}_2a_2 \tag{4}c=x^1a1+x^2a2(4)
那么Ax^=cA\hat{x}=cAx^=c肯定有解，而且是Ax=bAx=bAx=b误差最小的解

令eee为从bbb到ccc的投影“垂线”，那么有
e=b−Ax^(5)e=b-A\hat{x} \tag{5}e=b−Ax^(5)
并且
a1T(b−Ax^)=0a2T(b−Ax^)=0(6)a_1^T(b-A\hat{x})=0\\a_2^T(b-A\hat{x})=0 \tag{6}a1T(b−Ax^)=0a2T(b−Ax^)=0(6)
将式(6)表示为矩阵形式
AT(b−Ax^)=0(7)A^T(b-A\hat{x})=0 \tag{7}AT(b−Ax^)=0(7)
从而
x^=(ATA)−1ATb(8)\hat{x}=(A^TA)^{-1}A^Tb \tag{8}x^=(ATA)−1ATb(8)
式(8)就是Ax=bAx=bAx=b的最优解

最小二乘上的应用

假设有3组二维数据[1 1]T[1\ 1]^T[1 1]T、[2 2]T[2\ 2]^T[2 2]T、[3 2]T[3\ 2]^T[3 2]T，需要拟合一条误差最小的直线

令直线为y=x1+x2ty=x_1+x_2ty=x1+x2t，上述问题可以表示为式(9)的矩阵形式
[111213][x1x2]=[122](9)\left[\begin{matrix}1&1\\1&2\\1&3\end{matrix}\right]\left[\begin{matrix}x_1\\x_2\end{matrix}\right]=\left[\begin{matrix}1\\2\\2\end{matrix}\right] \tag{9}⎣⎡111123⎦⎤[x1x2]=⎣⎡122⎦⎤(9)
显然上式无解，应用式(8)，可求得最优解：x^=[23 12]T\hat{x}=[\frac{2}{3}\ \frac{1}{2}]^Tx^=[32 21]T
即拟合的直线方程为y=23+12ty=\frac{2}{3}+\frac{1}{2}ty=32+21t

现在用传统的目标函数的方式求解：
min[(x1+x2−1)2+(x1+2x2−2)2+(x1+3x2−2)2](10)min[(x_1+x_2-1)^2+(x_1+2x_2-2)^2+(x_1+3x_2-2)^2] \tag{10}min[(x1+x2−1)2+(x1+2x2−2)2+(x1+3x2−2)2](10)
式(10)分别对x1x_1x1和x2x_2x2求偏导，有
3x1+6x2=56x1+14x2=11(11)3x_1+6x_2=5\\6x_1+14x_2=11 \tag{11}3x1+6x2=56x1+14x2=11(11)
求解上述方程组，得x1=23x_1=\frac{2}{3}x1=32，x2=12x_2=\frac{1}{2}x2=21，与式(8)得到的结果一致

正交矩阵
标准正交向量：qiTqj={0i≠j1i=jq_i^Tq_j=\begin{cases}0&i\neq j\\1&i=j\end{cases}qiTqj={01i=ji=j

正交矩阵：Q=[q1q2...qn]Q=\left[\begin{matrix}q_1&q_2&...&q_n\end{matrix}\right]Q=[q1q2...qn]，其中qiq_iqi互相为标准正交向量，并且QQQ为方阵

需要注意正交矩阵必须为方阵，这个是历史原因，其实并没道理
根据正交矩阵的定义，一定有
QTQ=IQT=Q−1(12)Q^TQ=I\\Q^T=Q^{-1} \tag{12}QTQ=IQT=Q−1(12)
Gram-Schmidt正交化
给定一个线性无关向量组a1,a2,...,ana_1,a_2,...,a_na1,a2,...,an，可以通过施密特正交法将其转换为相互正交的向量组b1,b2,...,bnb_1,b_2,...,b_nb1,b2,...,bn

b1=a1b2=a2−<a2,b1><b1,b1>b1b3=a3−<a3,b1><b1,b1>b1−<a3,b2><b2,b2>b2...bn=an−<an,b1><b1,b1>b1−<an,b2><b2,b2>b2−...−<an,bn−1><bn−1,bn−1>bn−1(13)\begin{aligned}b_1 &=a_1\\b_2&=a_2-\frac{}{}b_1\\b_3 &=a_3-\frac{}{}b_1-\frac{}{}b_2\\...\\b_n &=a_n-\frac{}{}b_1-\frac{}{}b_2-...-\frac{}{}b_{n-1}\end{aligned} \tag{13}b1b2b3...bn=a1=a2−b1=a3−b1−b2=an−b1−b2−...−bn−1(13)
式(13)的bi∣∣bi∣∣\frac{b_i}{||b_i||}∣∣bi∣∣bi便得到标准正交向量
式(13)的<an,bn−1><bn−1,bn−1>=bn−1Tanbn−1Tbn−1(14)\frac{}{}=\frac{b_{n-1}^Ta_n}{b_{n-1}^Tb_{n-1}} \tag{14}=bn−1Tbn−1bn−1Tan(14)

回忆空间投影里的式(2)和(3)，可以发现(13)的形式与其一致
事实上式(13)可以解释为：b2b_2b2是a2a_2a2投影到a1a_1a1的那个eee（图1）
A=QR分解A=QR分解A=QR分解
对任意A∈Rm×n(m≥n)A\in \mathbb{R}^{m\times n}(m\geq n)A∈Rm×n(m≥n)，总有A=QR(15)A=QR \tag{15}A=QR(15)
其中Q∈Rm×nQ\in \mathbb{R}^{m\times n}Q∈Rm×n，其列空间是AAA列空间的标准正交向量
其中R∈Rn×nR\in \mathbb{R}^{n\times n}R∈Rn×n是上三角矩阵[r1r20r3]\left[\begin{matrix}r_1&r_2\\0&r_3\end{matrix}\right][r10r2r3]

作者：zizi7

线性代数代数线性

1024 个赞

编辑举报

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

gbk utf8如何选择正确理解和使用GBK及UTF-8网页编码

Brigitte 2021-08-06

924

如何利用IIS调试ASP.NET网站程序详解

Bianca 2021-04-26

912

相对、绝对和固定定位的比较

Julie 2020-06-28

972

C语言实现线性动态(单向)链表的示例代码

Sela 2022-10-24

628

C++线性表深度解析之动态数组与单链表和栈及队列的实现

Isoke 2022-10-24

350

C++哈希表之线性探测法实现详解

Daphne 2022-10-24

1845

C语言线性表全面梳理操作方法

Catherine 2022-10-24

1359

C语言超详细介绍与实现线性表中的无头单向非循环链表

Tulla 2022-10-24

1173

C语言超详细介绍与实现线性表中的带头双向循环链表

Phedra 2022-10-24

278

C语言数据结构线性表教程示例详解

Trina 2022-10-24

621

C语言的线性表之顺序表你了解吗

Eleanor 2022-10-24

958

Android基础知识及线性布局介绍

Netany 2022-10-24

1230

详解如何在JavaScript中创建线性仪表图

Xylona 2022-10-25

926

C语言数据结构不挂科指南之线性表详解

Gella 2022-11-04

1109

Python图像处理之图像的灰度线性变换

Adonia 2022-11-06

674

PythonPaddlePaddle机器学习之求解线性模型

Vevina 2022-11-06

825

Android嵌套线性布局玩法坑解决方法

Heather 2022-11-07

1639

Python灰度变换中的分段线性函数专项分析实现

Catherine 2022-11-09

1964

python实现线性插值的示例

Dulcea 2022-12-07

1375

NumPy迭代数组的实现

Malinda 2023-02-20

472

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。
软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座