1. 矩阵基础
1.1 将矩阵视为数字的数组
矩阵(Matrix)是数组的矩形数组,形式为
A=a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn
这个矩阵有m行(rows)n列(columns),若是元素为实数,我们可以说A∈Rm,n;若是元素为复数,我们可以说A∈Cm,n。矩阵的每一行都是行向量,每一列都是列向量。矩阵的转置(transposition)操作是将矩阵的行列交换
[A⊤]ij=[A]ji
符号[A]ij(有时候简写为Aij)代表矩阵第i行j列的元素。Rm,n中的零矩阵表示为0m,n,或者直接简写为0
矩阵的数乘(multiplication by a scalar)被定义为矩阵中的每个元素都与标量相乘;矩阵的加法(两个矩阵大小相同)被定义为矩阵对应位置的元素相加。定义了这些运算后,我们可以将Rm,n看作一个向量空间
1.2 矩阵乘积
如果两个矩阵的尺寸符合,他们才可以相乘。i.e. A∈Rm,n,B∈Rn,p,矩阵的乘法AB∈Rm,p被定义为
[AB]ij=k=1∑nAikBkj
矩阵乘法是非交换的(non-commutative),这意味着一般情况下AB=BA
n×n单位矩阵(identity matrix)表达为In(也可以简写为I),它是对角(diagonal)元素为1其他元素为0的矩阵。单位矩阵满足AIn=A,A有n行;InB=B,B有n列
矩阵可以看成一组行向量的组合,也可以看成一组列向量的组合
A=[a1a2⋯an],or A=α1⊤α2⊤⋮αm⊤
其中a1,⋯,an∈Rm表示A的列,即列向量;α1⊤,⋯,αn⊤∈Rn表示A的行,即行向量
因此矩阵乘积可以写为
AB=A[b1⋯bp]=[Ab1⋯Abp]
AB=α1⊤⋮αm⊤B=α1⊤B⋮αm⊤B
最终矩阵的乘积可以看成多个并矢的和(参考4.7节)
AB=i=1∑naiβi⊤
矩阵的乘积定义同样使用矩阵与向量的乘积
Ab=k=1∑nakbk
Ab的结果是一个向量,可以看成是对矩阵A中的列向量进行线性组合,系数为b中的元素。同样地,我们可以定义向量左乘矩阵
c⊤A=k=1∑mckαk⊤
定义C=AB,根据矩阵与向量乘积的定义,C=[Ab1⋯Abp]可以进一步拆分
C=[Ab1⋯Abp]=[k=1∑nakb1k⋯k=1∑nakbpk]
其中bij为向量bi的第j个元素,因此矩阵C的每一列都可以看成是对A的列向量进行线性组合得到的。同样地,C=[α1⊤B⋯αm⊤B]⊤可以进一步拆分
C=α1⊤B⋮αm⊤B=∑k=1mα1kβk⊤⋮∑k=1mαmkβk⊤
其中αij为向量αi⊤的第j个元素,因此矩阵C的每一行都可以看成是对B的行向量进行线性组合得到的。
矩阵乘积的转置满足
(A1A2⋯Ap)⊤=Ap⊤⋯A2⊤A1⊤
1.3 块矩阵乘积
只要保证块(block)大小一致,矩阵代数可以推广到块。首先考虑矩阵A与向量x的乘积,其中矩阵和向量都是分块的
A=[A1A2],x=[x1x2]Ax=A1x1+A2x2
从符号上看这就像是行向量与列向量的内积。矩阵与矩阵相乘也可以进行类似展开
AB=[A1A2][B1B2]=A1B1+A2B2
1.4 矩阵空间和内积
对于向量空间Rm,n,可以赋予一个标准内积
⟨A,B⟩=trace(A⊤B)
其中trace(X)是方阵的迹(trace),定义为方阵主对角线上元素的和。这个内积引出了所谓的Frobenius范数
⟨A,A⟩=traceAA⊤=∥A∥F:=ij∑aij2
我们的选择与向量情况下的选择是一致的。实际上,上述内积表示的是通过将矩阵A,B的所有列依次首尾相连展开得到的两个向量之间的标量积;因此,Frobenius范数就是矩阵向量化形式的欧几里得范数。
迹运算符是一个线性运算符,同时还有许多性质
traceA=traceA⊤traceAB=traceBA
2. 矩阵和线性映射
2.1 矩阵,线性和仿射映射
我们可以将矩阵解释为从输入空间到输出空间的作用的线性映射(向量值函数,即输出为向量)或者操作。我们回顾一下线性映射:当任意点x,z∈X和任意标量λ,μ∈Y满足f(λx+μz)=λf(x)+μf(z)那么映射f:X→Y为线性。任意线性映射f:Rn→Rm都可以用一个矩阵A∈Rm,n表示

放射映射就是简单地在线性方程上加一个常数项,因此任意放射映射f:Rn→Rm都可以表示为
f(x)=Ax+b
其中A∈Rm,n,b∈Rm
将向量的每个元素按某个标量因子 进行缩放的线性映射,可以用对角矩阵来描述
2.2 非线性方程的近似
一个非线性映射(在该点可微)在给定点x0的邻域内(neighborhood)可以被近似为一个仿射映射
f(x)=f(x0)+Jf(x0)(x−x0+o(∥x−x0∥))
当x→x0时o(∥x−x0∥)比一阶(first order)收敛更快,Jf是雅可比矩阵,定义为
Jf(x0):=∂x1∂f1⋮∂x1∂fm⋯⋱⋯∂xn∂f1⋮∂xn∂fmx=x0
因此对于接近x0的x,变分δf(x):=f(x)−f(x0)可以用雅可比矩阵定义的线性映射来一阶近似
一个在x0处二阶可微的标量值函数(即输出为标量)可以使用梯度和二阶导数矩阵(海森矩阵)进行二阶局部近似
f≈f(x0)+Δf(x0)⊤(x−x0)+21(x−x0)⊤Δ2f(x0)(x−x0)
其中Δ2f(x0)是海森矩阵(Hessian)定义为
Δ2f(x0):=∂x12∂2f⋮∂xn∂x1∂2f⋯⋱⋯∂x1∂xn∂2f⋮∂xn2∂2fx=x0
在这种情况下,f在局部通过由Hessian矩阵定义的二次函数进行近似
2.3 值域,秩和零空间
考虑一个矩阵A对它的列向量进行线性组合,得到的集合称为A的值域(range)或者为列空间,被写为R(A)
R(A)={Ax∣x∈Rn}
列空间是一个子空间。R(A)的维数称为A的秩(rank),记作rank(A)根据定义,秩表示A线性无关的列数量,根据证明秩也等于线性无关的行数量。因此矩阵的秩等于它转置的秩
rank(A)=rank(A⊤)
证明
假设A∈Rm,n的列秩为c,行秩为r,尝试将它拆分为BC两个矩阵,其中B矩阵由A中线性独立的列向量组成,因为A的每一列都可以通过B中的列向量线性组合得到,根据矩阵乘积的定义得知拆分是合理的。此时B∈Rm,c,C∈Rc,n。同时A的每一行都可以看成由C矩阵中的行向量线性组合得到的,因此A的行空间维数不大于C的行数,i.e. r≤c
用同样的方式对A的转置进行推导,可以得到A转置的行空间维数c不大于列空间维数r,i.e. c≤r。将两个结论对比只能取r=c。行秩等于列秩得到了证明
因此我们可以提出一个约束
0≤rank(A)≤min(m,n)
矩阵A的零空间(nullspace)是输入空间中被映射到0的向量组成的集合,记作N(A)
N(A)={x∣Ax=0}
零空间也是一个子空间
2.4 线性代数的基本理论
线性代数基本定理建立了矩阵的零空间与其转置的值域之间的重要联系。首先我们可以发现A⊤值域中的任意向量都和A零空间的任意向量正交,i.e. x⊤z=0,∀x∈R(A⊤),∀z∈N(A)。根据值域的定义,R(A⊤)中的所有向量都可以写为A中的行向量的线性组合,因此
x⊤z=(A⊤y)⊤z=y⊤Az=(y⊤A)z=0
因此R(A⊤)和N(A)是正交子空间,i.e. N(A)⊥R(A⊤)或者写为N(A)=R(A⊤)⊥。回顾Section 2.2.3,子空间和其正交补的直和等于整个空间
Rn=N(A)⊕N(A)⊥=N(A)⊕R(A⊤)
同样的我们可以证明z⊤x=0,∀x∈R(A),∀z∈N(A⊤),因此N(A⊤)⊥R(A),输出空间可以分解为
Rm=R(A)⊕R(A)⊥=R(A)⊕N(A⊤)
定理3.1(线性代数基本定理):对于任意矩阵A∈Rm,n,有N(A⊤)⊥R(A),N(A)⊥R(A⊤),因此
R(A⊤)⊕N(A)=RnR(A)⊕N(A⊤)=Rm
并且
dimN(A)+rankA=ndimN(A⊤)+rankA=m
因此,我们可以将任意向量x分解为两个互相正交的向量的和,一个在A⊤的值域中,另一个在A的零空间中:
x=A⊤y+z,z∈N(A)
类似地,我们可以将任意向量x分解为两个互相正交的向量的和,一个在A的值域中,另一个在A⊤的零空间中:
x=Aϕ+ζ,ζ∈N(A⊤)

3. 行列式、特征值和特征向量
3.1 矩阵对直线的作用
我们首先讨论,一个线性映射A如何作用于通过原点的直线(一维子空间)。考虑一个非零向量u∈Rn以及从原点出发原点并经过u的直线,即集合L={x∣x=αu,α∈R}。当矩阵作用于属于直线上的向量时,它会将该点旋转(rotate)一个固定角度θu,并将它的长度按固定量γu放大或缩小(shrink/amplify)。旋转角度θu和长度增益γu对于直线上的每个点都是恒定值
∥y∥2=∥Ax∥2=∣α∣∥Au∥2=∥u∥2∥Au∥2∣α∣∥u∥=∥u∥2∥Au∥2∥x∥2
长度增益为γu=∥u∥2∥Au∥2,对于旋转角度
cosθu=∥x∥2∥y∥2y⊤x=∥x∥2∥y∥2x⊤A⊤x=γuα2∥u∥22α2u⊤A⊤u=γu∥u∥22u⊤A⊤u
这二者都仅仅取决于直线的方向u,而不取决于直线上的实际点
当∥x∥2保持不变且方向u扫描所有可能的方向时,x会沿圆周移动,而图中显示了相应的y的轨迹

通过数值实验可以发现,在这个例子中存在两个输入方向u(1)、u(2),它们在由A定义的映射下是角度不变的即角度θu为零(或 ±180∘),此时A在这些直线上表现为标量乘法

3.2 行列式和单位立方体的变化
对于一个2×2的矩阵
A=[a11a21a12a22]
这个矩阵的行列式(determinant)被定义为
detA:=a11a22−a12a21
要求解一般矩阵的行列式,首先要定义标量a的行列式deta=a,然后应用拉普拉斯行列式展开(Laplace’s determinant expansion)来计算
det(A)=j=1∑n(−1)i+jaijdetA(i,j)
其中i是任意一行,A(i,j)表示通过删除A的第i行和第j列得到的一个(n−1)×(n−1)子矩阵
假设我们将线性映射y=Ax应用于R2中单位正方形顶点的四个向量,变换后的点构成一个平行四边形的顶点

单位正方形的面积为一。通过验证可以知道变换后的四边形(即平行四边形)的面积等于矩阵行列式的绝对值。可以证明,在一般维数n中,矩阵A的行列式的绝对值仍然描述了单位超立方体通过A变换得到的平行多面体的体积
行列式是定义在方阵上的实值函数,矩阵的行列式有以下性质
- 交换矩阵的两行或者两列会改变行列式的符号
- 行列式在矩阵的每一行/列上都是线性的
- 单位矩阵的行列式为1
当变换后的立方体体积为零时,也就是行列式为零时,此时矩阵为奇异矩阵(singular)。此时矩阵某一行(或某一列)是另一行(或另一列)的倍数,列(和行)不再是线性无关的,并且矩阵具有非平凡的零空间(零空间不只有原点)。这意味着存在输入空间中的方向,沿着这些方向所有输入向量都被A映射为零,可以证明
A∈Rn,n is singular ⇔detA=0⇔N(A) is not equal to {0}.
对于任意方阵A,B∈Rn,n有如下性质
detA=detA⊤detAB=detBA=detAdetBdetαA=αndetA
对于分块上三角(upper block-triangular)矩阵
X=[X11X21X12X22]
有如下结论
detX=detX11+detX22
对于分块下三角(lower block-triangular)矩阵也有类似结论
3.3 矩阵的逆
对于一个非奇异矩阵A,我们定义它的逆矩阵(inverse matrix)A−1定义为满足以下条件的唯一矩阵
AA−1=A−1A=In
矩阵求逆有以下性质
(AB)−1=B−1A−1(A⊤)−1=(A−1)⊤detA=detA⊤=detA−11
对于非方阵或是奇异方阵不存在常规意义的逆矩阵,但是可以定义广义逆矩阵(generalized inverse)/伪逆矩阵(pseudoinverse)。对于一般矩阵A∈Rm,n,如果满足
AliA=In,m≥nAAri=Im,n≥m
则Ali被称为A的左逆,Ari被称为A的右逆
如果AApiA=A,则称矩阵Api为A的伪逆。左逆、右逆和伪逆将在Chapter 5中进一步讨论
3.4 相似矩阵
如果存在一个非奇异矩阵P∈Rn,n,使得两个矩阵A,B∈Rn,n满足如下条件,则称它们是相似(similar)的
B=P−1AP
相似矩阵是同一线性映射在不同空间基的不同表现。考虑原空间的线性映射
y=Ax
由于P是非奇异的,其列向量是线性无关的,因此它们代表了Rn,n的一组基。向量y和x可以在该基下表示为P列向量的线性组合
Ay~=yAx~=x
线性映射在新基下表达为
y=Ax⇒y~=P−1APx~=Bx~
3.5 特征向量和特征值
我们前面在研究矩阵对直线的作用时提到过,矩阵会对对直线上的点(向量)进行旋转和放缩,我们现在将视角从Rn扩大到Cn。特征向量(eigenvector)只是Cn中在矩阵作用下角度不变的方向,特征值(eigenvalue)是对点放缩的系数。更准确地说,如果存在λ∈C是矩阵A∈Rn,n的特征值,且u∈Cn是对应的特征向量,则下式成立
Au=λu,u=0
或者等价形式
(λIn−A)u=0,u=0
方程表明为了使(λ,u)成为特征值/特征向量对,必须满足以下条件:
- λ的取值要使矩阵λIn−A奇异
- u位于λIn−A的零空间中
由于λIn−A当且仅当其行列式为零时是奇异的,因此特征值可以很容易地被描述为满足下述方程的实数或复数
det(λIn−A)=0
p(λ):=det(λIn−A)是关于λ的n次多项式,被称为矩阵A的特征多项式(characteristic polynomial)。因此,矩阵的特征值就是特征多项式的根。其中一些特征值确实可以是特征多项式的“重根”。此外,一些特征值可能是复数,具有非零的虚部,在这种情况下,它们成共轭复数对出现。下列定理成立
定理3.2(代数学基本定理):任意矩阵A∈Rn,n都有n个特征值,按重数计算。
我们称不考虑重数的特征值为互异特征值(distinct eigenvalues),每个互异特征值都有一个对应的代数重数(algebraic multiplicity)μi≥1,定义为该特征值作为特征多项式根出现的次数。因此∑i=1kμi=n
对于每个互异特征值都对应一个由与该特征值相关的特征向量组成的整个子空间Vi:=N(λiIn−A),称为特征空间。属于不同特征空间的特征向量是线性无关的
定理3.3:设λi是矩阵A的互异特征值。设Vi=N(λiIn−A),并且令u(i)为任意非零向量,使得u(i)∈Vi。则这些u(i)线性无关
证明
首先证明两个向量是线性无关的
假设最初u(i)∈Vj,j=i。这意味着Au(i)=λju(i)=λiu(i),因此λi=λj,但这是不可能的,因为这些λ是互异的。假设矛盾,所以任意两个向量是线性无关的
但是向量组中任意两个向量线性无关,向量组不一定线性无关,因此还需要证明整个特征向量组是线性无关的
为了反证法的目的,假设存在一个u(i)(例如不失一般性,取第一个,u(1)可以表示为其他特征向量的线性组合:
u(1)=i=2∑kαiu(i)
然后我们有两个恒等式
λ1u(1)=i=2∑kαiλ1u(i)λ1u(1)=Au(1)=i=2∑kαiAu(i)=i=2∑kαiλiu(i)
比较两个方程可以得到
i=2∑kαi(λi−λ1)u(i)=0
其中λi−λ1=0,因为根据假设,特征值是互异的。这意味着∑i=2kαiu(i)为零,所以u(2),⋯,u(k)是线性相关的。因此至少有一个向量,比如说不失一般性,u(2),可以表示为其他向量u(3),⋯,u(k)的线性组合。在此基础上,通过重复最初的推理,我们也会得出u(3),⋯,u(k)是线性相关的。以此类推,我们最终会得出u(k−1),u(k)是线性相关的结论。根据我们前面的证明,这是不可能的。因此,我们得出假设与事实矛盾,从而该命题得证
这部分将整个特征向量组是线性无关的证明推导成任意两个向量是线性无关的
得益于特征值和特征向量,一个方阵可以被表示为与一个分块三角矩阵相似,即具有以下形式的矩阵
A110⋮0A12A22⋱⋯⋯⋯⋱0A1pA2p⋮App
其中对角线上的矩阵为方阵
设vi为Vi的维数,并设一个矩阵U(i)=[u1(i)…uvi(i)],其列为Vi的一组基。在不失一般性的情况下,该矩阵可以选择为列正交归一的矩阵。实际上,可以先选任意一组基,并对该基应用Gram–Schmidt正交化过程(见Section2.3.3),即可得到标准正交基。通过这种选择,有U(i)⊤U(i)=Ivi。进一步设Q(i)为一个n×(n−vi)矩阵,其列标准正交并张成与R(U(i)) 正交的子空间
推论3.1:任意矩阵A∈Rn,n都与一个分块三角矩阵相似,该矩阵在对角线上具有块λiIvi,其中λi是A的一个互异特征值,vi是对应特征空间的维数
证明
符合矩阵Pi:=[U(i)Q(i)]是一个正交矩阵(Pi的列向量形成一个覆盖整个Cn空间的标准正交(orthonormal)基,参考Section3.4.64.6节),因此它是可逆(invertible)的,并且Pi−1=Pi⊤,参考Section3.4.64.6节。因为AU(i)=λiU(i),可以得到
U(i)⊤AU(i)=λiU(i)⊤U(i)=λiIviQ(i)⊤AU(i)=λiQ(i)⊤U(i)=0
因此可以得到
Pi−1APi=Pi⊤APi=[λiIvi0U(i)⊤AQ(i)Q(i)⊤AU(i)]
证明完成
由于相似矩阵具有相同的特征值集合(包括重数),并且分块上三角矩阵的特征值集合是对角块特征值的并集,观察上式可以发现左上角矩阵特征值的重数为vi,因此总体的特征值重数μi必须总是满足vi≤μi,最终可以得出结论:互异特征值对应的特征空间维数总是小于等于特征值重数
3.6 可对角化矩阵
在某些假设下,A∈Rn,n与一个对角矩阵相似,即A是可对角化的(diagonalizable)。(并非所有方阵都是可对角化的。但是可以证明,总存在一个任意小的加法扰动使其可对角化)
定理3.4: 设λi是矩阵A∈Rn,n的互异特征值,设μi为对应的代数重数,定义Vi=N(λiIn−A),定义U(i)=[u1(i)…uvi(i)]的列为Vi的一组基,那么vi:=dimVi,可以得到vi≤μi。如果vi=μi那么U=[U(1)…U(k)]是可逆的,并且A=UΛU−1,其中
Λ=λ1Iμ10⋮00λ2Iμ2⋮⋯⋯⋯⋱000⋮λkIμk
证明
vi:=dimVi已经在前文证明了。现在令vi=μi。因为向量u1(i),…,uvi(i)是特征空间的基,因此它们是线性无关的。此外,根据定理3.3,不同特征值对应的特征空间中的基是线性无关的。这意味着整个集合{uj(i)}i=1,…,k;j=1,…,vi是线性无关的。那么矩阵U是满秩的。由于对所有i有vi=μi,那么∑i=1kvi=∑i=1kμi,此时U∈Rn,n是方阵,且是满秩故而可逆
对于每个i=1,…,k,我们有Auj(i)=λiuj(i),可以将同一个特征值下的等式写进一个矩阵
AUj(i)=λiuj(i)
再将不同特征值的等式写进一个矩阵
AU=UΛ
将等式两边同时右乘U−1,可得到所证
4. 具有特殊结构和性质的矩阵
4.1 方阵
方阵(square matrix)是指行数和列数相同的矩阵
4.2 稀疏矩阵
非正式地说,如果矩阵中的大多数元素为零,则称其为稀疏矩阵(sparse matrix)。在处理稀疏矩阵时,可以获得若干计算效率的提高。例如,可以仅存储其非零元素。此外,通过仅处理矩阵的非零元素,像加法和乘法这样的操作也可以高效地进行
4.3 对称矩阵
对称矩阵(symmetric matirx)是满足A=A⊤的方阵。一个对称的n×n矩阵由主对角线及其上方的元素决定,对角线下方的元素是上方元素的对称副本。因此,对称矩阵的“自由”元素的数量是
n+(n−1)+⋯+1=2n(n+1)
对称矩阵在Chapter4进一步讨论
4.4 对角矩阵
对角矩阵(diagonal matrices)是指除对角线上以外的元素全为0的方阵。一个n×n的对角矩阵可以表示为A=diag(a),其中a是一个包含A对角元素的n维向量
A=diag(a1,⋯,an)=a1⋱an
通常对角线以外的零元素省略不写。易证,对角矩阵的特征值就是对角线上的元素。此外,对角矩阵的行列式值为对角线上的元素乘积,因此当且仅当对角线上元素全不为0时矩阵是非奇异的。非奇异对角矩阵的逆矩阵非常简单,是
A−1=a11⋱an1
4.5 三角矩阵
三角矩阵(triangular matrix)是指所有在对角线之上或之下的元素都为零的方阵。特别地,上三角矩阵(upper-triangular matrix)为
A=a11⋯⋱a1n⋮ann
下三角矩阵(lower-triangular matrix)为
A=a11⋮an1⋱⋯ann
与对角矩阵类似,三角矩阵的特征值是对角线上的元素,并且行列式值为对角线上的元素乘积。两个上(resp. 下)三角矩阵的乘积仍然是上(resp. 下)三角矩阵。非奇异上(resp. 下)三角矩阵的逆矩阵仍然是上(resp. 下)三角矩阵
4.6 正交矩阵
正交矩阵(orthogonal matrix)是列向量能够组成Rn空间中的标准正交基的方阵,所以对正交矩阵U=[u1⋯un]有
ui⊤uj={10ifi=j,otherwise.
因此U⊤U=UU⊤=In,还可以得到U⊤=U−1。正交矩阵保持长度和角度。对于任意向量x
∥Ux∥22=(Ux)⊤(Ux)=x⊤U⊤Ux=x⊤x=∥x∥22
因此,x→Ux保持长度不变。此外,正交映射还保持角度不变:如果x,y是两个单位范数向量,则它们之间的角度θ满足cosθ=x⊤y,而旋转后的向量x′=Ux、y′=Uy之间的角度θ′满足cosθ′=(x′)⊤y′=x⊤y,因此旋转前后两个向量的夹角是相同的。反之亦然:任何保持长度和夹角不变的方阵都是正交的。此外,一个矩阵在前后分别乘以正交矩阵不会改变Frobenius范数(以及在Section 3.6.3正式定义的L2诱导范数)
∥UAV∥F=∥A∥F
矩阵可以看成对直线的旋转,而正交矩阵可以写成三角函数形式
U(θ)=[cosθsinθ−sinθcosθ]
这个矩阵看成角度θ的逆时针旋转
4.7 并矢
如果矩阵A∈Rm,n可以表示为A=uv⊤的形式,其中u∈Rm且v∈Rn,则称A为并矢(dyad)。如果u和v的维度相同,则A是方阵。二次型作用于输入向量 x ∈ Rn 的方式如下:
并矢的每一行(resp. 每一列)都是v(resp. u)的缩放版本,缩放的系数由向量u(resp. v)给出。而矩阵与向量的乘积可以看成对矩阵列元素的线性组合。综上,并矢与向量的乘积可以看成对u的缩放
Ax=(uv⊤)x=(v⊤x)u
并矢与向量的乘积输出总是指向相同的方向u,无论输入x是什么。因此输出总是u的一个简单缩放版本。缩放的量取决于v⊤x
如果u和v都非零,则并矢的秩为一,因为它的值域是由u生成的直线。一个方形并矢只有一个非零特征值λ=v⊤u,对应的特征向量为u。我们总可以对并矢进行归一化:
A=uv⊤=(∥u∥2∥v∥2)∥u∥2u∥v∥2v⊤=σu~v~⊤
其中σ为两个向量的范数乘积,∥u~∥2=∥v~∥2=1
4.8 块结构矩阵
任何矩阵都能被划分为块或子矩阵
A=[A11A21A12A22]
未完待续