docs/math/linear-algebra/linear-mapping.md
研究线性映射是研究线性空间之间的映射.
线性映射可以表示为矩阵的形式,所以在线性映射中矩阵中的大量概念都可以找到对应关系.
设 $V$ 和 $W$ 是域 $F$ 上的两个线性空间,$T$ 是 $V$ 到 $W$ 的一个映射.
如果对于 $W$ 中任意的向量 $x$ 和 $y$,域 $F$ 中任意的标量 $k$ 和 $l$,有:
$$ T(kx+ly)=kTx+lTy $$
称 $T$ 是 $V$ 到 $W$ 的一个线性映射.如果 $W=V$,则称 $T$ 是 $V$ 上的一个线性变换.
例如,恒等变换 $T_e$ 保持空间不变,零变换 $T_0$ 将空间映射至零空间.
可以记 $L(V,W)$ 为所有 $V$ 到 $W$ 的线性映射构成的集合.对于全体线性变换 $L(V,V)$,也记为 $L(V)$.
但是线性映射不保持线性无关性.映射前线性无关,映射后不一定线性无关.
设 $V$ 的维数是 $n$,$V$ 的一组基为 $\alpha_1,\cdots,\alpha_n$,$W$ 的维数是 $m$,$W$ 的一组基为 $\beta_1,\cdots,\beta_m$,$T$ 是 $V$ 到 $W$ 的一个线性映射.
将每个 $\alpha$ 经由 $T$ 映射后的向量用 $\beta$ 表示:
$$ T\alpha_j=a_{1j}\beta_1+\cdots+a_{mj}\beta_m $$
采用矩阵记法:
$$ T(\alpha_1,\cdots,\alpha_n)=(T\alpha_1,\cdots,T\alpha_n)=(\beta_1,\cdots,\beta_m)A $$
称矩阵 $A$ 为线性映射 $T$ 在这两组基下的矩阵表示.
这里的核空间与像空间是站在线性映射的视角下叙述的.借助矩阵表示可以看出,线性映射的核空间与像空间与矩阵的核空间与像空间是一致的.
设 $T$ 是由空间 $V$ 到空间 $W$ 的线性映射,令:
$$ N(T)={x\in V|Tx=0} $$
$$ R(T)=Im(T)={y\in W|y=Tx,Vx\in V} $$
易验证 $N(T)$ 为 $V$ 的子空间,$R(T)$ 为 $W$ 的子空间,称 $N(T)$ 及 $R(T)$ 为 $V$ 的核空间和像空间,并称 $N(T)$ 的维数为 $T$ 的 零度 或 亏,$R(T)$ 的维数为 $T$ 的 秩.
定理:设 $T$ 是由空间 $V$ 到空间 $W$ 的线性映射,$V$ 的维数有限,则 $N(T)$ 及 $R(T)$ 均为有限维,且有:
$$ \operatorname{dim} N(T)+\operatorname{dim} R(T)=\operatorname{dim} V $$
即 $T$ 的亏加秩等于其定义域 $V$ 的维数.
设 $V$ 的维数是 $n$,$V$ 的一组基为 $\alpha_1,\cdots,\alpha_n$,$T$ 是 $V$ 上的一个线性变换,则有:
$$ T\alpha_j=a_{1j}\alpha_1+\cdots+a_{nj}\alpha_n $$
采用矩阵记法:
$$ T(\alpha_1,\cdots,\alpha_n)=(T\alpha_1,\cdots,T\alpha_n)=(\alpha_1,\cdots,\alpha_n)A $$
称矩阵 $A$ 为线性变换 $T$ 在这组基下的矩阵表示.
由空间结构和 $T$ 的线性性质,$T$ 由 $T\alpha_1,\cdots,T\alpha_n$ 完全确定,故由 $T$ 唯一确定一个矩阵 $A$.
定理:设 $V$ 的维数是 $n$,$\alpha_1,\cdots,\alpha_n$ 为 $V$ 的一组基,任取 $n$ 阶方阵 $A$,有且仅有一个从 $V$ 到 $V$ 的线性变换 $T$,使得 $T$ 的矩阵恰好为 $A$.
推论:在 $L(V,V)$ 和全体 $n$ 阶方阵之间存在一一对应关系.
例如:零变换对应零矩阵,恒等变换对应单位矩阵.
定理:$L(V)$ 也可以构成线性空间,引入 $L(V)$ 中的运算:对于 $L(V)$ 中任意的 $T_1$ 与 $T_2$,$V$ 中任意的 $x$,域 $F$ 中任意的 $k$,有:
$$ (T_1+T_2)x=T_1x+T_2x $$
$$ (kT_1)x=k(T_1x) $$
容易验证 $L(V)$ 是 $F$ 上的一个线性空间,即线性变换空间.
对于 $L(V)$ 中的线性变换 $T_1$ 与 $T_2$,定义 $T_1$ 与 $T_2$ 的乘积 $T_1T_2$ 为:
$$ (T_1T_2)x=T_2(T_1x) $$
可以验证 $(T_1T_2)$ 也是 $L(V)$ 中的线性变换,并且线性变换的乘积满足结合律,而不满足交换律,与矩阵的乘积类似.
对于 $L(V)$ 中的线性变换 $T_1$,如果 $L(V)$ 中的线性变换 $T_2$,使得对于 $V$ 中任意的向量 $x$,有:
$$ (T_1T_2)x=T_1(T_2x)=x $$
则称 $T_2$ 是 $T_1$ 的逆变换,记作:
$$ T_2=T_1^{-1} $$
且有:
$$ T_1T_2=T_2T_1=T_e $$
定理:设 $V$ 的维数为 $n$,$\alpha_1,\cdots,\alpha_n$ 为 $V$ 的一组基,在这组基下线性变换 $T_1$ 的矩阵为 $A$,$T_2$ 的矩阵为 $B$,则:
设 $n$ 个向量 $x$ 是 $n$ 维空间 $V$ 的一个基,对于 $V$ 中任意的向量 $y$,令 $y$ 为:
$$ y=a_1x_1+a_2x_2+\cdots+a_nx_n=(x_1,x_2,\cdots,x_n)\begin{pmatrix}a_1\a_2\\vdots\a_n\end{pmatrix} $$
称列向量:
$$ \begin{pmatrix}a_1\a_2\\vdots\a_n\end{pmatrix} $$
为向量 $y$ 在基 $x_1,x_2,\cdots,x_n$ 下的 坐标.
可见,坐标是由域中的标量构成的列向量,与阿贝尔群中的向量应当进行区分.
设 $V$ 的维数为 $n$,$L(V)$ 中有变换 $T$,$T$ 在基 $\alpha_1,\cdots,\alpha_n$ 下的矩阵为 $A$.设:
$$ \xi=(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}x_1\x_2\\vdots\x_n\end{pmatrix} $$
且有:
$$ T\xi=T(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}y_1\y_2\\vdots\y_n\end{pmatrix} $$
则有:
$$ T\xi=T(\alpha_1,\cdots,\alpha_n)\begin{pmatrix}y_1\y_2\\vdots\y_n\end{pmatrix}=(\alpha_1,\cdots,\alpha_n)A\begin{pmatrix}x_1\x_2\\vdots\x_n\end{pmatrix} $$
空间 $V$ 中的列向量点本质上都是「基乘坐标」的形式.空间 $V$ 中的列向量点 $x$,本身用了单位阵 $I$ 作为基,即 $x=Ix$.
只有同一个基,基不动的时候,单纯的线性变换 $T$,就是坐标左乘普通矩阵.
把线性变换 $T$ 看成对于空间 $V$ 的一个观测滤镜.线性变换 $T$ 的作用对象是空间 $V$,将空间 $V$ 扭曲了.加了滤镜之后,点本身的位置没有变.
这个定理也说明,对于列向量基的线性变换 $T$,等价于对于基右乘一个过渡矩阵.
于是,在不同的基之间,坐标关系是左乘过渡矩阵的逆矩阵.
设 $n$ 个向量 $x$ 与 $n$ 个向量 $y$ 是空间 $V$ 的两组基.对于 $1\leq i\leq n$,令每个向量 $y_i$ 在基 $x_1,x_2,\cdots,x_n$ 下的坐标为:
$$ y_i=(x_1,x_2,\cdots,x_n)\begin{pmatrix}a_{1i}\a_{2i}\\vdots\a_{ni}\end{pmatrix} $$
于是 $n$ 个向量 $y$ 排成等式左边的矩阵,$n$ 个坐标排成等式右边的矩阵 $A$:
$$ (y_1,y_2,\cdots,y_n)=(x_1,x_2,\cdots,x_n)A $$
矩阵 $A$ 称为由基 $x_1,x_2\cdots,x_n$ 到基 $y_1,y_2\cdots,y_n$ 的 过渡矩阵,也称为变换矩阵.
显然过渡矩阵可逆.对于上式,由基 $y_1,y_2\cdots,y_n$ 到基 $x_1,x_2\cdots,x_n$ 的过渡矩阵为 $A^{-1}$.
可见,过渡矩阵是由域中的标量构成的矩阵,并非阿贝尔群中的向量排成的矩阵,应当予以区分.
设 $n$ 个向量 $x$ 与 $n$ 个向量 $y$ 是空间 $V$ 的两组基.对于空间 $V$ 中的同一个向量 $z$,有:
$$ z=(x_1,x_2,\cdots,x_n)\begin{pmatrix}\xi_1\\xi_2\\vdots\\xi_n\end{pmatrix}=(y_1,y_2\cdots,y_n)\begin{pmatrix}\eta_1\\eta_2\\vdots\\eta_n\end{pmatrix} $$
代入上文的
$$ (y_1,y_2\cdots,y_n)=(x_1,x_2\cdots,x_n)A $$
由唯一性,得到:
$$ \begin{pmatrix}\xi_1\\xi_2\\vdots\\xi_n\end{pmatrix}=A\begin{pmatrix}\eta_1\\eta_2\\vdots\\eta_n\end{pmatrix} $$
或者
$$ \begin{pmatrix}\eta_1\\eta_2\\vdots\\eta_n\end{pmatrix}=A^{-1}\begin{pmatrix}\xi_1\\xi_2\\vdots\\xi_n\end{pmatrix} $$
这是纯粹坐标之间的变换,坐标变换公式均在标量域中.由于前文做了区分,线性空间与阿贝尔群中的向量是「抽象的向量」,而坐标与过渡矩阵的元素均在标量域中,视为「具体的向量」,两种向量应当视为「不同的东西」.
矩阵可以对整个空间,即全体坐标进行变换,列向量 $x$ 作为坐标遍布整个空间.
单位矩阵 $I$ 由单位向量构成.矩阵 $A$ 会将单位矩阵 $I$ 变换到矩阵 $A$ 的每个列向量,即将单位向量变换到矩阵 $A$ 的每个列向量.因此左乘矩阵 $A$,也可以视为将空间做了这样的变换.
向量左乘矩阵,也可以视为坐标左乘向量组.用坐标的观点看待就是:
$$ Iy=Xa $$
同一个列向量 $y$,在「正常」的空间,单位矩阵 $I$ 代表的空间下,坐标为 $y$,在变换后新的空间里,坐标将记为 $a$.这样一来,矩阵 $X$ 不仅是正常空间下的一组基,也是从向量组 $I$ 到向量组 $X$ 的过渡矩阵.
线性变换 $T$ 会将一个基映射为另一个基,于是坐标也被映射为另一个坐标.
如果将基 $\alpha$ 映射到 $\beta$ 对应的线性变换 $T$ 的过渡矩阵是 $A$,那么对应的基矩阵就有 $\beta=\alpha A$.
于是坐标的关系恰好反过来.假设线性变换 $T$ 映射后的坐标是 $b$,即加滤镜后观察到坐标 $b$,于是点在 $V$ 的表示就是 $\beta b$.还原的办法就是用过渡矩阵,把点在 $V$ 的表示写成 $\alpha Ab$.于是坐标变换为左乘过渡矩阵的逆矩阵的看法就明显了.
在空间 $V$ 中的一个线性变换 $T$ 对于空间 $V$ 的基 $\alpha$ 的关系:
线性变换 $T$ 作用于基 $\alpha$,将基 $\alpha$ 映射到了 $T(\alpha)$,相当于在基 $\alpha$ 右乘一个 $A$,即 $T(\alpha)=\alpha A$.
矩阵相似考虑的问题是:同一个线性变换 $T$,在基 $\beta$ 的空间 $V$ 中描述为矩阵 $B$,在基 $\alpha$ 的空间 $V$ 中描述为矩阵 $A$.
如果过渡矩阵为 $C$,即 $\beta=\alpha C$,那么两个描述 $B$ 和 $A$ 之间有怎样的联系.
由于是同一个变换 $T$,可以发现一个事实,变换前后的过渡矩阵关系始终成立,即:
$$ T(\beta)=T(\alpha)C=\alpha AC $$
线性变换 $T$ 在基 $\beta$ 视角下仍旧为右乘,基 $\beta$ 转化到基 $\alpha$ 再右乘一个 $C$,变换前后保持过渡矩阵 $C$ 的关系:
$$ T(\beta)=\beta B=\alpha CB $$
于是问题得到解决:
$$ B=C^{-1}AC $$
定理:设 $L(V)$ 中有变换 $T$,则 $T$ 在不同基下的矩阵 相似.
对于方阵 $A$ 和方阵 $B$,如果存在可逆矩阵 $C$ 使得 $B=C^{-1}AC$,则 $A$ 和 $B$ 相似.
矩阵相似保持秩不变,因此矩阵相似可以推出矩阵等价.但是,等价的两个矩阵未必相似.
由于矩阵相似与形状密切相关,因此矩阵相似和向量组等价、方程组同解之间没有关系.
回过头来,矩阵相似的解释就是 4 个等式:$\beta=\alpha C$、$T(\alpha)=\alpha A$、$T(\beta)=\beta B$、$T(\beta)=T(\alpha)C$.