![机器学习数学基础](https://wfqqreader-1252317822.image.myqcloud.com/cover/482/43738482/b_43738482.jpg)
2.2.3 矩阵与线性映射
现在,我们已经知道,如果将矩阵作为线性映射或者线性变换,以的形式,就能够实现向量
的线性映射,输出为另外一个向量。
为了强化理解,再看一个旋转变换的示例:如图2-2-6所示,在二维向量空间中,向量旋转
角,变换为向量
,注意,这是发生在同一个向量空间的线性变换。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_358.jpg?sign=1739214474-3SteKr2HXd3S1PvNngwAlVdPFjW3jc6X-0-def24388c69342885375964971d5874c)
图2-2-6
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_359.jpg?sign=1739214474-ReBUcIqawtKLso5DfNzmhEi4UpSorZvp-0-016647b36339a31184261e0f658e8dbb)
此处的矩阵即为实现旋转变换的矩阵。
至此,我们已经从线性映射的角度理解了矩阵乘以向量的含义了。那么,矩阵乘以矩阵是什么含义呢?可以从以下两个角度理解2.1.5节矩阵乘法——殊途同归。
在2.1.4节,曾经把向量的概念拓展,除了列(行)向量之外,矩阵也能生成一个向量空间,它也是向量。那么,按照前述对线性映射的理解,如果矩阵A乘以矩阵B,即:AB,其含义就应该是用映射A对矩阵(向量)B实施线性映射(或线性变换)。例如:是一个二维向量空间的线性变换,此向量空间中一个矩阵
,则:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_363.jpg?sign=1739214474-MN8AJGeKp7xIFj3p9i9EnBQYEzknNgaN-0-e6464abfedfced6c4f97f03adfb48c3a)
在二维平面空间中,矩阵的每一列对应平面上的一个点,如图2-2-7中的A、B、C、O,左乘
,相当于每个点(对应前述向量)分别变换到图中平行四边形OEFG的对应各点,即原来的正方形经过线性变换成了平行四边形。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_366.jpg?sign=1739214474-fyHW1tKNayihmldNu057n9qEJSGVrsqB-0-4decb0eb98339f3fd8634aa2171d823e)
图2-2-7
例如对点A实施线性变换:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_367.jpg?sign=1739214474-BrmuXeqjsxa3dAiDtT4t6XL3PrRCon5X-0-11a7368946d695e1cf6dbac179e1cdf2)
即变换为点E。
由此,我们也就理解了为什么矩阵乘法“不能是对应元素相乘”。
由上述示例推广到更高维度的向量空间,作为原像的矩阵,左乘表示线性映射的矩阵之后,得到了像的矩阵。这就是矩阵乘以矩阵含义,非代数运算中简单地“相乘”。
此外,还可以借助函数来理解矩阵乘法的含义。对于这种类型的函数,我们并不陌生,它是指将
输入到函数
得到了输出
,然后将
作为函数
的输入得到了
。与此类似,如果对于某向量也经历了两次连续的线性映射,那么可以写成:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_375.jpg?sign=1739214474-baV2x1aYWlcP7vO1l0HFtu6wlIC8arAv-0-efdf14b2ba532c69d7aac00a2b6aff7a)
既然线性映射都可以用矩阵表示,那么上述符号若表示为矩阵,则:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_377.jpg?sign=1739214474-InBDXtsrNDV9xtah466dDokBz8Hr4jiV-0-17611448a4f55dd918596b6995040039)
由此,我们也可以认为矩阵和矩阵的乘法,就是连续发生的线性映射。
综上所述,可以总结为一句话:矩阵就是线性映射。
稍等,貌似还有一个小问题。在中,矩阵是线性映射,这相当于矩阵表示了一个过程(映射)。但是,针对单独一个矩阵,应该如何理解?比如矩阵
。
在矩阵乘法性质中,有,现在从线性映射的角度理解这个式子:
● 以二维向量空间为例,从几何角度来看,单位矩阵就是以为基的笛卡儿坐标系,如图2-2-8的(a)所示。
● 从线性映射的角度来看,就是将单位矩阵的空间用矩阵
实施线性变换,变成了图2-2-8的(b)所示的空间。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_384.jpg?sign=1739214474-IP9r89RU7s7r2iBSlXSIloQ0ptI1bOAm-0-f0ad3be67f3d67c04825a2d6cfd18471)
图2-2-8
综上两点,又因为,那么单独一个矩阵也就代表它所生成的向量空间,即对单位矩阵空间的线性变换。
在前面的各个示例中,我们已经看到,以矩阵来表征线性变换,能够实现对向量空间中的平面、体或者超平面、超体进行旋转变换、对称变换。另外还能够进行缩放变换,比如矩阵,若
,则在二维向量空间中,
将正方形
沿
轴放大到
;若
,则
将正方形
放大到
(如图2-2-9所示)。当然,图2-2-7所示也是一种典型的线性变换示例。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt002_396.jpg?sign=1739214474-2sqWpXUlESsP4IGvCAFxb7ptjGK8hpMH-0-28470cdf71ed91e66607baac911c30a8)
图2-2-9