![机器学习数学基础](https://wfqqreader-1252317822.image.myqcloud.com/cover/482/43738482/b_43738482.jpg)
1.3.2 基
在1.2.3节就已经发现,对于二维向量空间,任何一个向量都可以用两个线性无关的向量线性表出。同样来思考三维向量空间,也有类似的情况,如图1-3-2所示,向量组是
的一个线性无关的向量组(即:
),此空间中任意一个向量
可以用这三个向量线性表出,但如果给向量组
再增加一个向量,则该向量组不再是线性无关的了,也就是说这个向量组也是一个极大线性无关组。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_332.jpg?sign=1739496504-daT4SvDd5ij0kANWi9fk44jFIsc2OHKE-0-8160d479dd0ca5e540a6aaeb443ee2e2)
图1-3-2
将得到的以上结论推广到任何向量空间,如果我们都可以找到一个极大线性无关的向量组,用它可线性表出这个向量空间的任何一个向量,那么称这个极大线性无关组为该向量空间的一个基(Basis)。
再如几何空间中的向量组,是极大线性无关组,它构成了几何空间的一个基,几何空间中的任何一个向量同样可以用这三个向量的线性组合表示。只不过,相比于图1-3-2中所示的那个基,这个基不那么“特殊”。
图1-3-2所示的基的特殊性在于:向量长度都是1,且彼此垂直(另外一种称谓是正交,参阅3.4.1节),因此也称其为标准基(Standard Basis,或称标准正交基),例如的一个标准基是:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_335.jpg?sign=1739496504-9uFwDetMZOT4ry0PluRQki9zSXfe1YOp-0-510f57c530aa24ed821e5f5c8df52f68)
(1.3.1)
显然,以上我们所选择的标准基更具有特殊性,即每个向量中只有一个值是非零值。有没有别的标准基呢?是不是标准基都如此?不是!只不过像上面那样选择标准基让向量的描述更简单。如图1-3-3所示,二维向量空间中的向量(以
表示向量对象本身,即不需要依靠任何基以数学形式描述该向量),在标准基
下描述为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_339.jpg?sign=1739496504-vSrZc5Cojx8U6cjLQDXAUK52AY3YJ7Bb-0-8f260867041211e1d3b270d12b0dea12)
(1.3.2)
如果在另外一个标准基下描述,则为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_341.jpg?sign=1739496504-FZVhoSlCvIFQwJqr5BlaHkyI4eWi4nKQ-0-d288eca8c46a795bda808dc13e2e21ee)
(1.3.3)
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_342.jpg?sign=1739496504-enJo2F2zRY86FhrgmC8Rf0Si2k56krVX-0-1f432e32b978d5fde32177910d0ddcf5)
图1-3-3
比较一下,哪个更简单?一目了然。所以,基于样式的标准基描述空间的向量,更符合我们的意愿。事实上,当我们用线性代数的方式将向量表示出来的时候,就已经为它选定了一个基——向量必须在向量空间的一个基下才能描述。例如,向量
,在我们没有明确说明它的基的时候,事实上已经默认了一个基:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_345.jpg?sign=1739496504-xMksLS70Sx6w6NnKN0FQxIg5Caf8ZPRz-0-862c2babc884eca5c97aaf63fd80ea98)
类似于(1.3.1)式的基是我们常用的向量空间的默认基。
如果以基中每个向量所在方向的直线为坐标轴,如图1-3-3所示,就创建了一个坐标系(Coordinate System)。很显然,不同的基所创建的坐标系是不同的,图1-3-3分别以实线和虚线表示了上述两个基所对应的坐标系。
(1.3.2)式和(1.3.3)式分别用不同的基描述向量,其中系数
或者
,称为坐标。
如果对进行乘法和加法运算,就得到了
。由此可见,在这个坐标系中,向量的描述和坐标是完全一致的,并且符合我们的直观感觉。所以,在讨论某个空间的列向量或者行向量的时候,如果写成了类似这样的方式,就意味着该向量是基于空间的
标准基描述的(回顾1.1节对向量的描述)。
把上述经验推广到其他向量空间,设(
表示列向量)是某个向量空间的一个基,则该空间中一个向量
可以描述为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_355.jpg?sign=1739496504-rGhdonE2zqlJhCOHHybr69lqu4V6bAPA-0-115f7184314be66595297dd328aea43a)
(1.3.4)
其中的即为向量
在基
的坐标。
如果有另外一个基(
表示列向量),向量
又描述为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_362.jpg?sign=1739496504-crHbDzEAjzQQwsmCjXXxHRhhMvo97SEb-0-fd33497d7ee19670b58d3c4d611e4958)
(1.3.5)
那么,同一个向量空间的这两个基有没有关系呢?有。不要忘记,基是一个向量组,例如基中的每个向量也在此向量空间,所以可以用基
线性表出,即:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_365.jpg?sign=1739496504-gBZMTWoXgHMRx0Fe3GeqaxSvrHD5FjTw-0-15b27f2ba84fade477563367b5123e45)
以矩阵(这里提前使用了矩阵的概念,是因为本书已经在前言中声明,我们假定读者学过高等数学。关于矩阵的更详细内容,请参阅第2章)的方式,可以表示为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_366.jpg?sign=1739496504-Zl6BM0Isd8IbS7OYMuFHNN55kfZPyU8C-0-9e2bd4a1e1a1d0893a707b8ad359f910)
(1.3.6)
其中:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_367.jpg?sign=1739496504-AINmIbZBCPtlT4Ahf7JvTRgRPPDZ153w-0-1224b45248768024deaceb387eb6d231)
称为基向基
的过渡矩阵。显然,过渡矩阵实现了一个基向另一个基的变换。
定义 在同一个向量空间,由基向基
的过渡矩阵是
,则:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_373.jpg?sign=1739496504-z66UA59pk2wP5R7h2ATxDsn11DT1B6Dm-0-885fa602d5ddb3b0956d7f704a25cbd5)
注意:和
分别用列向量方式表示此向量空间的不同的基。
根据(1.3.5)式,可得:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_376.jpg?sign=1739496504-bKTsteyofNHVfIP5zy39HwDpCZMOa92V-0-6edc77676906b15b02219cf551c4dc0d)
(1.3.4)式和(1.3.5)式描述的是同一个向量,所以:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_377.jpg?sign=1739496504-J35BAUIdRxxJZdDDTMaEhOLAvR0iXi15-0-53df8cb6684c4cde9e66e1dc855c7dc7)
如果写成矩阵形式,即:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_378.jpg?sign=1739496504-PjvwBIQX9mzzeD5bIFjfjXriWfckI9yt-0-369854989d0b23aa56581fcd0a2f99d4)
(1.3.7)
表示了在同一个向量空间中,向量在不同基下的坐标之间的变换关系,我们称之为坐标变换公式。
定义 在某个向量空间中,由基向基
的过渡矩阵是
。某向量在基
下的坐标是
,在基
下的坐标是
,这两组坐标之间的关系是:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_386.jpg?sign=1739496504-GJcoORw3GBAFBSnnu9cjjZ62Fjs76Q4K-0-04db584994622a9ec8f43069cb3de902)
为了更直观地理解上述概念,下面以平面空间为例给予详细说明。如图1-3-4所示,有向量,所对应坐标系如实线
所示(显然,基是
)。此向量空间的另外一个基
所对应的坐标系如虚线
所示。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_392.jpg?sign=1739496504-f2xCBrWhaYdb5nB97QNgmdSBLP6x5nlw-0-8d5041920ae7d15042ab4d3833c3933b)
图1-3-4
在中,分别以基向量的
和
的长度为单位长度,并以它们的各自方向分别设置为
轴和
轴的正方向。
● 坐标表示向量
的长度在
轴方向上是单位长度的
倍(正数表示与
轴正方向一致);
● 坐标表示向量
的长度在
轴方向上是单位长度的
倍(正数表示与
轴正方向一致)。
同样,在中,分别以基向量的
和
的长度为单位长度并建立
和
坐标轴。如图1-3-4所示,先用几何方法,从
点分别作
和
两个坐标轴的平行线,与坐标轴交点分别为
,则这两个点的数值代表了相对于基向量长度的倍数,即向量
在
中的坐标。由图可知,
,于是,在
中向量
表示为:
。
如果不用几何的方式,采用前述的坐标变换公式,看看能不能得到同样结果。
基向基
的过渡矩阵
,由坐标变换公式(1.3.7)式得:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_426.jpg?sign=1739496504-dRH8o11BUjtJBH2LqFV4ZUvZ22trfb5p-0-c02fe805337c21b3a11dd2ebf4abf03f)
解得:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_427.jpg?sign=1739496504-gsX7fLhUHb7xRnZw9HZfrWmqQteOdwG1-0-f1e936843402ab1935baccd59fdb7f7f)
所以:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_428.jpg?sign=1739496504-24AwmPANNCndU8u0SgMZ6tgS0nvhIjjq-0-6c61222e24c43cb8e6995eced6badb34)
在中,
,与前述几何方法计算结果一致。