老齐
2023/05/10阅读:13主题:科技蓝
从几何角度理解矩阵
从几何角度理解矩阵
《机器学习数学基础》第 2 章,专门讲解矩阵,因为它在线性代数中占据重要地位,也就是在机器学习中,占据重要定位了。为了更好地理解矩阵,本文从几何角度,更直观地对矩阵的某些性质和特征给予阐述。
注:以下讨论中仅限于实数矩阵范围。
1. 作为线性变换的矩阵
在线性代数中,线性方程组的形式是: ,其中 , , 。此式表示 个线性方程组, 个未知量, 是系数矩阵, 是线性方程组的解。此外,还可以认为矩阵 是实现 的线性变换 。
如果研究矩阵如何实现线性变换,最简单的方式是观察它的列向量,矩阵的列向量表示标准基的 的映射。例如, 中的标准基是:
根据定义,
现在让我们看看,用矩阵
也就是说,矩阵
以上式子等号右侧的矩阵,每一列就是
假设
此外,还可以用向量
比较(1)式和(2)式,很酷!
上面两个式子可以帮助我们理解矩阵乘法,即将向量映射到转换矩阵
以线性变换或者映射的角度理解矩阵,是线性代数的关键。
线性变换
2. 从几何角度理解
从几何角度理解矩阵所具有的线性变换特点,能更直观感受到其中的奇妙。以
以图示的方式,如下图所示,图 A 表示向量

注意观察,上图中 A 以方格为单位,B 的平行四边形网格表示了变换后的空间。可以想象,通过矩阵,不仅可以实现对向量的变换,也能够对
3. 线性变换的类型
矩阵能够实现的线性变换包括旋转、反射、伸缩、剪切、投影等。如下图所示,A 部分第一行最左为变换前的

线性函数是 1 次或更少次的多项式,这意味着变量的变化率恒定。因此,不能用线性变换表示的空间的形变,即若
下面讨论几种特殊矩阵的变换,为了简化问题,仅以
3.1 对角矩阵
对角矩阵乘以一个向量,其形式如下:
这意味着通过对角矩阵能够指定向量中的某个元素发生特定变换。如下图所示,如果

上图中 A 的单位方格表示标准基下的形状;B 旋转
注意,当
3.2 剪切矩阵
此类矩阵的命名即源于它的作用效果,在形式上可与对角矩阵进行比较,注意其中的
如果没有

前面曾经使用过的矩阵
3.3 正交矩阵
正交矩阵是行向量和列向量正交的方阵,且行向量和列向量都是单位向量。以

即:
可以把行和列写出来,就更直观了:
从几何角度讲,正交矩阵能够旋转或翻转向量,但不能拉伸或压缩。如果更严谨地研究正交矩阵,需要了解如下几项性质。
3.3.1. 保持角度
设矩阵
对于其中的列向量
即:原矩阵的列向量之间的夹角经过单位正交矩阵映射之后依然保留。
3.3.2. 保持长度
针对矩阵
假设
即:原矩阵的列向量的长度经过单位正交矩阵映射之后依然保留。
3.3.3. 保持面积
单位正交矩阵
所以,
-
当 -
当
于是,如果用
4. 线性函数
如果
其中
可知,任何矩阵变换都可以分解成由单位矩阵和对角矩阵组成的简单矩阵变换。
下面以实现旋转变换的
利用三角函数的知识,可知:

附:下面是对上述旋转变换的矩阵
根据上述分解形式,首先计算
再计算
根据前述定义的旋转矩阵,得:
从而: