线性代数

less than 1 minute read

Published: September 17, 2021

本文总结了深度学习中常用的线性代数基础知识，包括向量点乘、范数、矩阵乘法、特征值分解等基本运算，并提供了对应的 PyTorch 代码实现，最后解答了关于 Tensor 数据类型转换的常见问题。

基本运算

向量点乘：按元素相乘结果为标量，当相互正交时为 0 $\mathbf{a}^T\mathbf{b}=\sum_{i} a_ib_i$
向量范数：分为 L1 范数、L2 范数、p-范数、$\infty$-范数。其中定义分别为：
- $L_1$范数：
\[||\mathbf{x}||_1=\sum_{i=1}^n|x_i|\]
- $L_2$范数：
\[||\mathbf{x}||_2=\sqrt{\sum_{i=1}^nx_i^2}\]
- p-范数：
\[||\mathbf{x}||_p=(\sum_{i=1}^n|x_i|^p)^{1\over p},p>1\]
- $\infty$-范数：

\[||\mathbf{x}||_{\infty}=\max_i|x_i|\]

矩阵乘以向量：需保证矩阵列数与向量行数相等，最终得到向量，(m, n)·(n, 1)=(m,1)。矩阵的作用相当于对向量进行空间的扭曲变换（可参考 3Blue1Brown 视频） $\mathbf{c}=A\mathbf{b},\ where\ c_i=\sum_jA_{ij}b_j$
矩阵乘以矩阵：相当于矩阵 A 分别与矩阵 B 中的每一列（相当于向量）做矩阵与向量乘法 $C=AB\ where\ C_{ik}=\sum_jA_{ij}B{jk}$
Frobenius 范数：将所有元素做平方和再开根号，因矩阵范数求解较麻烦，Frob 范数多用于替代矩阵范数 $||A||_{Frob}=[\sum_{ij}A_{ij}^2]^{1\over2}$
矩阵正定：如果一个矩阵 A 满足： $xA^Tx^T\ge0$ 则称其为正定矩阵
正交矩阵：矩阵的所有行为相互正交的单位向量，满足： $UU^T=I$
特征向量和特征值：做矩阵与向量乘法时，如果向量 $\mathbf{x}$ 经过矩阵 $A$ 扭曲变换后，没有改变原向量 $\mathbf{x}$ 的方向（长度可改变为比例 $\lambda$），则称 $\mathbf{x}$ 为特征向量，$\lambda$ 为特征值，对称矩阵总能找到特征向量 $A\mathbf{x}=\lambda\ \mathbf{x}$

标量：torch.tensor([3.0])
向量：torch.tensor([list])
向量点积：torch.dot(x,y)，等价于先按元素乘，再求和：sum(x * y)
矩阵：torch.arange(20).reshape(5,4)
矩阵转置：A.T
两个矩阵按元素乘（哈达玛积，Hadamard product，数学符号为 $\bigodot$ ）[常用于CNN的卷积（互相关）运算中]：A * B
矩阵求和，得到标量：A.sum()
矩阵按轴求和，则该轴维度变为 1：A.sum(axis=n) A.sum(axis=[a,b])
矩阵求和时保留维度信息：A.sum(axis=1,keepdims=True)
矩阵求均值：A.mean()
矩阵的累加：A.cumsum(axis=n)，必须要指定维度
矩阵向量积$Ax$，需保证矩阵列数与向量维数相等：torch.mv(A,x)
矩阵相乘$AB$，可以看作是执行 m 次矩阵向量积，并拼合结果：torch.mm(A,B)
$L_2$范数：torch.norm(u)
$L_1$范数：torch.abs(u).sum()
矩阵的 Frob 范数：torch.norm(A)

Markdown 数学公式语法参考 👉链接 1、链接 2

Q：怎么改变 Tensor 里元素的数据类型：int/float？

A：首先介绍 Pytorch8 种张量类型：

torch.FloatTensor：32bit 精度浮点张量 [Pytorch 默认类型] dtype 值为：torch.float32 or torch.float
torch.DoubleTensor：64bit 精度浮点张量，dtype 值为：torch.float64 or torch.double （深度学习用的较少，因为计算、存储成本太大）
torch.HalfTensor：半精度（16bit）浮点张量，dtype 值为：torch.float16 or torch.half
torch.ByteTensor：8bit 无符号整型张量，dtype 值为：torch.uint8（深度学习领域鲜有使用）
torch.CharTensor：8bit 字符型张量，dtype 值为：torch.int8
torch.ShortTensor：16bit 短整型张量，dtype 值为：torch.int16 or torch.short（深度学习领域鲜有使用）
torch.IntTensor：32bit 整型张量，dtype 值为：torch.int32 or torch.int（深度学习领域鲜有使用）
torch.LongTensor：64bit 长整型张量，dtype 值为：torch.int64 or torch.long（深度学习领域鲜有使用）

要查看已有张量的类型，可通过在张量后使用属性：.dtype查看

怎样改变数据类型：

第一种方法： 在构建时直接指定上面提到的 8 种类型：
- torch.IntTensor([[1,2],[3,4]])或torch.tensor([1,2,3],dtype=torch.long)
第二种方法： 使用.type()方法转换已有张量的类型：
- tensor1.type(torch.HalfTensor)

具体可参考👉Pytorch文档