跳至主要內容

The Matrix Cookbook 中文翻译

Alex Sun2023年2月28日AI线性代数AI线性代数大约 4 分钟

The Matrix Cookbook 部分翻译。

原作者:Kaare Brandt PetersenMichael Syskind Pedersen,版本:November 15, 2012.

The Matrix Cookbook 收集与矩阵有关的事实。译本不提供参考文献,详细的参考文献也需要访问原文。本文只是少部分翻译,并不会按照原文全部写出,待补充。

如果有错误,请反馈到博客 Issue,如果经过查证是原文错误反馈到原作者邮箱 cookbook@2302.dk

符号定义

符号含义
A\boldsymbol{A}矩阵
Aij\boldsymbol{A}_{ij}矩阵的索引
Ai\boldsymbol{A}_{i}矩阵的索引
Aij\boldsymbol{A}^{ij}矩阵的索引
An\boldsymbol{A}^n矩阵的索引或者方阵的 nn 次幂
A1\boldsymbol{A}^{-1}A\boldsymbol{A} 的逆矩阵
A+\boldsymbol{A}^+A\boldsymbol{A} 的伪逆
A1/2\boldsymbol{A}^{1/2}A\boldsymbol{A} 的平方根(如果唯一的话)
(A)ij(\boldsymbol{A})_{ij}A\boldsymbol{A}(i,j)(i,\,j) 位置的元素
AijA_{ij}A\boldsymbol{A}(i,j)(i,\,j) 位置的元素
[A]ij[\boldsymbol{A}]_{ij}A\boldsymbol{A}ijij-子矩阵,指删除了第 ii 行和第 jj 列的矩阵
a\boldsymbol{a}向量(列向量)
ai\boldsymbol{a}_i向量的索引
aia_i向量的索引
aa标量
z\Re z标量的实数部分
z\Re\boldsymbol{z}向量的实数部分
Z\Re\boldsymbol{Z}矩阵的实数部分
z\Im z标量的虚数部分
z\Im\boldsymbol{z}向量的虚数部分
Z\Im\boldsymbol{Z}矩阵的虚数部分
det(A)\det(\boldsymbol{A})A\boldsymbol{A} 的行列式
Tr(A)\mathrm{Tr}(\boldsymbol{A})A\boldsymbol{A} 的迹
diag(A)\mathrm{diag}(\boldsymbol{A})A\boldsymbol{A} 的对角化,例如 (diag(A))ij=δijAij(\mathrm{diag}(\boldsymbol{A}))_{ij} = \delta_{ij}A_{ij}
eig(A)\mathrm{eig}(\boldsymbol{A})A\boldsymbol{A} 的特征值
vec(A)\mathrm{vec}(\boldsymbol{A})A\boldsymbol{A} 的向量版本
sup\sup集合的上确界
A\Vert\boldsymbol{A}\VertA\boldsymbol{A} 的范数
AT\boldsymbol{A}^{\mathsf{T}}矩阵的转置
AT\boldsymbol{A}^{-\mathsf{T}}矩阵的转置的逆矩阵,AT=(A1)T=(AT)1\boldsymbol{A}^{-\mathsf{T}} = (\boldsymbol{A}^{-1})^{\mathsf{T}} = (\boldsymbol{A}^{\mathsf{T}})^{-1}
A\boldsymbol{A}^*复共轭矩阵
AH\boldsymbol{A}^\mathsf{H}转置复共轭矩阵
AB\boldsymbol{A}\circ\boldsymbol{B}Hadamard 积(元素积)
AB\boldsymbol{A}\otimes\boldsymbol{B}Kronecker 积
0\boldsymbol{0}零矩阵,所有元素为 00
I\boldsymbol{I}单位矩阵
Jij\boldsymbol{J}^{ij}单值矩阵,只有 (i,j)(i,\,j) 位置是 11,其他是 00
Σ\boldsymbol{\Sigma}正定矩阵
Λ\boldsymbol{\Lambda}对角矩阵

1. 基础

(AB)1=B1A1(ABC)1=C1B1A1(AT)1=(A1)T(A+B)T=AT+BT(AB)T=BTAT(ABC)T=CTBTAT(AH)1=(A1)H(A+B)H=AH+BH(AB)H=BHAH(ABC)H=CHBHAH \begin{align} (\boldsymbol{AB})^{-1} &= \boldsymbol{B}^{-1}\boldsymbol{A}^{-1} \\ (\boldsymbol{ABC}\cdots)^{-1} &= \cdots\boldsymbol{C}^{-1}\boldsymbol{B}^{-1}\boldsymbol{A}^{-1} \\ (\boldsymbol{A}^{\mathsf{T}})^{-1} &= (\boldsymbol{A}^{-1})^{\mathsf{T}} \\ (\boldsymbol{A} + \boldsymbol{B})^{\mathsf{T}} &= \boldsymbol{A}^{\mathsf{T}} + \boldsymbol{B}^{\mathsf{T}} \\ (\boldsymbol{A}\boldsymbol{B})^{\mathsf{T}} &= \boldsymbol{B}^{\mathsf{T}}\boldsymbol{A}^{\mathsf{T}} \\ (\boldsymbol{ABC}\cdots)^{\mathsf{T}} &= \cdots\boldsymbol{C}^{\mathsf{T}}\boldsymbol{B}^{\mathsf{T}}\boldsymbol{A}^{\mathsf{T}} \\ (\boldsymbol{A}^{\mathsf{H}})^{-1} &= (\boldsymbol{A}^{-1})^{\mathsf{H}} \\ (\boldsymbol{A} + \boldsymbol{B})^{\mathsf{H}} &= \boldsymbol{A}^{\mathsf{H}} + \boldsymbol{B}^{\mathsf{H}} \\ (\boldsymbol{A}\boldsymbol{B})^{\mathsf{H}} &= \boldsymbol{B}^{\mathsf{H}}\boldsymbol{A}^{\mathsf{H}} \\ (\boldsymbol{ABC}\cdots)^{\mathsf{H}} &= \cdots\boldsymbol{C}^{\mathsf{H}}\boldsymbol{B}^{\mathsf{H}}\boldsymbol{A}^{\mathsf{H}} \\ \end{align}

1.1 迹(Trace)

Tr(A)=iAiiTr(A)=iλi,λi=eig(A)Tr(A)=Tr(AT)Tr(AB)=Tr(BA)Tr(A+B)=Tr(A)+Tr(B)Tr(ABC)=Tr(BCA)=Tr(CAB)aTa=Tr(aaT) \begin{align} \mathrm{Tr}(\boldsymbol{A}) &= \textstyle\sum_i A_{ii} \\ \mathrm{Tr}(\boldsymbol{A}) &= \textstyle\sum_i \lambda_{i}, \quad \lambda_i = \mathrm{eig}(\boldsymbol{A}) \\ \mathrm{Tr}(\boldsymbol{A}) &= \mathrm{Tr}(\boldsymbol{A}^{\mathsf{T}}) \\ \mathrm{Tr}(\boldsymbol{AB}) &= \mathrm{Tr}(\boldsymbol{BA}) \\ \mathrm{Tr}(\boldsymbol{A} + \boldsymbol{B}) &= \mathrm{Tr}(\boldsymbol{A}) + \mathrm{Tr}(\boldsymbol{B}) \\ \mathrm{Tr}(\boldsymbol{ABC}) &= \mathrm{Tr}(\boldsymbol{BCA}) = \mathrm{Tr}(\boldsymbol{CAB}) \\ \boldsymbol{a}^{\mathsf{T}}\boldsymbol{a} &= \mathrm{Tr}(\boldsymbol{a}\boldsymbol{a}^{\mathsf{T}}) \end{align}

1.2 行列式(Determinant)

A\boldsymbol{A} 是一个 n×nn \times n 方阵。

det(A)=iλi,λi=eig(A)det(cA)=cndet(A),if ARn×ndet(AT)=det(A)det(AB)=det(A)det(B)det(A1)=1/det(A)det(An)=det(A)ndet(I+uvT)=1+uTv \begin{align} \det(\boldsymbol{A}) &= \prod_i \lambda_i, \quad \lambda_i = \mathrm{eig}(\boldsymbol{A}) \\ \det(c\boldsymbol{A}) &= c^n\det(\boldsymbol{\boldsymbol{A}}), \quad \text{if } \boldsymbol{A} \in \R^{n \times n} \\ \det(\boldsymbol{A}^{\mathsf{T}}) &= \det(\boldsymbol{A}) \\ \det(\boldsymbol{AB}) &= \det(\boldsymbol{A})\det(\boldsymbol{B}) \\ \det(\boldsymbol{A}^{-1}) &= 1 / \det(\boldsymbol{A}) \\ \det(\boldsymbol{A}^n) &= \det(\boldsymbol{A})^n \\ \det(\boldsymbol{I} + \boldsymbol{uv}^{\mathsf{T}}) &= 1 + \boldsymbol{u}^{\mathsf{T}}\boldsymbol{v} \end{align}

n=2n = 2 时:

det(I+A)=1+det(A)+Tr(A) \begin{align} \det(\boldsymbol{I} + \boldsymbol{A}) &= 1 + \det(\boldsymbol{A}) + \mathrm{Tr}(\boldsymbol{A}) \end{align}

n=3n = 3 时:

det(I+A)=1+det(A)+Tr(A)+12Tr(A)212Tr(A2) \begin{align} \det(\boldsymbol{I} + \boldsymbol{A}) &= 1 + \det(\boldsymbol{A}) + \mathrm{Tr}(\boldsymbol{A}) + \frac{1}{2}\mathrm{Tr}(\boldsymbol{A})^2 - \frac{1}{2}\mathrm{Tr}(\boldsymbol{A}^2) \end{align}

n=4n = 4 时:

det(I+A)=1+det(A)+Tr(A)+12+Tr(A)212Tr(A2)+16Tr(A)312Tr(A)Tr(A2)+13Tr(A3) \begin{equation} \begin{aligned} \det(\boldsymbol{I} + \boldsymbol{A}) &= 1 + \det(\boldsymbol{A}) + \mathrm{Tr}(\boldsymbol{A}) + \frac{1}{2} + \mathrm{Tr}(\boldsymbol{A})^2 & \\ &- \frac{1}{2}\mathrm{Tr}(\boldsymbol{A}^2) + \frac{1}{6}\mathrm{Tr}(\boldsymbol{A})^3 \\ &- \frac{1}{2}\mathrm{Tr}(\boldsymbol{A})\mathrm{Tr}(\boldsymbol{A}^2) + \frac{1}{3}\mathrm{Tr}(\boldsymbol{A}^3) \end{aligned} \end{equation}

对于小的数 ε\varepsilon,下面的近似成立

det(I+εA)1+det(A)+εTr(A)+12ε2Tr(A)212ε2Tr(A2) \begin{align} \det(\boldsymbol{I} + \varepsilon\boldsymbol{A}) &\cong 1 + \det(\boldsymbol{A}) + \varepsilon\mathrm{Tr}(\boldsymbol{A}) + \frac{1}{2}\varepsilon^2\mathrm{Tr}(\boldsymbol{A})^2 - \frac{1}{2}\varepsilon^2\mathrm{Tr}(\boldsymbol{A}^2) \end{align}

1.3 2x2 的特殊情况

考虑矩阵 A\boldsymbol{A}

A=[A11A12A21A22] \boldsymbol{A} = \begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{bmatrix}

行列式和迹

det(A)=A11A22A12A21Tr(A)=A11+A22 \begin{align} \det(\boldsymbol{A}) &= A_{11}A_{22} - A_{12}A_{21} \\ \mathrm{Tr}(\boldsymbol{A}) &= A_{11} + A_{22} \end{align}

特征值

λ1=Tr(A)+Tr(A)24det(A)2λ2=Tr(A)Tr(A)24det(A)2 \begin{aligned} \lambda_1 &= \frac{\mathrm{Tr}(\boldsymbol{A}) + \sqrt{\mathrm{Tr}(\boldsymbol{A})^2 - 4\det(\boldsymbol{A})}}{2} \\ \lambda_2 &= \frac{\mathrm{Tr}(\boldsymbol{A}) - \sqrt{\mathrm{Tr}(\boldsymbol{A})^2 - 4\det(\boldsymbol{A})}}{2} \end{aligned}

λ1+λ2=Tr(A)λ1λ2=det(A) \begin{aligned} \lambda_1 + \lambda_2 &= \mathrm{Tr}(\boldsymbol{A}) \\ \lambda_1\lambda_2 &= \det(\boldsymbol{A}) \end{aligned}

特征向量

v1[A12λ1A11]v2[A12λ2A12] \begin{aligned} \boldsymbol{v}_1 &\propto \begin{bmatrix} A_{12} \\ \lambda_1 - A_{11} \end{bmatrix} \\ \boldsymbol{v}_2 &\propto \begin{bmatrix} A_{12} \\ \lambda_2 - A_{12} \end{bmatrix} \end{aligned}

A1=1det(A)[A22A12A21A11] \begin{align} \boldsymbol{A}^{-1} &= \frac{1}{\det(\boldsymbol{A})}\begin{bmatrix} A_{22} & -A_{12} \\ -A_{21} & A_{11} \end{bmatrix} \end{align}