第3课-乘法和逆矩阵

Course: 线性代数 MIT 18.06 Linear Algebra Date: October 21, 2025 4:00 PM (GMT+8)

🎮 概览 · 本节要点

  • 👤 主讲:吉尔伯特(MIT 18.06 线性代数)
  • 📝 本节主题:矩阵乘法的多种视角与等价性;什么时候可以乘、结果的形状;逆矩阵(存在性、判据、计算方法);用高斯—乔丹(Gauss–Jordan)求逆的直观与算法。
  • 🎯 学习目标:
    • 熟练理解并在直观上记住矩阵乘法的 4 种(+1)视角;
    • 明白方阵可逆与否的几何/代数判据(列向量线性无关 / 零空间唯有零向量 / 行列式非零);
    • 掌握用增广矩阵做高斯—乔丹求逆的步骤与理由。

📚 矩阵乘法:记号与条目定义(entrywise)

  • 🔢 记号:若 (C = A B),则 (C_{ij}) 表示第 (i) 行、第 (j) 列的项。

  • 📐 条目计算(点积形式):

    Cij=k=1nAik,Bkj C_{ij}=\sum_{k=1}^n A_{i k},B_{k j}

    即第 (i) 行与第 (j) 列的点积。

  • ✅ 条目形式是最基础也最精确的表示方法(便于证明与编程实现)。


🏛 矩阵乘法的多种等价视角(至少 4 种)

这些视角在思考矩阵作用、证明性质、实现算法或理解几何意义时都很有用。

  1. 📦 列视角(column view) — 一列一列地看
    • (A B) 的第 (j) 列等于 (A) 乘以 (B) 的第 (j) 列:

      (AB):,j=A(B:,j) (AB){:,j}=A(B{:,j})
    • 直观:把 (A) 的列向量按 (B) 第 (j) 列的分量作线性组合。

    • 含义:结果矩阵的每列都是 (A) 的列向量的线性组合。

  2. 🧭 行视角(row view) — 一行一行地看
    • (AB) 的第 (i) 行等于 (A) 的第 (i) 行与 (B) 做乘法(行向量与矩阵的乘积)——也可以看作若干行的线性组合。
    • 含义:结果矩阵的每行都是 (B) 的行向量的线性组合(按 (A) 的行系数)。
  3. ⚖️ 外积/秩一分解视角(列×行的和)
    • 把 (B) 写成列向量:[B=[b_1,\dots,b_p]],把 (A) 写成行向量系数时,矩阵乘法也可表示为若干秩一矩阵(column×row)的和:

      [

      AB = \sum_{k} A_{:,k},B_{k,:}

      ]

    • 每一项 (A_{:,k} B_{k,:}) 是一个“列向量×行向量”的外积,结果是一个秩 ≤1 的矩阵。这个分解在理解低秩、分块运算与某些优化(如快速近似)时很有用。

  4. 🧩 分块(块矩阵)视角
    • 当矩阵可分块(block)时,可以把每个块当作元素做“块乘法”,只要块的形状匹配即可(和标量规则相同)。
    • 便于处理大型矩阵与并行/分布式计算。
  5. 🔁 逐条目(entry-by-entry)——回顾:每个 (C_{ij}) 都等于第 (i) 行与第 (j) 列的点积(补充说明)。

⚙️ 矩阵乘法的形状规则(何时可乘)

  • 若 (A) 是 [m\times n],(B) 是 [n\times p],则 (AB) 存在且为 [m\times p]。
  • 直观:(A) 的列数必须等于 (B) 的行数(中间维度匹配)。

🎯 矩阵可逆(Inverse)——定义与基本性质

  • 定义:方阵 [A\in\mathbb{R}^{n\times n}] 若存在矩阵 (X) 使得 (XA=I) 且 (AX=I),则称 (X) 为 (A) 的逆矩阵,记为 (A^{-1})。
  • 重要性质(方阵):若存在左逆((X A = I)),则同样存在右逆且两者相同(左逆 ⇔ 右逆 ⇔ 可逆)。
  • 何时存在?等价判据(几个常用判断法):
    • 列向量线性无关(列张成整个 [\mathbb{R}^n]);
    • 零空间只有零向量([Ax=0 \Rightarrow x=0]);
    • 行列式 [\det(A)\neq 0](这是一个常用且快速的判据);
    • 消元过程中能找到 (n) 个枢轴(即能把 (A) 化为单位矩阵)。

❌ 奇异矩阵(不可逆)的直观判据与例子

  • 直观:若 (A) 的列向量线性相关(存在非零向量 (x) 使 (Ax=0)),那么 (A) 不能可逆。

  • 课堂例子(2×2,不可逆):

    A=(1326) A=\begin{pmatrix}1 & 3\\2 & 6\end{pmatrix}

    两列成比例(第二列 = 3 × 第一列),所以任何线性组合仍落在同一条直线上,无法生成单位矩阵的某一列(例如 ((0,1)^T)),因此不存在逆。

  • 从代数看:存在非零 (x)(例如 (x=(3,-1)^T))使 (Ax=0),所以不可逆。


📦 用高斯—乔丹求逆(算法直观)

  • 思路:对方阵 (A) 形成增广矩阵 [[A \mid I]],对左半边做行操作(消元)把它化为单位矩阵,同时对整行的操作也作用到右半边。
  • 若能把左半边变成 (I),右半边恰好变成 (A^{-1})。步骤:
    1. 构造增广矩阵 ([A\ |\ I])。
    2. 用初等行操作(左乘初等矩阵)把左侧化为上三角(高斯消元),再继续把左侧变成单位矩阵(Gauss–Jordan:消到单位矩阵)。
    3. 若过程中出现无法修复的零枢轴(即无法通过行交换得到非零枢轴),则 (A) 不可逆,过程终止。
  • 直观理由:消元等价于左乘一系列初等矩阵 [E_k\cdots E_1]。如果能找到 (E) 使得 (E A = I),则 (E = A^{-1})。在增广矩阵中,这个 (E) 作用到右半边就是 (A^{-1})。

🔧 初等矩阵与行操作的代数表达

  • 每一次“把某行减去某倍数的另一行”对应一个初等矩阵 (E)(与单位矩阵只有一个非对角项不同)。

  • 举例:把第 2 行减去 3 倍第 1 行的初等矩阵(3×3)为:

    [

    E=\begin{pmatrix}

    1 & 0 & 0\

    -3 & 1 & 0\

    0 & 0 & 1

    \end{pmatrix}

    \quad\text{,满足 } E\cdot A \text{ 执行对应行操作。}

    ]

  • 多步消元对应多个初等矩阵相乘:若 [E_k\cdots E_1 A = I],则 [A^{-1}=E_k\cdots E_1]。


🔁 高斯 vs 高斯—乔丹 的差别(实用)

  • 高斯(Gaussian):只做前向消元得到上三角 (U),然后用背代求解 (Ax=b)。用于解方程组更高效。
  • 高斯—乔丹(Gauss–Jordan):继续消元直到左侧成为单位矩阵(把上三角变成对角并归一化,再消掉上方元素),这样对增广 ([A\ |\ I]) 最终直接得到 ([I\ |\ A^{-1}])。适合直接求逆,但运算量比纯高斯略多。

🧩 分块乘法与实用技巧(扩展)

  • 如果矩阵分成块(block),可以用块乘法规则按块进行计算,便于并行/分布处理或处理特殊结构(如稀疏、块对角等)。
  • 在数值实现中:利用分块、秩一更新、外积表达等可以优化运算。

🎯 小结(便于记忆的要点)

  • 矩阵乘法可从“条目(点积)”、“按列”、“按行”、“列×行 外积”和“分块”多角度理解,任选其一来帮助直观或算法实现。
  • 方阵 (A) 可逆 ⇔ 列无关 ⇔ 零空间只有零向量 ⇔ 行列式非零 ⇔ 消元可生成 (n) 个枢轴。
  • 高斯—乔丹把求逆转换为“同时解 n 个右端为单位向量的线性系统”,在增广矩阵 ([A\ |\ I]) 上做完全消元即可得到 (A^{-1})。

📝 练习题(建议添加到 Notion 的练习块)

  1. 证明:若 (AB=I) 且 (A,B) 为方阵,则 (BA=I)。(思考左逆与右逆等价性)
  2. 对矩阵 [\begin{pmatrix}1&3\2&6\end{pmatrix}] 做消元,说明为什么没有逆。
  3. 用高斯—乔丹在纸上把 [\begin{pmatrix}2&1\1&1\end{pmatrix}] 求逆(写出增广矩阵步骤)。
  4. 给出一个 [3\times3] 矩阵,手动用“列×行”方法(外积和)重写它的乘积,验证结果与点积法相同。

🎵 如果你希望我把这篇笔记:

  • 转成 Notion 的“块(blocks)格式”(例如:折叠标题、公式块、代码块、练习答案折叠)或
  • 生成便于直接复制粘贴的「多列布局」/「复习卡片」模板,

告诉我你偏好哪一种布局(例如:单列精简版 / 左列概念、右列例题 / 折叠式复习卡),我会直接生成可粘贴的内容。