矩陣乘法的由來:線性轉換的合成

筆記矩陣乘法的由來:線性轉換的合成

在學習線性代數時,我們常常會覺得矩陣乘法的定義很「怪異」,是一種獨特、被人為規定的計算法則。不過如果我們將矩陣乘法視為「線性轉換的合成」,並嘗試計算合成的結果,便會發現這和矩陣乘法的定義不謀而合。

線性轉換的合成

準備工作

對任意非負整數 $r \comma$設 $[r] = \{0 \cm 1, \ldots, r \varminus 1\} \period$

設 $U \jcomma V \jcomma W$ 為體 $F$ 上的有限維向量空間,其中 $U \jcomma V \jcomma W$ 的維度分別為 $n \jcomma m \jcomma \ell \period$

設集合 $\{u_0 \cm u_1, \ldots, u_{n-1}\} \jcomma \{v_0 \cm v_1, \ldots, v_{m-1}\} \jcomma \{w_0 \cm w_1, \ldots, w_{\ell-1}\}$ 分別為 $U \jcomma V \jcomma W$ 的基底。

線性轉換的矩陣表示

以下我們說明如果定義域與對應域的基底均已經給定,則線性轉換均可對應至一矩陣表示,且這種對應關係是一一對應。

首先,我們用以下的定理 1 說明每一個線性轉換均可以對應至一矩陣表示。

定理 1 設 $T \colon U \to V$ 為一線性轉換。此時存在唯一一個矩陣 $A \in F^{m \times n}$ 使得 \[\begin{split}T(u_j) = \sum_{i=0}^{m-1} A_{i,\.j}v_i\end{split}\] 對所有 $j \in [n]$ 均成立。

證明 對任意 $j \in [n] \comma$由於 $\{v_0 \cm v_1, \ldots, v_{m-1}\}$ 是 $V$ 的基底,可知存在唯一一組 $A_{0,\.j}, A_{1,\.j}, \ldots, A_{m-1,\.j} \in F$ 使得 \[\begin{split}T(u_j) = \sum_{i=0}^{m-1} A_{i,\.j}v_i\end{split}\] 成立。因而可確定滿足定理敘述的矩陣 $A$ 唯一存在。

接著藉由以下的定理 2,我們可以說明前述定理 1 中使用的矩陣表示確實與線性轉換一一對應。

定理 2 若 $T \colon U \to V$ 與 $T' \colon U \to V$ 均為線性轉換,且 $T(u_j) = T'(u_j)$ 對所有 $j \in [n]$ 均成立,則 $T = T' \period$

證明 我們說明對任意 $u \in U$ 均有 $T(u) = T'(u) \period$設 $u = \sum_{j=0}^{n-1} c_ju_j \comma$則我們有 \[\begin{split}T(u) &= T\Biggl(\sum_{j=0}^{n-1}c_ju_j\Biggr) \\ &= \sum_{j=0}^{n-1}c_jT(u_j) \\ &= \sum_{j=0}^{n-1}c_jT'(u_j) \\ & =T'\Biggl(\sum_{j=0}^{n-1}c_ju_j\Biggr) \\ &= T'(u) \period\end{split}\]故定理得證。

線性轉換的合成

現在我們已經可以利用矩陣表示來描述線性轉換。藉由以下的定理 3,我們可以發現線性轉換合成的結果事實上和矩陣表示的乘積是一致的。

定理 3 設 $T \colon U \to V$ 與 $T' \colon V \to W$ 為線性轉換,其中存在矩陣 $A \in F^{\ell \times m} \jcomma B \in F^{m \times n}$ 使得對所有 $j \in [m]$ 均有 \[\begin{split}T'(v_j) = \sum_{i=0}^{\ell-1}A_{i,\.j}w_i \comma\end{split}\]且對所有 $j \in [n]$ 均有 \[\begin{split}T(u_j) = \sum_{i=0}^{m-1} B_{i,\.j}v_i \period\end{split}\]則此時對所有 $j \in [n]$ 均有 \[\begin{split}T'(T(u_j)) = \sum_{i=0}^{\ell-1}C_{i,\.j}w_i \comma\end{split}\]其中 \[\begin{split}C_{i,\.j} = \sum_{k=0}^{m-1}A_{i,k}B_{k,\.j} \period\end{split}\]

證明 對任意 $j \in [n] \comma$皆有 \[\begin{split}T'(T(u_j)) &= T'\Biggl(\sum_{k=0}^{m-1}B_{k,\.j}v_k\Biggr) \\ &= \sum_{k=0}^{m-1} B_{k,\.j} T'(v_k) \\ &= \sum_{k=0}^{m-1} B_{k,\.j} \sum_{i=0}^{\ell-1} A_{i,k} w_i \\ &= \sum_{k=0}^{m-1} \sum_{i=0}^{\ell-1} A_{i,k}B_{k,\.j}w_i \\ &= \sum_{i=0}^{\ell-1} \sum_{k=0}^{m-1} A_{i,k}B_{k,\.j}w_i \\ &= \sum_{i=0}^{\ell-1} \Biggl(\sum_{k=0}^{m-1} A_{i,k}B_{k,\.j} \Biggr)w_i \comma\end{split}\]故定理得證。