[선형대수학] 18. 행렬의 대각화
앞에서는 일반적인 행렬에 대한 고유값과 고유벡터를 구했다.
\(A\)가 대각행렬이면, \(A\)의 대각선 성분들은 모두 \(A\)의 고유값이다. 그 이유는$$\begin{align*}\det(\lambda I-A)&=\det\begin{pmatrix}\lambda-a_{11}&0&\cdots&&0\\0&\ddots&&&\vdots\\&&\ddots&&\\0&&&&\lambda-a_{nn}\end{pmatrix}\\&=(\lambda-a_{11})\cdots(\lambda-a_{nn})\end{align*}$$이기 때문이다.(\(A\)가 하삼각행렬이거나 상삼각행렬이어도 성립한다)
이 사실은 행렬 \(A\)의 형태가 삼각행렬 또는 대각행렬이면 대각선 성분이 곧 고유값임을 뜻한다. 삼각행렬은 고유값을 구하는데 있어서는 편리하나 고유벡터를 구하는데 있어서는 복잡할 수 있다.
\(n\times n\)행렬 \(A\)에 대하여 정칙행렬 \(Q\)가 존재해서 \(Q^{-1}AQ\)가 대각행렬이면, \(A\)를 대각화가능(diagonalizable)이라고 한다.
\(A\)와 \(B\)를 서로 닮음행렬이라 하자. 그러면 정칙행렬 \(Q^{-1}\)가 존재해서 \(B=Q^{-1}AQ\)이고,$$\begin{align*}\det(\lambda I-B)&=\det(Q^{-1}(\lambda I)Q-Q^{-1}AQ)\\&=\det(Q^{-1})\det(\lambda I-A)\det Q\\&=\det(\lambda I-A)\end{align*}$$이므로 \(A\)와 \(B\)는 같은 고유값을 가진다.
\(A\)를 \(n\times n\)행렬이라 하자. 그러면 \(A\)가 대각화가능할 필요충분조건은 \(A\)가 \(n\)개의 선형독립인 고유벡터를 갖는 것이다.
증명:
\((\Rightarrow)\): \(A\)를 대각화가능하다고 하자. 그러면 정칙행렬 \(Q\)가 존재해서 \(Q^{-1}AQ\)는 대각행렬 \(D\)이다. 이를 다음과 같이 나타내자.$$Q^{-1}AQ=D=\begin{pmatrix}\lambda_{1}&0&\cdots&0\\0&\lambda_{2}&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\0&0&\cdots&\lambda_{n}\end{pmatrix}$$\(\mathbf{x}_{1},\,\cdots,\,\mathbf{x}_{n}\)을 \(Q\)의 열벡터라고 하자.$$\begin{align*}AQ&=[A\mathbf{x}_{1}\,A\mathbf{x}_{2}\,\cdots\,A\mathbf{x}_{n}]\\QD&=[\lambda\mathbf{x}_{1}\,\lambda_{2}\mathbf{x}_{2}\,\cdots\,\lambda_{n}\mathbf{x}_{n}]\end{align*}$$이고, \(AQ=QD\)이므로 \(A\mathbf{x}_{i}=\lambda_{i}\mathbf{x}_{i}\,(i=1,\,\cdots,\,n)\)이고, \(Q\)가 정칙행렬이므로 \(Q\)의 열벡터들은 모두 일차독립이다. 이것은 \(\mathbf{x}_{i}\)들이 \(A\)의 \(n\)개의 일차독립 고유벡터임을 뜻한다.
\((\Leftarrow)\): \(A\)가 \(n\)개의 \(\lambda_{1},\,\cdots,\,\lambda_{n}\)에 대응하는 선형독립 고유벡터 \(\mathbf{x}_{1},\,\cdots,\,\mathbf{x}_{n}\)들을 갖는다고 하자. 그러면 \(A\mathbf{x}_{i}=\lambda_{i}\mathbf{x}_{i}\,(i=1,\,\cdots,\,n)\)이고, 행렬 \(Q\)를 열벡터가 \(\mathbf{x}_{1},\,\cdots,\,\mathbf{x}_{n}\)인 행렬, 즉$$Q=[\mathbf{x}_{1}\,\cdots\,\mathbf{x}_{n}]$$으로 정의하면, \(A\mathbf{x}_{i}=\lambda_{i}\mathbf{x}_{i}\)이므로 \(AQ=QD\)이고 여기서 \(D\)는 대각선 성분이 고유값 \(\lambda_{1},\,\cdots,\,\lambda_{n}\)인 대각행렬이다. \(Q\)의 열벡터들은 선형독립이므로 역행렬을 갖고 따라서 \(Q^{-1}AQ=D\)이다.
다음의 행렬$$A=\begin{pmatrix}3&-2&0\\-2&3&0\\0&0&5\end{pmatrix}$$의 고유값은 \(\lambda_{1}=1\), \(\lambda_{2}=5\)(중복도는 \(2\)이다)이고, 고유벡터는$$\mathbf{x}_{1}=\begin{pmatrix}1\\1\\0\end{pmatrix},\,\mathbf{x}_{2}=\begin{pmatrix}-1\\1\\0\end{pmatrix},\,\mathbf{x}_{3}=\begin{pmatrix}0\\0\\1\end{pmatrix}$$이다.$$Q=\begin{pmatrix}1&-1&0\\1&1&0\\0&0&1\end{pmatrix}$$라 하면,$$Q^{-1}=\frac{1}{2}\begin{pmatrix}1&1&0\\-1&1&0\\0&0&1\end{pmatrix}$$이므로$$Q^{-1}AQ=\begin{pmatrix}1&0&0\\0&5&0\\0&0&5\end{pmatrix}$$이고, \(Q^{-1}AQ\)는 대각행렬이고, 대각선 성분은 모두 고유값이다. 또한 이 대각행렬과 행렬 \(A\)는 닮음행렬이다.
다음의 행렬$$B=\begin{pmatrix}t&1&0\\0&t&1\\0&0&t\end{pmatrix}\,(t\in\mathbb{R})$$은 대각화가능하지 않다. 그 이유는$$\det(\lambda I-B)=\det\begin{pmatrix}\lambda-t&1&0\\0&\lambda-t&1\\0&0&\lambda-t\end{pmatrix}=(\lambda-t)^{3}$$이므로 고유값은 중복도가 \(3\)인 \(\lambda =t\)뿐이다. 또한 다음의 동차방정식$$\begin{pmatrix}0&1&0\\0&0&1\\0&0&0\end{pmatrix}\begin{pmatrix}x_{1}\\x_{2}\\x_{3}\end{pmatrix}=\begin{pmatrix}0\\0\\0\end{pmatrix}$$의 해는 \(x_{2}=x_{3}=0\)이므로$$\mathbf{x}=\begin{pmatrix}x_{1}\\0\\0\end{pmatrix}=x_{1}\begin{pmatrix}1\\0\\0\end{pmatrix}$$이고 이 \(\mathbf{x}\)만이 \(B\)의 고유벡터이다. 따라서 \(B\)는 대각화가능하지 않다.
\(\lambda_{1},\,\lambda_{2},\,\cdots,\,\lambda_{k}\)를 행렬 \(A\)의 서로 다른 고유값들이라 하고, 이에 대응되는 고유벡터들을 \(\mathbf{x}_{1},\,\mathbf{x}_{2},\,\cdots,\,\mathbf{x}_{k}\)라 하자. 그러면 \(\{\mathbf{x}_{1},\,\mathbf{x}_{2},\,\cdots,\,\mathbf{x}_{k}\}\)는 선형독립이다.
증명: \(r\)을 \(\mathbf{x}_{1},\,\cdots,\,\mathbf{x}_{r}\)이 선형독립이 되게 하는 최대의 정수라 하자. \(r=k\)이면, 증명할 필요가 없다. 그러므로 \(1\leq r<k\)라 하자. 그러면 \(\{\mathbf{x}_{1},\,\cdots,\,\mathbf{x}_{r+1}\}\)는 종속이고, \(c_{1},\,\cdots,\,c_{r+1}(\neq0)\)이 존재해서 \(c_{1}\mathbf{x}_{1}+c_{2}\mathbf{x}_{2}+\cdots+c_{r+1}\mathbf{x}_{r+1}=\mathbf{0}\,(1)\)이다. 이 식의 양변에 행렬 \(A\)를 곱하고 \(\mathbf{x}_{1},\,\cdots,\,\mathbf{x}_{r+1}\)이 \(A\)의 고유벡터라는 사실을 이용하면$$c_{1}\lambda_{1}\mathbf{x}_{1}+c_{2}\lambda_{2}\mathbf{x}_{2}+\cdots+c_{r+1}\lambda_{r+1}\mathbf{x}_{r+1}=\mathbf{0}\,(2)$$이다. 식 (1)에 \(\lambda_{r+1}\)을 곱한 다음 식 (2)로 빼면$$c_{1}(\lambda_{r+1}-\lambda_{1})\mathbf{x}_{1}+c_{2}(\lambda_{r+1}-\lambda_{2})\mathbf{x}_{2}+\cdots+c_{r}(\lambda_{r+1}-\lambda_{r})\mathbf{x}_{r}=\mathbf{0}$$이고 \(\{\mathbf{x}_{1},\,\cdots,\,\mathbf{x}_{r}\}\)이 선형독립이고 \(\lambda_{1},\,\lambda_{2},\,\cdots,\,\lambda_{r+1}\)은 서로 다른 값이므로 \(c_{1}=c_{2}=\cdots=c_{r}=0\)이고, \(\mathbf{x}_{r+1}\neq\mathbf{0}\)이므로 \(c_{r+1}=0\)이 되는데 이는 \(c_{r+1}\neq0\)이라는 사실에 모순이다.
앞의 정리와 이 정리를 종합해서 \(n\times n\)행렬 \(A\)가 \(n\)개의 고유값을 가지면 \(A\)는 대각화가능하다고 할 수 있다.
행렬 \(\displaystyle A=\begin{pmatrix}1&4\\3&2\end{pmatrix}\)에 대하여 \(A^{n}\)을 구하자. 행렬 \(A\)를 대각화하면 쉽게 구할 수 있다.$$\det(\lambda I-A)=\det\begin{pmatrix}\lambda-1&-4\\-3&\lambda-2\end{pmatrix}=(\lambda-1)(\lambda-2)-(-3)(-4)=(\lambda+2)(\lambda-5)$$이므로 고유값은 \(\lambda_{1}=5\), \(\lambda_{2}=-2\)이고 이에 대응하는 고유벡터를 구하면$$\begin{pmatrix}4&-4\\-3&3\end{pmatrix}\begin{pmatrix}x_{1}\\x_{2}\end{pmatrix}=\begin{pmatrix}0\\0\end{pmatrix},\,\mathbf{x}_{1}=\begin{pmatrix}1\\1\end{pmatrix}$$이고$$\begin{pmatrix}-3&-4\\-3&-4\end{pmatrix}\begin{pmatrix}x_{1}\\x_{2}\end{pmatrix}=\begin{pmatrix}0\\0\end{pmatrix},\,\mathbf{x}_{2}=\begin{pmatrix}-4\\3\end{pmatrix}$$이므로 행렬 \(Q\)를 \(\displaystyle Q=\begin{pmatrix}1&-4\\1&3\end{pmatrix}\)이라 하면, \(\displaystyle Q^{-1}=\frac{1}{7}\begin{pmatrix}3&4\\-1&3\end{pmatrix}\)이므로$$Q^{-1}AQ=\begin{pmatrix}5&0\\0&-2\end{pmatrix},\,A=Q\begin{pmatrix}5&0\\0&-2\end{pmatrix}Q^{-1}$$이므로$$\begin{align*}A^{n}&=Q\begin{pmatrix}5^{n}&0\\0&(-2)^{n}\end{pmatrix}Q^{-1}\\&=\frac{1}{7}\begin{pmatrix}3\cdot5^{n}+4\cdot(-2)^{n}&4\cdot5^{n}-4\cdot(-2)^{n}\\3\cdot5^{n}-3\cdot(-2)^{n}&4\cdot5^{n}+3\cdot(-2)^{n}\end{pmatrix}\end{align*}$$이다.
참고자료:
Linear Algebra, Jinho Kwak, sungpyo Hong, Birkhauser
이공학도를 위한 선형대수학, 김명재, 휴먼싸이언스
'대수학 > 선형대수학' 카테고리의 다른 글
[선형대수학] 20. 지수행렬 (0) | 2020.02.25 |
---|---|
[선형대수학] 19. 조르단 표준형 (0) | 2020.02.24 |
[선형대수학] 17. 고유값과 고유벡터 (0) | 2018.12.12 |
[선형대수학] 16. 내적공간 (4: 그람-슈미츠 직교화) (0) | 2017.11.06 |
[선형대수학] 15. 내적공간 (3: 단위벡터, 정규직교기저, 직교사영) (0) | 2017.10.29 |