[선형대수학] 22. 케일리-해밀턴 정리

대수학/선형대수학2020. 3. 1. 08:00

[선형대수학] 22. 케일리-해밀턴 정리

$f(x)=a_{m}x^{m}+a_{m-1}x^{m-1}+\cdots+a_{1}x+a_{0}$를 다항식, $A$를 $n\times n$행렬이라고 하자. 다음과 같이 정의된 행렬을 $A$의 행렬다항식(matrix polynomial)이라고 한다.$$f(A)=a_{m}A^{m}+a_{m-1}A^{m-1}+\cdots+a_{1}A+a_{0}I_{n}$$예를들어 다항식 $f(x)$와 $2\times2$행렬 $A$가 다음과 같다고 하자.$$f(x)=x^{2}-2x+2,\,A=\begin{pmatrix}1&2\\2&1\end{pmatrix}$$그러면 $f(A)$는 다음과 같다.$$\begin{align*}f(A)&=A^{2}-2A+2I_{2}\\&=\begin{pmatrix}5&4\\4&5\end{pmatrix}-2\begin{pmatrix}1&2\\2&1\end{pmatrix}+2\begin{pmatrix}1&0\\0&1\end{pmatrix}\\&=\begin{pmatrix}5&0\\0&5\end{pmatrix}\end{align*}$$케일리-해밀턴 정리(Cayley-Hamilton Theorem)

임의의 $n\times n$행렬 $A$에 대하여 $f(\lambda)=\det(\lambda I-A)$가 $A$의 특성다항식이면, $f(A)=\mathbf{O}$이다.

증명:

(1) $A$가 다음과 같은 대각행렬이라고 하자.$$D=\begin{pmatrix}\lambda_{1}&&0\\ \vdots&\ddots&\vdots\\0&&\lambda_{n}\end{pmatrix}$$

모든 $k\geq0$에 대하여 다음 식이 성립한다$$D^{k}=\begin{pmatrix}\lambda_{1}^{k}&&0\\ \vdots&\ddots&\vdots\\0&&\lambda_{n}^{k}\end{pmatrix}$$그러면 다음의 결과를 얻는다.$$f(D)=\begin{pmatrix}f(\lambda_{1})&&0\\ \vdots&\ddots&\vdots\\0&&f(\lambda_{n})\end{pmatrix}=\mathbf{O}$$

(2) $A$가 대각화 가능하다고 하자. 즉 $Q^{-1}AQ=D$.

$A$와 $D$의 특성다항식은 동일하므로 다음의 결과를 얻는다.$$\begin{align*}f(A)&=f(QDQ^{-1})\\&=(QDQ^{-1})^{n}+a_{n-1}(QDQ^{-1})^{n-1}+\cdots+a_{1}(QDQ^{-1})+a_{0}I\\&=Q(D^{n}+a_{n-1}D^{n-1}+\cdots+a_{1}D+a_{0}I)Q^{-1}\\&=Qf(D)Q^{-1}\\&=\mathbf{O}\end{align*}$$

(3) $A$를 임의의 행렬이라고 하자. 그러면 $A$는 다음과 같은 조르단 표준형 $J$와 닮음행렬이고,$$J=\begin{pmatrix}J_{1}&&0\\ \vdots&\ddots&\vdots\\0&&J_{s}\end{pmatrix}=Q^{-1}AQ$$$f(A)=Qf(J)Q^{-1}$이다. 다음의 식에 의해$$J^{k}=\begin{pmatrix}J_{1}^{k}&&0\\ \vdots&\ddots&\vdots\\0&&J_{s}^{k}\end{pmatrix},\,f(J)=\begin{pmatrix}f(J_{1})&&0\\ \vdots&\ddots&\vdots\\0&&f(J_{s})\end{pmatrix}$$단일 조르단 블럭 $J=aI+N$에 대해 $f(J)=\mathbf{O}$가 성립함을 보이면 된다. 여기서 $a$는 고유값이고, $N^{n}=\mathbf{O}$이다.$$f(\lambda)=\det(\lambda I-A)=\det(\lambda I-J)=(\lambda-a)^{n}$$이므로 다음의 결과를 얻는다.$$f(J)=f(aI+N)=(aI+N-aI)^{n}=N^{n}=\mathbf{O}$$

다음의 행렬$$A=\begin{pmatrix}3&6&6\\0&2&0\\-3&-12&-6\end{pmatrix}$$의 특성다항식은 $f(\lambda)=\det(\lambda I-A)=\lambda^{3}+\lambda^{2}-6\lambda$이므로 다음의 결과를 얻는다.$$\begin{align*}f(A)&=A^{3}+A^{2}-6A\\&=\begin{pmatrix}27&78&54\\0&8&0\\-27&-102&-54\end{pmatrix}+\begin{pmatrix}-9&-42&-18\\0&4&0\\9&30&18\end{pmatrix}-6\begin{pmatrix}3&6&6\\0&2&0\\-3&-12&-6\end{pmatrix}\\&=\begin{pmatrix}0&0&0\\0&0&0\\0&0&0\end{pmatrix}\end{align*}$$

케일리-해밀턴 정리를 이용하여 역행렬을 구할 수 있다. 다항식 $f(\lambda)=\lambda^{n}+a_{n-1}\lambda^{n-1}+\cdots+a_{1}\lambda+a_{0}$가 행렬 $A$의 특성다항식이면$$\mathbf{O}=f(A)=A^{n}+a_{n-1}A^{n-1}+\cdots+a_{1}A+a_{0}I$$이므로$$-a_{o}I=(A^{n-1}+a_{n-1}A^{n-2}+\cdots+a_{0}I)A$$이고$$a_{0}=f(0)=\det(0I-A)=\det(-A)=(-1)^{n}\det A$$이므로 $A$가 역행렬을 가질 필요충분조건은 $a_{0}=(-1)^{n}\det A\neq0$이고, 따라서 $A$가 역행렬을 가지면 그 역행렬을 다음과 같이 나타낼 수 있다.$$A^{-1}=-\frac{1}{a_{0}}(A^{n-1}+a_{n-1}A^{n-2}+\cdots+a_{1}I)$$다음의 행렬$$A=\begin{pmatrix}4&2&-2\\-5&3&2\\-2&4&1\end{pmatrix}$$의 특성다항식은 $f(\lambda)=\det(\lambda I-A)=\lambda^{3}-8\lambda^{2}+17\lambda-10$이고 케일리-해밀턴 정리에 의해$$A^{3}-8A^{2}+17A=10I$$이므로 $A$의 역행렬을 다음과 같이 구할 수 있다.$$\begin{align*}A^{-1}&=\frac{1}{10}(A^{2}-8A+17I)\\&=\frac{1}{10}\begin{pmatrix}10&6&-6\\-39&7&18\\-30&12&13\end{pmatrix}-\frac{8}{10}\begin{pmatrix}4&2&-2\\-5&3&2\\-2&4&1\end{pmatrix}+\frac{17}{10}\begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix}\\&=\frac{1}{10}\begin{pmatrix}-5&-10&10\\1&0&2\\-14&-20&22\end{pmatrix}\end{align*}$$

케일리-해밀턴 정리를 이용하여 행렬다항식의 계산을 간단하게 할 수 있다. $p(\lambda)$를 임의의 다항식, $f(\lambda)$를 정방행렬 $A$의 특성다항식이라고 하자. 다항식에 대한 나눗셈 알고리즘에 의해 다항식 $q(\lambda)$와 $r(\lambda)$가 존재해서 다음이 성립한다.$$p(\lambda)=q(\lambda)f(\lambda)+r(\lambda)$$여기서 $r(\lambda)$의 차수는 $f(\lambda)$의 차수보다 낮다. 그러면$$p(A)=q(A)f(A)+r(A)$$이고 케일리-해밀턴 정리에 의해 $f(A)=\mathbf{O}$이므로 $p(A)=r(A)$이다. 따라서 $n\times n$행렬에 대한 다항식을 계산하는 문제를 $n$차 이하의 다항식을 계산하는 문제로 간단화할 수 있다.

다음의 행렬$$A=\begin{pmatrix}1&2\\2&1\end{pmatrix}$$의 특성다항식은 $f(\lambda)=\lambda^{2}-2\lambda-3$이다. 다항식 $p(\lambda)=\lambda^{4}-7\lambda^{3}-3\lambda^{2}+\lambda+4$에 대해$$p(\lambda)=(\lambda^{2}-5\lambda-10)f(\lambda)-34\lambda-26$$이므로 케일리-해밀턴 정리에 의해$$\begin{align*}p(A)&=(A^{2}-5A+10I)f(A)-34A-26I\\&=-34A-26I\\&=-34\begin{pmatrix}1&2\\2&1\end{pmatrix}-26\begin{pmatrix}1&0\\0&1\end{pmatrix}\\&=\begin{pmatrix}-60&-68\\-68&-60\end{pmatrix}\end{align*}$$

참고자료:

Linera Algebra, jinho Kwak, sungpyo Hong, Birkhauser

저작자표시 비영리 동일조건 (새창열림)

'대수학 > 선형대수학' 카테고리의 다른 글

[선형대수학] 21. 지수행렬의 계산 (0)	2020.02.26
[선형대수학] 20. 지수행렬 (0)	2020.02.25
[선형대수학] 19. 조르단 표준형 (0)	2020.02.24
[선형대수학] 18. 행렬의 대각화 (0)	2018.12.13
[선형대수학] 17. 고유값과 고유벡터 (0)	2018.12.12

Posted by skywalker222

지식저장고(Knowledge Storage)