대수학/선형대수학2020. 3. 1. 08:00
반응형

[선형대수학] 22. 케일리-해밀턴 정리



\(f(x)=a_{m}x^{m}+a_{m-1}x^{m-1}+\cdots+a_{1}x+a_{0}\)를 다항식, \(A\)를 \(n\times n\)행렬이라고 하자. 다음과 같이 정의된 행렬을 \(A\)의 행렬다항식(matrix polynomial)이라고 한다.$$f(A)=a_{m}A^{m}+a_{m-1}A^{m-1}+\cdots+a_{1}A+a_{0}I_{n}$$예를들어 다항식 \(f(x)\)와 \(2\times2\)행렬 \(A\)가 다음과 같다고 하자.$$f(x)=x^{2}-2x+2,\,A=\begin{pmatrix}1&2\\2&1\end{pmatrix}$$그러면 \(f(A)\)는 다음과 같다.$$\begin{align*}f(A)&=A^{2}-2A+2I_{2}\\&=\begin{pmatrix}5&4\\4&5\end{pmatrix}-2\begin{pmatrix}1&2\\2&1\end{pmatrix}+2\begin{pmatrix}1&0\\0&1\end{pmatrix}\\&=\begin{pmatrix}5&0\\0&5\end{pmatrix}\end{align*}$$케일리-해밀턴 정리(Cayley-Hamilton Theorem)

임의의 \(n\times n\)행렬 \(A\)에 대하여 \(f(\lambda)=\det(\lambda I-A)\)가 \(A\)의 특성다항식이면, \(f(A)=\mathbf{O}\)이다. 

증명:   

(1) \(A\)가 다음과 같은 대각행렬이라고 하자.$$D=\begin{pmatrix}\lambda_{1}&&0\\ \vdots&\ddots&\vdots\\0&&\lambda_{n}\end{pmatrix}$$ 

모든 \(k\geq0\)에 대하여 다음 식이 성립한다$$D^{k}=\begin{pmatrix}\lambda_{1}^{k}&&0\\ \vdots&\ddots&\vdots\\0&&\lambda_{n}^{k}\end{pmatrix}$$그러면 다음의 결과를 얻는다.$$f(D)=\begin{pmatrix}f(\lambda_{1})&&0\\ \vdots&\ddots&\vdots\\0&&f(\lambda_{n})\end{pmatrix}=\mathbf{O}$$ 

(2) \(A\)가 대각화 가능하다고 하자. 즉 \(Q^{-1}AQ=D\).

\(A\)와 \(D\)의 특성다항식은 동일하므로 다음의 결과를 얻는다.$$\begin{align*}f(A)&=f(QDQ^{-1})\\&=(QDQ^{-1})^{n}+a_{n-1}(QDQ^{-1})^{n-1}+\cdots+a_{1}(QDQ^{-1})+a_{0}I\\&=Q(D^{n}+a_{n-1}D^{n-1}+\cdots+a_{1}D+a_{0}I)Q^{-1}\\&=Qf(D)Q^{-1}\\&=\mathbf{O}\end{align*}$$  

(3) \(A\)를 임의의 행렬이라고 하자. 그러면 \(A\)는 다음과 같은 조르단 표준형 \(J\)와 닮음행렬이고,$$J=\begin{pmatrix}J_{1}&&0\\ \vdots&\ddots&\vdots\\0&&J_{s}\end{pmatrix}=Q^{-1}AQ$$\(f(A)=Qf(J)Q^{-1}\)이다. 다음의 식에 의해$$J^{k}=\begin{pmatrix}J_{1}^{k}&&0\\ \vdots&\ddots&\vdots\\0&&J_{s}^{k}\end{pmatrix},\,f(J)=\begin{pmatrix}f(J_{1})&&0\\ \vdots&\ddots&\vdots\\0&&f(J_{s})\end{pmatrix}$$단일 조르단 블럭 \(J=aI+N\)에 대해 \(f(J)=\mathbf{O}\)가 성립함을 보이면 된다. 여기서 \(a\)는 고유값이고, \(N^{n}=\mathbf{O}\)이다.$$f(\lambda)=\det(\lambda I-A)=\det(\lambda I-J)=(\lambda-a)^{n}$$이므로 다음의 결과를 얻는다.$$f(J)=f(aI+N)=(aI+N-aI)^{n}=N^{n}=\mathbf{O}$$ 

다음의 행렬$$A=\begin{pmatrix}3&6&6\\0&2&0\\-3&-12&-6\end{pmatrix}$$의 특성다항식은 \(f(\lambda)=\det(\lambda I-A)=\lambda^{3}+\lambda^{2}-6\lambda\)이므로 다음의 결과를 얻는다.$$\begin{align*}f(A)&=A^{3}+A^{2}-6A\\&=\begin{pmatrix}27&78&54\\0&8&0\\-27&-102&-54\end{pmatrix}+\begin{pmatrix}-9&-42&-18\\0&4&0\\9&30&18\end{pmatrix}-6\begin{pmatrix}3&6&6\\0&2&0\\-3&-12&-6\end{pmatrix}\\&=\begin{pmatrix}0&0&0\\0&0&0\\0&0&0\end{pmatrix}\end{align*}$$

케일리-해밀턴 정리를 이용하여 역행렬을 구할 수 있다. 다항식 \(f(\lambda)=\lambda^{n}+a_{n-1}\lambda^{n-1}+\cdots+a_{1}\lambda+a_{0}\)가 행렬 \(A\)의 특성다항식이면$$\mathbf{O}=f(A)=A^{n}+a_{n-1}A^{n-1}+\cdots+a_{1}A+a_{0}I$$이므로$$-a_{o}I=(A^{n-1}+a_{n-1}A^{n-2}+\cdots+a_{0}I)A$$이고$$a_{0}=f(0)=\det(0I-A)=\det(-A)=(-1)^{n}\det A$$이므로 \(A\)가 역행렬을 가질 필요충분조건은 \(a_{0}=(-1)^{n}\det A\neq0\)이고, 따라서 \(A\)가 역행렬을 가지면 그 역행렬을 다음과 같이 나타낼 수 있다.$$A^{-1}=-\frac{1}{a_{0}}(A^{n-1}+a_{n-1}A^{n-2}+\cdots+a_{1}I)$$다음의 행렬$$A=\begin{pmatrix}4&2&-2\\-5&3&2\\-2&4&1\end{pmatrix}$$의 특성다항식은 \(f(\lambda)=\det(\lambda I-A)=\lambda^{3}-8\lambda^{2}+17\lambda-10\)이고 케일리-해밀턴 정리에 의해$$A^{3}-8A^{2}+17A=10I$$이므로 \(A\)의 역행렬을 다음과 같이 구할 수 있다.$$\begin{align*}A^{-1}&=\frac{1}{10}(A^{2}-8A+17I)\\&=\frac{1}{10}\begin{pmatrix}10&6&-6\\-39&7&18\\-30&12&13\end{pmatrix}-\frac{8}{10}\begin{pmatrix}4&2&-2\\-5&3&2\\-2&4&1\end{pmatrix}+\frac{17}{10}\begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix}\\&=\frac{1}{10}\begin{pmatrix}-5&-10&10\\1&0&2\\-14&-20&22\end{pmatrix}\end{align*}$$

케일리-해밀턴 정리를 이용하여 행렬다항식의 계산을 간단하게 할 수 있다. \(p(\lambda)\)를 임의의 다항식, \(f(\lambda)\)를 정방행렬 \(A\)의 특성다항식이라고 하자. 다항식에 대한 나눗셈 알고리즘에 의해 다항식 \(q(\lambda)\)와 \(r(\lambda)\)가 존재해서 다음이 성립한다.$$p(\lambda)=q(\lambda)f(\lambda)+r(\lambda)$$여기서 \(r(\lambda)\)의 차수는 \(f(\lambda)\)의 차수보다 낮다. 그러면$$p(A)=q(A)f(A)+r(A)$$이고 케일리-해밀턴 정리에 의해 \(f(A)=\mathbf{O}\)이므로 \(p(A)=r(A)\)이다. 따라서 \(n\times n\)행렬에 대한 다항식을 계산하는 문제를 \(n\)차 이하의 다항식을 계산하는 문제로 간단화할 수 있다. 


다음의 행렬$$A=\begin{pmatrix}1&2\\2&1\end{pmatrix}$$의 특성다항식은 \(f(\lambda)=\lambda^{2}-2\lambda-3\)이다. 다항식 \(p(\lambda)=\lambda^{4}-7\lambda^{3}-3\lambda^{2}+\lambda+4\)에 대해$$p(\lambda)=(\lambda^{2}-5\lambda-10)f(\lambda)-34\lambda-26$$이므로 케일리-해밀턴 정리에 의해$$\begin{align*}p(A)&=(A^{2}-5A+10I)f(A)-34A-26I\\&=-34A-26I\\&=-34\begin{pmatrix}1&2\\2&1\end{pmatrix}-26\begin{pmatrix}1&0\\0&1\end{pmatrix}\\&=\begin{pmatrix}-60&-68\\-68&-60\end{pmatrix}\end{align*}$$ 

참고자료:

Linera Algebra, jinho Kwak, sungpyo Hong, Birkhauser    

반응형
Posted by skywalker222