Processing math: 17%

대수학/선형대수학2020. 3. 1. 08:00
반응형

[선형대수학] 22. 케일리-해밀턴 정리



f(x)=amxm+am1xm1++a1x+a0를 다항식, An×n행렬이라고 하자. 다음과 같이 정의된 행렬을 A의 행렬다항식(matrix polynomial)이라고 한다.f(A)=amAm+am1Am1++a1A+a0In예를들어 다항식 f(x)2×2행렬 A가 다음과 같다고 하자.f(x)=x22x+2,A=(1221)그러면 f(A)는 다음과 같다.f(A)=A22A+2I2=(5445)2(1221)+2(1001)=(5005)케일리-해밀턴 정리(Cayley-Hamilton Theorem)

임의의 n×n행렬 A에 대하여 f(λ)=detA의 특성다항식이면, f(A)=\mathbf{O}이다. 

증명:   

(1) A가 다음과 같은 대각행렬이라고 하자.D=\begin{pmatrix}\lambda_{1}&&0\\ \vdots&\ddots&\vdots\\0&&\lambda_{n}\end{pmatrix} 

모든 k\geq0에 대하여 다음 식이 성립한다D^{k}=\begin{pmatrix}\lambda_{1}^{k}&&0\\ \vdots&\ddots&\vdots\\0&&\lambda_{n}^{k}\end{pmatrix}그러면 다음의 결과를 얻는다.f(D)=\begin{pmatrix}f(\lambda_{1})&&0\\ \vdots&\ddots&\vdots\\0&&f(\lambda_{n})\end{pmatrix}=\mathbf{O} 

(2) A가 대각화 가능하다고 하자. 즉 Q^{-1}AQ=D.

AD의 특성다항식은 동일하므로 다음의 결과를 얻는다.\begin{align*}f(A)&=f(QDQ^{-1})\\&=(QDQ^{-1})^{n}+a_{n-1}(QDQ^{-1})^{n-1}+\cdots+a_{1}(QDQ^{-1})+a_{0}I\\&=Q(D^{n}+a_{n-1}D^{n-1}+\cdots+a_{1}D+a_{0}I)Q^{-1}\\&=Qf(D)Q^{-1}\\&=\mathbf{O}\end{align*}  

(3) A를 임의의 행렬이라고 하자. 그러면 A는 다음과 같은 조르단 표준형 J와 닮음행렬이고,J=\begin{pmatrix}J_{1}&&0\\ \vdots&\ddots&\vdots\\0&&J_{s}\end{pmatrix}=Q^{-1}AQf(A)=Qf(J)Q^{-1}이다. 다음의 식에 의해J^{k}=\begin{pmatrix}J_{1}^{k}&&0\\ \vdots&\ddots&\vdots\\0&&J_{s}^{k}\end{pmatrix},\,f(J)=\begin{pmatrix}f(J_{1})&&0\\ \vdots&\ddots&\vdots\\0&&f(J_{s})\end{pmatrix}단일 조르단 블럭 J=aI+N에 대해 f(J)=\mathbf{O}가 성립함을 보이면 된다. 여기서 a는 고유값이고, N^{n}=\mathbf{O}이다.f(\lambda)=\det(\lambda I-A)=\det(\lambda I-J)=(\lambda-a)^{n}이므로 다음의 결과를 얻는다.f(J)=f(aI+N)=(aI+N-aI)^{n}=N^{n}=\mathbf{O} 

다음의 행렬A=\begin{pmatrix}3&6&6\\0&2&0\\-3&-12&-6\end{pmatrix}의 특성다항식은 f(\lambda)=\det(\lambda I-A)=\lambda^{3}+\lambda^{2}-6\lambda이므로 다음의 결과를 얻는다.\begin{align*}f(A)&=A^{3}+A^{2}-6A\\&=\begin{pmatrix}27&78&54\\0&8&0\\-27&-102&-54\end{pmatrix}+\begin{pmatrix}-9&-42&-18\\0&4&0\\9&30&18\end{pmatrix}-6\begin{pmatrix}3&6&6\\0&2&0\\-3&-12&-6\end{pmatrix}\\&=\begin{pmatrix}0&0&0\\0&0&0\\0&0&0\end{pmatrix}\end{align*}

케일리-해밀턴 정리를 이용하여 역행렬을 구할 수 있다. 다항식 f(\lambda)=\lambda^{n}+a_{n-1}\lambda^{n-1}+\cdots+a_{1}\lambda+a_{0}가 행렬 A의 특성다항식이면\mathbf{O}=f(A)=A^{n}+a_{n-1}A^{n-1}+\cdots+a_{1}A+a_{0}I이므로-a_{o}I=(A^{n-1}+a_{n-1}A^{n-2}+\cdots+a_{0}I)A이고a_{0}=f(0)=\det(0I-A)=\det(-A)=(-1)^{n}\det A이므로 A가 역행렬을 가질 필요충분조건은 a_{0}=(-1)^{n}\det A\neq0이고, 따라서 A가 역행렬을 가지면 그 역행렬을 다음과 같이 나타낼 수 있다.A^{-1}=-\frac{1}{a_{0}}(A^{n-1}+a_{n-1}A^{n-2}+\cdots+a_{1}I)다음의 행렬A=\begin{pmatrix}4&2&-2\\-5&3&2\\-2&4&1\end{pmatrix}의 특성다항식은 f(\lambda)=\det(\lambda I-A)=\lambda^{3}-8\lambda^{2}+17\lambda-10이고 케일리-해밀턴 정리에 의해A^{3}-8A^{2}+17A=10I이므로 A의 역행렬을 다음과 같이 구할 수 있다.\begin{align*}A^{-1}&=\frac{1}{10}(A^{2}-8A+17I)\\&=\frac{1}{10}\begin{pmatrix}10&6&-6\\-39&7&18\\-30&12&13\end{pmatrix}-\frac{8}{10}\begin{pmatrix}4&2&-2\\-5&3&2\\-2&4&1\end{pmatrix}+\frac{17}{10}\begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix}\\&=\frac{1}{10}\begin{pmatrix}-5&-10&10\\1&0&2\\-14&-20&22\end{pmatrix}\end{align*}

케일리-해밀턴 정리를 이용하여 행렬다항식의 계산을 간단하게 할 수 있다. p(\lambda)를 임의의 다항식, f(\lambda)를 정방행렬 A의 특성다항식이라고 하자. 다항식에 대한 나눗셈 알고리즘에 의해 다항식 q(\lambda)r(\lambda)가 존재해서 다음이 성립한다.p(\lambda)=q(\lambda)f(\lambda)+r(\lambda)여기서 r(\lambda)의 차수는 f(\lambda)의 차수보다 낮다. 그러면p(A)=q(A)f(A)+r(A)이고 케일리-해밀턴 정리에 의해 f(A)=\mathbf{O}이므로 p(A)=r(A)이다. 따라서 n\times n행렬에 대한 다항식을 계산하는 문제를 n차 이하의 다항식을 계산하는 문제로 간단화할 수 있다. 


다음의 행렬A=\begin{pmatrix}1&2\\2&1\end{pmatrix}의 특성다항식은 f(\lambda)=\lambda^{2}-2\lambda-3이다. 다항식 p(\lambda)=\lambda^{4}-7\lambda^{3}-3\lambda^{2}+\lambda+4에 대해p(\lambda)=(\lambda^{2}-5\lambda-10)f(\lambda)-34\lambda-26이므로 케일리-해밀턴 정리에 의해\begin{align*}p(A)&=(A^{2}-5A+10I)f(A)-34A-26I\\&=-34A-26I\\&=-34\begin{pmatrix}1&2\\2&1\end{pmatrix}-26\begin{pmatrix}1&0\\0&1\end{pmatrix}\\&=\begin{pmatrix}-60&-68\\-68&-60\end{pmatrix}\end{align*} 

참고자료:

Linera Algebra, jinho Kwak, sungpyo Hong, Birkhauser    

반응형
Posted by skywalker222