대수학/선형대수학2020. 2. 24. 08:00
반응형

[선형대수학] 19. 조르단 표준형



앞에서 다루었던 행렬$$B=\left(\begin{matrix}t&1&0\\0&t&1\\0&0&t\end{matrix}\right)\,(t\in\mathbb{R})$$은 대각화가 가능하지 않은 행렬이다. 이러한 행렬은 다음의 조르단 표준형이라고 하는 형태이다.


\(n\times n\)행렬 \(A\)가 \(s\)개의 선형독립인 고유벡터들을 가지면, 조르단 표준형(Jordan canonical form)이라고 불리는 다음의 행렬과 닮음이다.$$J=Q^{-1}AQ=\left(\begin{matrix}J_{1}&&&\\&J_{2}&&\\&&\ddots&\\&&&J_{s}\end{matrix}\right)$$여기서 \(J_{i}\)는 조르단 블럭(Jordan block)으로 다음과 같은 삼각행렬이고$$J_{i}=\left(\begin{matrix}\lambda_{i}&1&&\\&\ddots&\ddots&\\&&\ddots&1\\&&&\lambda_{i}\end{matrix}\right)$$\(\lambda_{i}\)는 행렬 \(A\)의 단일 고유값, \(s\)는 \(A\)의 선형독립인 고유벡터의 수이다.


주의할 점은 선형독립인 고유벡터의 수가 1개 이상이면, 동일한 고유값 \(\lambda_{i}\)는 여러 블럭에 나타날 수 있다. \(A\)가 \(n\)개의 선형독립인 고유벡터를 가지면, \(n\)개의 조르단 블럭을 갖고, 그 조르단 블럭은 \(1\times1\)행렬이므로 \(A\)는 대각행렬이고, 대각행렬은 조르단 표준형의 특별한 경우이다. 


\(5\times5\)행렬 \(A\)가 중복도가 5인 하나의 고유값 \(\lambda\)를 갖는다고 하자. 그러면 가능한 조르단 표준형의 개수는 다음의 7개이다.

(1) \(A\)가 하나의 선형독립인 고유벡터를 갖는다고 하면 가능한 \(A\)의 조르단 표준형은 다음과 같다.$$J=\left(\begin{matrix}\lambda&1&0&0&0\\0&\lambda&1&0&0\\0&0&\lambda&1&0\\0&0&0&\lambda&1\\0&0&0&0&\lambda\end{matrix}\right)$$이 조르단 표준형은 1개의 조르단 블럭으로 되어있고, 대각선에 고유값 \(\lambda\)가 있다.    

(2) \(A\)가 두 개의 선형독립인 고유벡터를 갖는다고 하면 가능한 \(A\)의 조르단 표준형은 다음과 같다.$$J=\left(\begin{matrix}\lambda&1&&&\\0&\lambda&&&\\&&\lambda&1&0\\&&0&\lambda&1\\&&0&0&\lambda\end{matrix}\right),\,J=\left(\begin{matrix}\lambda&&&&\\&\lambda&1&0&0\\&0&\lambda&1&0\\&0&0&\lambda&1\\&0&0&0&\lambda\end{matrix}\right)$$이 조르단 표준형은 2개의 조르단 블럭으로 되어있고, 대각선에 고유값 \(\lambda\)가 있다. 

(3) \(A\)가 세 개의 선형독립인 고유벡터를 갖는다고 하면 가능한 \(A\)의 조르단 표준형은 다음과 같다.$$J=\left(\begin{matrix}\lambda&&&&\\&\lambda&1&&\\&0&\lambda&&\\&&&\lambda&1\\&&&0&\lambda\end{matrix}\right),\,J=\left(\begin{matrix}\lambda&&&&\\&\lambda&&&\\&&\lambda&1&0\\&&0&\lambda&1\\&&0&0&\lambda\end{matrix}\right)$$이 조르단 표준형은 3개의 조르단 블럭으로 되어있고, 대각선에 고유값 \(\lambda\)가 있다.  

(4) \(A\)가 네 개의 선형독립인 고유벡터를 갖는다고 하면 가능한 \(A\)의 조르단 표준형은 다음과 같다.$$J=\left(\begin{matrix}\lambda&&&&\\&\lambda&&&\\&&\lambda&&\\&&&\lambda&1\\&&&0&\lambda\end{matrix}\right)$$이 조르단 표준형은 4개의 조르단 블럭으로 되어있고, 대각선에 고유값 \(\lambda\)가 있다.  

(5) \(A\)가 다섯 개의 선형독립인 고유벡터를 갖는다고 하면 가능한 \(A\)의 조르단 표준형은 다음과 같다.$$J=\left(\begin{matrix}\lambda&&&&\\&\lambda&&&\\&&\lambda&&\\&&&\lambda&\\&&&&\lambda\end{matrix}\right)$$대각행렬과 동일하다(정확히는 5개의 조르단 블럭). 


행렬 \(J\)가 다음과 같은 조르단 표준형이라고 하자.$$J=\left(\begin{matrix}\left(\begin{matrix}6&1\\0&6\end{matrix}\right)&&\\&\left(\begin{matrix}0&1\\0&0\end{matrix}\right)&\\&&(0)\end{matrix}\right)=\left(\begin{matrix}J_{1}&&\\&J_{2}&\\&&J_{3}\end{matrix}\right)$$이 행렬의 고유값은 6과 0이고 각각 중복도가 2와 3이다. 고유값 \(\lambda=6\)에 대한 고유벡터를 \(\mathbf{x}_{1}\)(계산해보면 1개가 나온다), 고유값 \(\lambda=0\)에 대한 고유벡터를 \(\mathbf{x}_{3}\), \(\mathbf{x}_{5}\)(계산해보면 2개가 나온다)라고 하면 다음과 같다.$$\mathbf{x}_{1}=\left(\begin{matrix}1\\0\\0\\0\\0\end{matrix}\right),\,\mathbf{x}_{3}=\left(\begin{matrix}0\\0\\1\\0\\0\end{matrix}\right),\,\mathbf{x}_{5}=\left(\begin{matrix}0\\0\\0\\0\\1\end{matrix}\right)$$\(Q=[\mathbf{x}_{1}\,\mathbf{x}_{2}\,\cdots\,\mathbf{x}_{5}]\)라 하고 \(Q^{-1}AQ=J\)를 \(AQ=QJ\)로 나타내면$$A\left(\begin{matrix}&&&\\&&&\\ \mathbf{x}_{1}&\mathbf{x}_{2}&\cdots&\mathbf{x}_{5}\\&&&\\&&&\end{matrix}\right)=\left(\begin{matrix}&&&\\&&&\\  \mathbf{x}_{1}&\mathbf{x}_{2}&\cdots&\mathbf{x}_{5}\\&&&\\&&&\end{matrix}\right)\left(\begin{matrix}6&1&&&\\0&6&&&\\&&0&1&\\&&0&0&\\&&&&0\end{matrix}\right)$$이므로 따라서$$[A\mathbf{x}_{1}\,A\mathbf{x}_{2}\,A\mathbf{x}_{3}\,A\mathbf{x}_{4}\,A\mathbf{x}_{5}]=[6\mathbf{x}_{1}\,\mathbf{x}_{1}+6\mathbf{x}_{2}\,0\mathbf{x}_{3}\,\mathbf{x}_{3}\,0\mathbf{x}_{5}]\,\text{or}\\A\mathbf{x}_{1}=6\mathbf{x}_{1},\,A\mathbf{x}_{2}=6\mathbf{x}_{2}+\mathbf{x}_{1},\,A\mathbf{x}_{3}=0\mathbf{x}_{3},\,A\mathbf{x}_{4}=0\mathbf{x}_{4}+\mathbf{x}_{3},\,A\mathbf{x}_{5}=0\mathbf{x}_{5}$$여기서 \(\mathbf{x}_{1}\), \(\mathbf{x}_{3}\), \(\mathbf{x}_{5}\)는 \(A\)의 고유벡터이지만 \(\mathbf{x}_{2}\), \(\mathbf{x}_{4}\)는 아니다. 그러나 이 두 벡터는 다음의 식이 성립하고$$(A-6I)\mathbf{x}_{2}=\mathbf{x}_{1},\,(A-0I)\mathbf{x}_{4}=\mathbf{x}_{3}$$따라서 다음이 성립한다.$$(A-6I)^{2}\mathbf{x}_{2}=\mathbf{0},\,(A-0I)^{2}\mathbf{x}_{4}=\mathbf{0}$$여기서의 두 벡터 \(\mathbf{x}_{2}\)와 \(\mathbf{x}_{4}\)를 각각 고유값 \(\lambda=6\)과 \(\lambda=0\)에 대한 일반 고유벡터라고 한다. 참고로 다음이 성립한다.$$(A-6I)\mathbf{x}_{2}\neq\mathbf{0},\,(A-0I)\mathbf{x}_{4}\neq\mathbf{0}$$\(\mathbf{x}\)가 계수(rank)가 \(k\)이고 고유값이 \(\lambda\)인 \(A\)의 일반 고유벡터(generalized eigenvector)라는 것은 다음이 성립하는 것이다.$$(A-\lambda I)^{k}\mathbf{x}=\mathbf{0},\,(A-\lambda I)^{k-1}\mathbf{x}\neq\mathbf{0}$$\(k=1\)이면 고유벡터의 정의이다. \(\mathbf{x}\)를 고유값이 \(\lambda\)이고 계수가 \(k\)인 일반 고유벡터라고 하고 \(\mathbf{x}_{1},\,\mathbf{x}_{2},\,...,\,\mathbf{x}_{k}\)를 다음과 같이 정의하자$$\begin{align*}\mathbf{x}_{k}&=\mathbf{x}\\ \mathbf{x}_{k-1}&=(A-\lambda I)\mathbf{x}=(A-\lambda I)\mathbf{x}_{k}\\  \mathbf{x}_{k-2}&=(A-\lambda I)^{2}\mathbf{x}=(A-\lambda I)\mathbf{x}_{k-1}\\ \vdots&&\\ \mathbf{x}_{2}&=(A-\lambda I)^{k-2}\mathbf{x}=(A-\lambda I)\mathbf{x}_{3}\\ \mathbf{x}_{1}&=(A-\lambda I)^{k-1}\mathbf{x}=(A-\lambda I)\mathbf{x}_{2}\end{align*}$$위의 벡터들의 집합 \(\{\mathbf{x}_{1},\,\mathbf{x}_{2},\,...,\,\mathbf{x}_{k}\}\)를 고유값이 \(\lambda\)인 일반 고유벡터들의 사슬(chain of generalized eigenvectors)이라고 한다. 


\(\mathbf{x}\)가 고유값이 \(\lambda\)이고 계수가 \(k(>1)\)인 \(A\)의 일반 고유벡터이면, \(1<l\leq k\)인 \(l\)에 대하여 \((A-\lambda I)^{l}\mathbf{x}_{l}=(A-\lambda I)^{k}\mathbf{x}=\mathbf{0}\)이고 \((A-\lambda I)^{l-1}\mathbf{x}_{l}=(A-\lambda I)^{k-1}\mathbf{x}\neq\mathbf{0}\)이다. 따라서 벡터 \(\mathbf{x}_{l}=(A-\lambda I)^{k-l}\mathbf{x}\)는 고유값이 \(\lambda\)이고 차원이 \(l\)인 일반 고유벡터이다. \(\mathbf{x}_{1}=(A-\lambda I)^{k-1}\mathbf{x}\)는 항상 고유값이 \(\lambda\)인 고유벡터이므로 이 사슬의 초기벡터(initial vector)라고 한다. \(l\geq i\)에 대하여 \((A-\lambda I)^{l}\mathbf{x}_{i}=\mathbf{0}\)이다.  

 

다음은 일반 고유벡터의 사슬에 관한 성질인데 증명은 하지 않겠다.


1. 고유값이 \(\lambda\)인 일반 고유벡터들의 사슬 \(S=\{\mathbf{x}_{1},\,\mathbf{x}_{2},\,...,\,\mathbf{x}_{k}\}\)는 선형독립이다.


2. 정방행렬 \(A\)의 서로 다른 고유값들에 대한 일반 고유벡터의 사슬의 합집합은 선형독립이다.


3. \(S=\{\mathbf{x}_{1},\,\mathbf{x}_{2},\,...,\,\mathbf{x}_{k}\}\)와 \(T=\{\mathbf{y}_{1},\,\mathbf{y}_{2},\,...,\,\mathbf{y}_{l}\}\)을 고유값이 \(\lambda\)인 행렬 \(A\)의 일반 고유벡터들의 사슬이라고 하자. 초기벡터 \(\mathbf{x}_{1}\)과 \(\mathbf{y}_{1}\)이 서로 독립이면, \(S\cup T\)는 선형독립이다. 


다음의 행렬에 대한 조르단 표준형을 구하자.$$A=\begin{pmatrix}2&1&4\\0&2&-1\\0&0&3\end{pmatrix}$$행렬 \(A\)의 고유값은 \(\lambda_{1}=\lambda_{2}=2\), \(\lambda_{3}=3\)이고 고유값 2에 대한 고유벡터를 \(\mathbf{u}_{1}\), 고유값 3에 대한 고유벡터를 \(\mathbf{u}_{3}\)이라고 하면 다음이 성립한다.$$\mathbf{u}_{1}=\begin{pmatrix}1\\0\\0\end{pmatrix},\,\mathbf{u}_{3}=\begin{pmatrix}3\\-1\\1\end{pmatrix}$$\(E(2)=2\)(고유값 2에 대한 고유공간의 차원이 2)이므로 \(\mathbf{u}_{2}\)는 고유값 2에 대한 일반 고유벡터이다.$$\begin{align*}(A-2I)\mathbf{x}&=\begin{pmatrix}0&1&4\\0&0&-1\\0&0&1\end{pmatrix}\mathbf{u}_{2}\neq\mathbf{0}\\(A-2I)^{2}&=\begin{pmatrix}0&0&3\\0&0&-1\\0&0&1\end{pmatrix}\mathbf{u}_{2}=\mathbf{0}\end{align*}$$이므로$$\mathbf{u}_{2}=\begin{pmatrix}a\\b\\0\end{pmatrix}$$의 형태이나$$\mathbf{u}_{1}=\begin{pmatrix}1\\0\\0\end{pmatrix}$$이므로$$\mathbf{u}_{2}=\begin{pmatrix}0\\1\\0\end{pmatrix}$$이어야 한다. 그러면 다음이 성립한다.$$\begin{align*}(A-2I)\mathbf{u}_{2}&=\mathbf{u}_{1}\\(A-2I)^{2}\mathbf{u}_{2}&=(A-2I)\mathbf{u}_{1}=\mathbf{0}\end{align*}$$또한 일반 고유벡터들의 사슬 \(\{\mathbf{u}_{1},\,\mathbf{u}_{2},\,\mathbf{u}_{3}\}\)은 선형독립이므로 이 벡터들로 행렬 \(Q\)와 그 역행렬 \(Q^{-1}\)을 다음과 같이 구할 수 있다.$$Q=\begin{pmatrix}1&0&3\\0&1&-1\\0&0&1\end{pmatrix},\,Q^{-1}=\begin{pmatrix}1&0&-3\\0&1&1\\0&0&1\end{pmatrix}$$그러면 다음과 같이 조르단 표준형을 구할 수 있다.$$Q^{-1}AQ=\begin{pmatrix}2&1&0\\0&2&0\\0&0&3\end{pmatrix}=\begin{pmatrix}J_{1}&0\\0&J_{2}\end{pmatrix}\,\left(J_{1}=\begin{pmatrix}2&1\\0&2\end{pmatrix},\,J_{2}=(3)\right)$$

다음의 행렬에 대해 조르단 표준형을 구하자.$$A=\begin{pmatrix}0&1&0&0\\0&0&1&0\\0&0&0&1\\-1&4&-6&4\end{pmatrix}$$고유값을 구하면$$\det(A-\lambda I)=\lambda^{4}-4\lambda^{3}+6\lambda^{2}-4\lambda+1=(\lambda-1)^{4}$$이므로 \(A\)의 고유값은 \(\lambda=1\)이고 중복도가 4이다.$$A-I=\begin{pmatrix}-1&1&0&0\\0&-1&1&0\\0&0&-1&1\\-1&4&-6&3\end{pmatrix}$$이고 \(\text{rank}(A-I)=3\)이므로 \(E(1)=1\)이다. 고유벡터를 구하면$$\mathbf{x}=\begin{pmatrix}1\\1\\1\\1\end{pmatrix}$$이므로 계수가 4인 일반 고유벡터를 찾아야 한다. 직접 계산해보면 \((A-I)^{4}=\mathbf{O}\)(영행렬)이므로 식 \((A-I)^{4}\mathbf{x}=\mathbf{0}\)을 만족하고 계수가 4인 일반 고유벡터 \(\mathbf{x}\)를 임의로 다음과 같이 설정할 수 있다.$$\mathbf{x}=\begin{pmatrix}-1\\0\\0\\0\end{pmatrix}$$그러면$$\begin{align*}\mathbf{x}_{3}&=(A-I)\mathbf{x}_{4}=\begin{pmatrix}-1&1&0&0\\0&-1&1&0\\0&0&-1&1\\-1&4&-6&3\end{pmatrix}\begin{pmatrix}-1\\0\\0\\0\end{pmatrix}=\begin{pmatrix}1\\0\\0\\1\end{pmatrix}\\ \mathbf{x}_{2}&=(A-I)\mathbf{x}_{3}=\begin{pmatrix}-1\\0\\1\\2\end{pmatrix},\,\mathbf{x}_{1}=(A-I)\mathbf{x}_{2}=\begin{pmatrix}1\\1\\1\\1\end{pmatrix}\end{align*}$$이고 일반 고유벡터들의 사슬 \(\{\mathbf{x}_{1},\,\mathbf{x}_{2},\,\mathbf{x}_{3},\,\mathbf{x}_{4}\}\)은 선형독립이므로$$Q=\begin{pmatrix}1&-1&1&-1\\1&0&0&0\\1&1&0&0\\1&2&1&0\end{pmatrix},\,Q^{-1}=\begin{pmatrix}0&1&0&0\\0&-1&1&0\\0&1&-2&1\\-1&3&-3&1\end{pmatrix}$$이고$$Q^{-1}AQ=\begin{pmatrix}1&1&0&0\\0&1&1&0\\0&0&1&1\\0&0&0&1\end{pmatrix}=J$$이 구하려는 조르단 표준형이다.


참고자료:

Linear Algebra, jinho Kwak, sungpyo Hong, Birkhauser              

반응형
Posted by skywalker222