[선형대수학] 20. 지수행렬
수열처럼 행렬에 대해서도 극한을 정의할 수 있다.
같은 크기의 행렬열(sequence of matrices) \(\{A_{k}\}\)이 행렬 \(L\)로 수렴(converge)한다는 것은 행렬열 \(\{A_{k}\}\)의 모든 성분들이 \(L\)의 성분으로 수렴하는 것을 뜻하고, 이 경우 다음과 같이 나타낸다.$$L=\lim_{k\,\rightarrow\,\infty}{A_{k}}$$이때 행렬 \(L\)을 행렬열 \(\{A_{k}\}\)의 극한(limit)이라고 한다.
\(\{A_{k}\}\)를 \(m\times n\) 행렬열이고 \(\displaystyle\lim_{k\,\rightarrow\,\infty}{A_{k}}=L\)이라고 하자. 그러면 곱이 정의되는 행렬 \(B\), \(C\)에 대하여 다음이 성립한다.$$\lim_{k\,\rightarrow\,\infty}{BA_{k}}=BA,\,\lim_{k\,\rightarrow\,\infty}{A_{k}C}=AC$$증명: 행렬 \(A\)의 \((i,\,j)\)성분을 \([A]_{ij}\)로 나타내면$$\begin{align*}\lim_{k\,\rightarrow\,\infty}{[BA_{k}]_{ij}}&=\lim_{k\,\rightarrow\,\infty}{\left(\sum_{l=1}^{m}{[B]_{il}[A_{k}]_{lj}}\right)}=\sum_{l=1}^{m}{[B]_{il}\left(\lim_{k\,\rightarrow\,\infty}{[A_{k}]_{lj}}\right)}\\&=\sum_{l=1}^{m}{[B]_{il}[L]_{lj}}=[BL]_{ij}\end{align*}$$이므로 \(\displaystyle\lim_{k\,\rightarrow\,\infty}{BA_{k}}=BL\)이고 같은 방법으로 \(\displaystyle\lim_{k\,\rightarrow\,\infty}{A_{k}C}=AC\)가 성립함을 보일 수 있다.
예를들어 행렬 \(A\)가 대각화 가능한 행렬이면, \(A=QDQ^{-1}\)로 나타낼 수 있으므로 \(A^{k}=QD^{k}Q^{-1}\)이고 다음이 성립한다.$$\lim_{k\,\rightarrow\,\infty}{A^{k}}=Q\left(\lim_{k\,\rightarrow\,\infty}{D^{k}}\right)Q^{-1}=Q\begin{pmatrix}\displaystyle\lim_{k\,\rightarrow\,\infty}{\lambda_{1}^{k}}&&0\\&\ddots&\\0&&\displaystyle\lim_{k\,\rightarrow\,\infty}{\lambda_{n}^{k}}\end{pmatrix}Q^{-1}$$따라서 \(\displaystyle\lim_{k\,\rightarrow\,\infty}{A^{k}}\)가 존재할 필요충분조건은 \(\displaystyle\lim_{k\,\rightarrow\,\infty}{\lambda_{i}^{k}}\,(i=1,\,...,\,n)\)가 존재하는 것이다.
행렬열 \(\{A_{k}\}\)에 대하여 \(\displaystyle S_{m}=\sum_{k=0}^{m}{A_{k}}\)라고 하자. 행렬열 \(\{S_{m}\}\)이 행렬 \(L\)로 수렴(converge)한다는 것은 \(L\)이 행렬열 \(\{S_{m}\}\)의 극한이라는 것이다. 즉 \(\displaystyle\lim_{m\,\rightarrow\,\infty}{S_{m}}=L\). 이 경우 다음과 같이 나타낸다.$$A_{0}+A_{1}+A_{2}+\cdots=\sum_{k=0}^{\infty}{A_{k}}=L$$
예를들어 대각화 가능한 행렬 \(A\)에 대하여 \(A=QDQ^{-1}\)로 나타낼 수 있으므로 \(\displaystyle S_{m}=\sum_{k=0}^{m}{A^{k}}\)라고 하면 다음이 성립한다$$\begin{align*}S_{m}&=\sum_{k=0}^{m}{A^{k}}=\sum_{k=0}^{m}{QD^{k}Q^{-1}}=Q\left(\sum_{k=0}^{m}{D^{k}}\right)Q^{-1}\\&=Q\begin{pmatrix}\frac{1-\lambda_{1}^{m+1}}{1-\lambda_{1}}&&0\\&\ddots&\\0&&\frac{1-\lambda_{n}^{m+1}}{1-\lambda_{n}}\end{pmatrix}Q^{-1}\end{align*}$$따라서 \(\displaystyle\lim_{m\,\rightarrow\,\infty}{S_{m}}\)이 존재할 필요충분조건은 \(|\lambda_{i}|<1\,(i=1,\,...,\,n)\)이다.
임의의 실수 \(x\)에 대하여 지수함수 \(y=e^{x}\)를 다음과 같이 멱급수로 나타낼 수 있다.$$e^{x}=1+x+\frac{x^{2}}{2!}+\frac{x^{3}}{3!}+\cdots$$이것과 비슷하게 정방행렬에 대한 지수행렬 \(e^{A}\)를 다음과 같이 정의할 수 있다.
정방행렬 \(A\)에 대하여 \(A\)의 지수행렬(exponential matrix) \(e^{A}\)를 다음과 같이 정의한다.$$\begin{align*}e^{A}&=\sum_{k=0}^{\infty}{\frac{A^{k}}{k!}}\\&=I+A+\frac{A^{2}}{2!}+\frac{A^{3}}{3!}+\cdots\end{align*}$$임의의 정방행렬 \(A\)에 대해 지수행렬 \(e^{A}\)는 존재하는데 \(A\)의 모든 성분 \(a_{ij}\)에 대하여 \(|a_{ij}|\leq M\)이라고 하자. 그러면 \(A^{k}\)의 모든 성분은 \(n^{k-1}M^{k}\)보다 작고$$\sum_{k=0}^{\infty}{\frac{n^{k-1}M^{k}}{k!}}=\frac{1}{n}e^{nM}$$이므로 비교판정법에 의해 \(\displaystyle e^{A}=\sum_{k=0}^{\infty}{\frac{A^{k}}{k!}}\)의 모든 성분들은 절대수렴한다.
예를들어 대각행렬 \(D\)가 다음과 같이 정의되었다고 하자.$$D=\begin{pmatrix}\lambda_{1}&&0\\&\ddots&\\0&&\lambda_{n}\end{pmatrix}$$그러면$$D^{k}=\begin{pmatrix}\lambda_{1}^{k}&&0\\&\ddots&\\0&&\lambda_{n}^{k}\end{pmatrix}$$이므로 \(D\)의 지수행렬 \(e^{D}\)는 다음과 같다.$$\begin{align*}e^{D}&=I+D+\frac{D^{2}}{2!}+\frac{D^{3}}{3!}+\cdots\\&=\begin{pmatrix}\displaystyle\sum_{k=0}^{\infty}{\frac{\lambda_{1}^{k}}{k!}}&&0\\&\ddots&\\0&&\displaystyle\sum_{k=0}^{\infty}{\frac{\lambda_{n}^{k}}{k!}}\end{pmatrix}\\&=\begin{pmatrix}e^{\lambda_{1}}&&0\\&\ddots&\\0&&e^{\lambda_{n}}\end{pmatrix}\end{align*}$$이 결과로부터 행렬 \(A\)가 대각화 가능할 경우, \(A=QDQ^{-1}\)로 나타낼 수 있으므로 다음과 같이 \(A\)의 지수행렬 \(e^{A}\)를 구할 수 있다.$$\begin{align*}e^{A}&=e^{QDQ^{-1}}\\&=I+QDQ^{-1}+\frac{(QDQ^{-1})^{2}}{2!}+\frac{(QDQ^{-1})^{3}}{3!}+\cdots\\&=Q\left(I+D+\frac{D^{2}}{2!}+\frac{D^{3}}{3!}+\cdots\right)Q^{-1}\\&=Qe^{D}Q^{-1}\end{align*}$$
다음은 지수행렬의 성질들이다.
(1) \(AB=BA\)이면 \(e^{A+B}=e^{A}e^{B}\)이다.
(2) 역행렬이 존재하는 행렬 \(Q\)에 대하여 \(e^{Q^{-1}AQ}=Q^{-1}e^{A}Q\)이다.
(3) \(\lambda_{1},\,\lambda_{2},\,...,\,\lambda_{n}\)이 행렬 \(A\)의 고유값이고, 대응되는 고유벡터가 \(\mathbf{v}_{1},\,\mathbf{v}_{2},\,...,\,\mathbf{v}_{n}\)이면, \(e^{\lambda_{i}}\,(i=1,\,...,\,m)\)들은 \(e^{A}\)의 고유값이고, 대응되는 고유벡터는 \(A\)의 것과 동일하다. 게다가 임의의 정방행렬 \(A\)에 대하여 \(\det e^{A}=e^{\lambda_{1}}\cdots e^{\lambda_{n}}=e^{\text{tr}(A)}\neq0\)이다.
(4) 행렬 \(e^{A}\)는 항상 역행렬을 가지고 \((e^{A})^{-1}=e^{-A}\)이다.
증명:
(1): 다음의 계산에 의해 성립한다.$$\begin{align*}e^{A}e^{B}&=\left(I+A+\frac{A^{2}}{2!}+\frac{A^{3}}{3!}+\cdots\right)\left(I+B+\frac{B^{2}}{2!}+\frac{B^{3}}{3!}+\cdots\right)\\&=I+(A+B)+\left(\frac{A^{2}}{2!}+\frac{B^{2}}{2!}+AB\right)+\left(\frac{B^{3}}{3!}+\frac{A^{3}}{3!}+\frac{A^{2}B}{2!}+\frac{B^{2}A}{2!}\right)+\cdots\\&=I+(A+B)+\frac{(A+B)^{2}}{2!}+\frac{(A+B)^{3}}{3!}+\cdots\\&=e^{A+B}\end{align*}$$
(2): 다음의 계산에 의해 성립한다.$$\begin{align*}e^{Q^{-1}AQ}&=I+(Q^{-1}AQ)+\frac{(Q^{-1}AQ)^{2}}{2!}+\frac{(Q^{-1}AQ)^{3}}{3!}+\cdots\\&=Q^{-1}\left(I+A+\frac{A^{2}}{2!}+\frac{A^{3}}{3!}+\cdots\right)Q\\&=Q^{-1}e^{A}Q\end{align*}$$
(3): \(A\mathbf{v}_{i}=\lambda_{i}\mathbf{v}_{i}\)이므로 \(A^{k}\mathbf{v}_{i}=\lambda_{i}^{k}\mathbf{v}_{i}\)이고$$\begin{align*}e^{A}\mathbf{v}_{i}&=\left(I+A+\frac{A^{2}}{2!}+\frac{A^{3}}{3!}+\cdots\right)\mathbf{v}_{i}\\&=\left(1\cdot\mathbf{v}_{i}+\lambda_{i}\mathbf{v}_{i}+\frac{\lambda_{i}^{2}}{2!}\mathbf{v}_{i}+\frac{\lambda_{i}^{3}}{3!}\mathbf{v}_{i}+\cdots\right)\\&=\sum_{k=0}^{\infty}{\frac{\lambda_{i}^{k}}{k!}}\mathbf{v}_{i}\\&=e^{\lambda_{i}}\mathbf{v}_{i}\end{align*}$$이므로 \(e^{A}\)의 고유값은 \(e^{\lambda_{1}},\,...,\,e^{\lambda_{n}}\)이고 \(A\)와 같은 고유벡터를 가진다.
(4): \(A(-A)=-A^{2}=(-A)A\)이므로 (1)에 의해 다음 식이 성립한다.$$e^{A}e^{-A}=e^{A+(-A)}=e^{\mathbf{O}}=I+\mathbf{O}+\frac{\mathbf{O}^{2}}{2!}+\frac{\mathbf{O}^{3}}{3!}+\cdots=I$$따라서 \(e^{A}\)는 역행렬을 갖고, 그 역행렬은 \(e^{-A}\)이다.
참고자료:
Linear Algebra, jinho Kwak, sungpyo Hong, Birkhauser
'대수학 > 선형대수학' 카테고리의 다른 글
[선형대수학] 22. 케일리-해밀턴 정리 (0) | 2020.03.01 |
---|---|
[선형대수학] 21. 지수행렬의 계산 (0) | 2020.02.26 |
[선형대수학] 19. 조르단 표준형 (0) | 2020.02.24 |
[선형대수학] 18. 행렬의 대각화 (0) | 2018.12.13 |
[선형대수학] 17. 고유값과 고유벡터 (0) | 2018.12.12 |