[선형대수학] 20. 지수행렬

대수학/선형대수학2020. 2. 25. 08:00

[선형대수학] 20. 지수행렬

수열처럼 행렬에 대해서도 극한을 정의할 수 있다.

같은 크기의 행렬열(sequence of matrices) $\{A_{k}\}$이 행렬 $L$로 수렴(converge)한다는 것은 행렬열 $\{A_{k}\}$의 모든 성분들이 $L$의 성분으로 수렴하는 것을 뜻하고, 이 경우 다음과 같이 나타낸다.$$L=\lim_{k\,\rightarrow\,\infty}{A_{k}}$$이때 행렬 $L$을 행렬열 $\{A_{k}\}$의 극한(limit)이라고 한다.

$\{A_{k}\}$를 $m\times n$ 행렬열이고 $\displaystyle\lim_{k\,\rightarrow\,\infty}{A_{k}}=L$이라고 하자. 그러면 곱이 정의되는 행렬 $B$, $C$에 대하여 다음이 성립한다.$$\lim_{k\,\rightarrow\,\infty}{BA_{k}}=BA,\,\lim_{k\,\rightarrow\,\infty}{A_{k}C}=AC$$증명: 행렬 $A$의 $(i,\,j)$성분을 $[A]_{ij}$로 나타내면$$\begin{align*}\lim_{k\,\rightarrow\,\infty}{[BA_{k}]_{ij}}&=\lim_{k\,\rightarrow\,\infty}{\left(\sum_{l=1}^{m}{[B]_{il}[A_{k}]_{lj}}\right)}=\sum_{l=1}^{m}{[B]_{il}\left(\lim_{k\,\rightarrow\,\infty}{[A_{k}]_{lj}}\right)}\\&=\sum_{l=1}^{m}{[B]_{il}[L]_{lj}}=[BL]_{ij}\end{align*}$$이므로 $\displaystyle\lim_{k\,\rightarrow\,\infty}{BA_{k}}=BL$이고 같은 방법으로 $\displaystyle\lim_{k\,\rightarrow\,\infty}{A_{k}C}=AC$가 성립함을 보일 수 있다.

예를들어 행렬 $A$가 대각화 가능한 행렬이면, $A=QDQ^{-1}$로 나타낼 수 있으므로 $A^{k}=QD^{k}Q^{-1}$이고 다음이 성립한다.$$\lim_{k\,\rightarrow\,\infty}{A^{k}}=Q\left(\lim_{k\,\rightarrow\,\infty}{D^{k}}\right)Q^{-1}=Q\begin{pmatrix}\displaystyle\lim_{k\,\rightarrow\,\infty}{\lambda_{1}^{k}}&&0\\&\ddots&\\0&&\displaystyle\lim_{k\,\rightarrow\,\infty}{\lambda_{n}^{k}}\end{pmatrix}Q^{-1}$$따라서 $\displaystyle\lim_{k\,\rightarrow\,\infty}{A^{k}}$가 존재할 필요충분조건은 $\displaystyle\lim_{k\,\rightarrow\,\infty}{\lambda_{i}^{k}}\,(i=1,\,...,\,n)$가 존재하는 것이다.

행렬열 $\{A_{k}\}$에 대하여 $\displaystyle S_{m}=\sum_{k=0}^{m}{A_{k}}$라고 하자. 행렬열 $\{S_{m}\}$이 행렬 $L$로 수렴(converge)한다는 것은 $L$이 행렬열 $\{S_{m}\}$의 극한이라는 것이다. 즉 $\displaystyle\lim_{m\,\rightarrow\,\infty}{S_{m}}=L$. 이 경우 다음과 같이 나타낸다.$$A_{0}+A_{1}+A_{2}+\cdots=\sum_{k=0}^{\infty}{A_{k}}=L$$

예를들어 대각화 가능한 행렬 $A$에 대하여 $A=QDQ^{-1}$로 나타낼 수 있으므로 $\displaystyle S_{m}=\sum_{k=0}^{m}{A^{k}}$라고 하면 다음이 성립한다$$\begin{align*}S_{m}&=\sum_{k=0}^{m}{A^{k}}=\sum_{k=0}^{m}{QD^{k}Q^{-1}}=Q\left(\sum_{k=0}^{m}{D^{k}}\right)Q^{-1}\\&=Q\begin{pmatrix}\frac{1-\lambda_{1}^{m+1}}{1-\lambda_{1}}&&0\\&\ddots&\\0&&\frac{1-\lambda_{n}^{m+1}}{1-\lambda_{n}}\end{pmatrix}Q^{-1}\end{align*}$$따라서 $\displaystyle\lim_{m\,\rightarrow\,\infty}{S_{m}}$이 존재할 필요충분조건은 $|\lambda_{i}|<1\,(i=1,\,...,\,n)$이다.

임의의 실수 $x$에 대하여 지수함수 $y=e^{x}$를 다음과 같이 멱급수로 나타낼 수 있다.$$e^{x}=1+x+\frac{x^{2}}{2!}+\frac{x^{3}}{3!}+\cdots$$이것과 비슷하게 정방행렬에 대한 지수행렬 $e^{A}$를 다음과 같이 정의할 수 있다.

정방행렬 $A$에 대하여 $A$의 지수행렬(exponential matrix) $e^{A}$를 다음과 같이 정의한다.$$\begin{align*}e^{A}&=\sum_{k=0}^{\infty}{\frac{A^{k}}{k!}}\\&=I+A+\frac{A^{2}}{2!}+\frac{A^{3}}{3!}+\cdots\end{align*}$$임의의 정방행렬 $A$에 대해 지수행렬 $e^{A}$는 존재하는데 $A$의 모든 성분 $a_{ij}$에 대하여 $|a_{ij}|\leq M$이라고 하자. 그러면 $A^{k}$의 모든 성분은 $n^{k-1}M^{k}$보다 작고$$\sum_{k=0}^{\infty}{\frac{n^{k-1}M^{k}}{k!}}=\frac{1}{n}e^{nM}$$이므로 비교판정법에 의해 $\displaystyle e^{A}=\sum_{k=0}^{\infty}{\frac{A^{k}}{k!}}$의 모든 성분들은 절대수렴한다.

예를들어 대각행렬 $D$가 다음과 같이 정의되었다고 하자.$$D=\begin{pmatrix}\lambda_{1}&&0\\&\ddots&\\0&&\lambda_{n}\end{pmatrix}$$그러면$$D^{k}=\begin{pmatrix}\lambda_{1}^{k}&&0\\&\ddots&\\0&&\lambda_{n}^{k}\end{pmatrix}$$이므로 $D$의 지수행렬 $e^{D}$는 다음과 같다.$$\begin{align*}e^{D}&=I+D+\frac{D^{2}}{2!}+\frac{D^{3}}{3!}+\cdots\\&=\begin{pmatrix}\displaystyle\sum_{k=0}^{\infty}{\frac{\lambda_{1}^{k}}{k!}}&&0\\&\ddots&\\0&&\displaystyle\sum_{k=0}^{\infty}{\frac{\lambda_{n}^{k}}{k!}}\end{pmatrix}\\&=\begin{pmatrix}e^{\lambda_{1}}&&0\\&\ddots&\\0&&e^{\lambda_{n}}\end{pmatrix}\end{align*}$$이 결과로부터 행렬 $A$가 대각화 가능할 경우, $A=QDQ^{-1}$로 나타낼 수 있으므로 다음과 같이 $A$의 지수행렬 $e^{A}$를 구할 수 있다.$$\begin{align*}e^{A}&=e^{QDQ^{-1}}\\&=I+QDQ^{-1}+\frac{(QDQ^{-1})^{2}}{2!}+\frac{(QDQ^{-1})^{3}}{3!}+\cdots\\&=Q\left(I+D+\frac{D^{2}}{2!}+\frac{D^{3}}{3!}+\cdots\right)Q^{-1}\\&=Qe^{D}Q^{-1}\end{align*}$$

다음은 지수행렬의 성질들이다.

(1) $AB=BA$이면 $e^{A+B}=e^{A}e^{B}$이다.

(2) 역행렬이 존재하는 행렬 $Q$에 대하여 $e^{Q^{-1}AQ}=Q^{-1}e^{A}Q$이다.

(3) $\lambda_{1},\,\lambda_{2},\,...,\,\lambda_{n}$이 행렬 $A$의 고유값이고, 대응되는 고유벡터가 $\mathbf{v}_{1},\,\mathbf{v}_{2},\,...,\,\mathbf{v}_{n}$이면, $e^{\lambda_{i}}\,(i=1,\,...,\,m)$들은 $e^{A}$의 고유값이고, 대응되는 고유벡터는 $A$의 것과 동일하다. 게다가 임의의 정방행렬 $A$에 대하여 $\det e^{A}=e^{\lambda_{1}}\cdots e^{\lambda_{n}}=e^{\text{tr}(A)}\neq0$이다.

(4) 행렬 $e^{A}$는 항상 역행렬을 가지고 $(e^{A})^{-1}=e^{-A}$이다.

증명:

(1): 다음의 계산에 의해 성립한다.$$\begin{align*}e^{A}e^{B}&=\left(I+A+\frac{A^{2}}{2!}+\frac{A^{3}}{3!}+\cdots\right)\left(I+B+\frac{B^{2}}{2!}+\frac{B^{3}}{3!}+\cdots\right)\\&=I+(A+B)+\left(\frac{A^{2}}{2!}+\frac{B^{2}}{2!}+AB\right)+\left(\frac{B^{3}}{3!}+\frac{A^{3}}{3!}+\frac{A^{2}B}{2!}+\frac{B^{2}A}{2!}\right)+\cdots\\&=I+(A+B)+\frac{(A+B)^{2}}{2!}+\frac{(A+B)^{3}}{3!}+\cdots\\&=e^{A+B}\end{align*}$$

(2): 다음의 계산에 의해 성립한다.$$\begin{align*}e^{Q^{-1}AQ}&=I+(Q^{-1}AQ)+\frac{(Q^{-1}AQ)^{2}}{2!}+\frac{(Q^{-1}AQ)^{3}}{3!}+\cdots\\&=Q^{-1}\left(I+A+\frac{A^{2}}{2!}+\frac{A^{3}}{3!}+\cdots\right)Q\\&=Q^{-1}e^{A}Q\end{align*}$$

(3): $A\mathbf{v}_{i}=\lambda_{i}\mathbf{v}_{i}$이므로 $A^{k}\mathbf{v}_{i}=\lambda_{i}^{k}\mathbf{v}_{i}$이고$$\begin{align*}e^{A}\mathbf{v}_{i}&=\left(I+A+\frac{A^{2}}{2!}+\frac{A^{3}}{3!}+\cdots\right)\mathbf{v}_{i}\\&=\left(1\cdot\mathbf{v}_{i}+\lambda_{i}\mathbf{v}_{i}+\frac{\lambda_{i}^{2}}{2!}\mathbf{v}_{i}+\frac{\lambda_{i}^{3}}{3!}\mathbf{v}_{i}+\cdots\right)\\&=\sum_{k=0}^{\infty}{\frac{\lambda_{i}^{k}}{k!}}\mathbf{v}_{i}\\&=e^{\lambda_{i}}\mathbf{v}_{i}\end{align*}$$이므로 $e^{A}$의 고유값은 $e^{\lambda_{1}},\,...,\,e^{\lambda_{n}}$이고 $A$와 같은 고유벡터를 가진다.

(4): $A(-A)=-A^{2}=(-A)A$이므로 (1)에 의해 다음 식이 성립한다.$$e^{A}e^{-A}=e^{A+(-A)}=e^{\mathbf{O}}=I+\mathbf{O}+\frac{\mathbf{O}^{2}}{2!}+\frac{\mathbf{O}^{3}}{3!}+\cdots=I$$따라서 $e^{A}$는 역행렬을 갖고, 그 역행렬은 $e^{-A}$이다.

참고자료:

Linear Algebra, jinho Kwak, sungpyo Hong, Birkhauser

저작자표시 비영리 동일조건 (새창열림)

'대수학 > 선형대수학' 카테고리의 다른 글

[선형대수학] 22. 케일리-해밀턴 정리 (0)	2020.03.01
[선형대수학] 21. 지수행렬의 계산 (0)	2020.02.26
[선형대수학] 19. 조르단 표준형 (0)	2020.02.24
[선형대수학] 18. 행렬의 대각화 (0)	2018.12.13
[선형대수학] 17. 고유값과 고유벡터 (0)	2018.12.12

Posted by skywalker222

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

지식저장고(Knowledge Storage)