대수학/선형대수학2017. 4. 21. 11:00
반응형

[선형대수학] 1. 선형연립방정식과 행렬



\(n\)개의 미지수를 포함하는 \(m\)개의 방정식$$\begin{cases}a_{11}x_{1}+a_{12}x_{2}+\cdots+a_{1n}x_{n}=b_{1}&\\ a_{21}x_{1}+a_{22}x_{2}+\cdots+a_{2n}x_{n}=b_{2}&\\ \vdots&\\a_{n1}x_{1}+a_{n2}x_{2}+\cdots+a_{mn}x_{n}=b_{m}&\end{cases}$$에서 \(x_{1},\,x_{2},\,...,\,x_{n}\)은 미지수이고 \(a_{ij},\,b_{i}(1\leq i\leq m,\,1\leq j\leq n)\)은 실수 또는 복소수로 알려진 상수이다.

\(x_{1}=s_{1},\,x_{2}=s_{2},\,...,\,x_{n}=s_{n}\)일 때, \((s_{1},\,s_{2},\,...,\,s_{n})\)을 이 방정식의 해(solution)라고 한다.

\(b_{1}=b_{2}=\cdots=b_{m}=0\)일 때, 이 방정식을 동차(homogenous)라고 하고 이때 이 동차방정식은 적어도 하나의 해 \(x_{1}=x_{2}=\cdots=x_{n}=0\)을 갖고 이 해를 자명해(trivial solution)라고 한다.


위의 방정식이 적어도 하나의 해를 가지면 해가 존재(consistent)한다고 하고 해가 없으면 불능(inconsistent)이라고 한다.


다음의 세 방정식을 고려하자.

\(\begin{cases}x-y=1&\\x-y=0&\end{cases}\) \(\begin{cases}x+y=1&\\x-y=0&\end{cases}\) \(\begin{cases}x-y=-1&\\2x-2y=-2&\end{cases}\) 

위의 첫번째 방정식은 해가 없고 두번째 방정식은 \(\displaystyle x=\frac{1}{2},\,y=\frac{1}{2}\)를 해로 가지며 세번째 방정식은 해가 무수히 많다.


선형연립방정식을 풀 때 보통 변수를 하나씩 소거해가면서 풀었다. 그러나 이 방법은 복잡하고 시간이 걸리기 때문에 행렬(matrix)을 이용하여 해결하는 것이 효과적이다. 행렬은 (일반적인)수를 배열의 형태로 나열하는 것을 말한다. 집합 \(F\)가 \(F=\mathbb{R}\) 또는 \(F=\mathbb{C}\)이고 \(i=1,\,...,\,m,\,j=1,\,...,\,n\)에 대하여 \(a_{ij}\in F\)일 때,$$A=\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&\ddots&\vdots\\a_{m1}&a_{m2}&\cdots&a_{mn}\end{pmatrix}$$를 \(F\) 위의 \(m\times n\)(\(m\) by \(n\))행렬이라고 하고 이때 \(a_{ij}\)를 행렬 \(A\)의 성분(component), 행렬의 가로를 행(row), 세로를 열(column)이라고 한다.


\(m\times n\)행렬 \(A\)에 대하여 \(m=n\)이면 \(A\)를 정방행렬(square matrix)(또는 정사각행렬), 행렬 \(A\)의 모든 성분이 0이면 \(A\)를 영행렬(zero matrix)이라고 한다. 


정방행렬 \(A\)에 대하여 대각선 위 아래 성분이 모두 \(0\)이면, 행렬 \(A\)를 대각행렬(diagonal matrix), 대각선 위 성분이 모두 \(0\)이면, 하 삼각행렬(lower triangular matrix), 대각선 아래 성분이 모두 \(0\)이면, 상 삼각행렬(upper diagonal matrix)이라고 한다. 또한 대각행렬에서 대각선 성분이 모두 같으면 스칼라 행렬(scalar matrix)이라 하고, 대각선 성분들이 모두 \(1\)이면, 단위행렬(또는 항등행렬, identity matrix)이라고 한다. 상 삼각행렬과 하 삼각행렬을 통틀어 삼각행렬(triangular matrix) 이라고 한다.


\(\begin{pmatrix}1&0&0&0\\0&4&0&0\\0&0&3&0\\0&0&0&13\end{pmatrix},\,\begin{pmatrix}3&0&0&0\\1&7&0&0\\4&0&6&0\\1&1&1&1\end{pmatrix},\,\begin{pmatrix}3&3&3&3\\0&2&8&0\\0&0&1&9\\0&0&0&0\end{pmatrix},\,\begin{pmatrix}2&0&0&0\\0&2&0&0\\0&0&2&0\\0&0&0&2\end{pmatrix},\,\begin{pmatrix}1&0&0&0\\0&1&0&0\\0&0&1&0\\0&0&0&1\end{pmatrix}\)

위의 다섯개의 행렬 중에서 첫 번째 행렬은 대각행렬, 두 번째 행렬은 하 삼각행렬, 세 번째 행렬은 상 삼각행렬, 네 번째 행렬은 스칼라행렬, 마지막 행렬은 단위행렬이다.


선형연립방정식$$\begin{cases}a_{11}x_{1}+a_{12}x_{2}+\cdots+a_{1n}x_{n}=b_{1}&\\ a_{21}x_{1}+a_{22}x_{2}+\cdots+a_{2n}x_{n}=b_{2}&\\ \vdots&\\a_{n1}x_{1}+a_{n2}x_{2}+\cdots+a_{mn}x_{n}=b_{m}&\end{cases}$$

에서 얻어지는 행렬$$\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\ \vdots&&&\vdots\\a_{m1}&a_{m2}&\cdots&a_{mn}\end{pmatrix},\,\left(\begin{array}{rrrr|r}a_{11}&a_{12}&\cdots&a_{1n}&b_{1}\\ \vdots&&&\vdots&\vdots\\a_{m1}&a_{m2}&\cdots&a_{mn}&b_{m}\end{array}\right)$$을 각각 계수행렬(coefficient matrix), 첨가행렬(argument matrix)라고 한다. 계수행렬은 방정식 좌변의 계수들의 행렬이고 첨가행렬은 계수행렬에 방정식 우변의 계수들을 추가해한 행렬이다. 이때 \(\mathrm{x}=\begin{pmatrix}x_{1}\\ \vdots\\x_{n}\end{pmatrix},\,\mathrm{b}=\begin{pmatrix}b_{1}\\ \vdots\\b_{m}\end{pmatrix}\)으로 놓고 계수행렬 \(A\)를 이용하여 위의 선형연립방정식을 행렬의 곱인 \(A\mathrm{x}=\mathrm{b}\)형태로 나타낼 수 있다.

위의 첨가행렬에서 수평, 수직 부분$$\begin{pmatrix}a_{i1}&a_{i2}&\cdots&a_{in}&b_{i}\end{pmatrix},\,\begin{pmatrix}a_{1j}\\a_{2j}\\ \vdots\\ a_{mj}\end{pmatrix}$$를 각각 \(i\)번째 행(row)과 \(j\)번째 열(column)이라고 한다.


임의의 행렬의 \(i\)번째 행을 \(R_{i}\)라 할 때 다음과 같이 행연산(row operator)을 정의한다.


(1) \(R_{i}\leftrightarrow R_{j}\) (\(i\)(\(j\))번째 행을 \(j\)(\(i\))번째 행으로 이동)

(2) \(cR_{i}\rightarrow R_{i}\,(c\neq0)\) (\(i\)번째 행에 \(c\)를 곱해서 제자리에 대입)

(3) \(kR_{i}+R_{j}\rightarrow R_{j}\) (\(i\)번째 행에 \(k\)를 곱한것을 \(j\)번째 행과 더한 다음 \(j\)번째 행 자리에 대입)


위의 행연산을 이용하여 첨가행렬을 행사다리꼴(row-echelon form)로 만들 수 있다. 다음은 행사다리꼴 행렬이 갖는 성질이다.

(1) 모든 성분이 \(0\)이 아닌 행이 있으면, 그 행에서 처음으로 오는 \(0\)이 아닌 숫자는 \(1\)이어야 한다. 이 \(1\)을 선두 \(1\)(leading \(1\))이라고 한다.

(2) 모든 성분이 \(0\)인 행들은 행연산 (1)을 이용하여 행렬의 밑부분으로 위치시킨다.

(3) 모든 성분이 \(0\)이 아닌 연속된 행에서 아래 행의 선두\(1\)은 윗 행의 선두\(1\)보다 더 오른쪽에 있어야 한다.


행사다리꼴 행렬을 더 간단히 만들기 위해 행사다리꼴 행렬을 기약 행사다리꼴 행렬(reduced row-echelon form)로 만든다.

(4) 행사다리꼴 행렬에서 선두\(1\)을 포함하는 각 열은 선두\(1\)을 제외한 나머지 성분들이 모두 \(0\)이어야 한다.


첨가행렬에서 계수행렬 부분을 행사다리꼴로 만들어 방정식을 푸는 방법을 전방소거법(forward elimination)이라고 한다.


방정식 \(\begin{cases}2y+4z=2&\\x+2y+2z=3&\\3x+4y+6z=-1&\end{cases}\)을 전방소거법을 이용해서 풀면 다음과 같다.

$$\left(\begin{array}{rrr|r}0&2&4&2\\1&2&2&3\\3&4&6&-1\end{array}\right)\begin{matrix}R_{1}\leftrightarrow R_{2}\\ \longrightarrow\end{matrix}\left(\begin{array}{rrr|r}1&2&2&3\\0&2&4&2\\3&4&6&-1\end{array}\right)\begin{matrix}-3R_{1}+R_{3}\rightarrow R_{2}\\ \longrightarrow\end{matrix}\left(\begin{array}{rrr|r}1&2&2&3\\0&2&4&2\\0&-2&0&-10\end{array}\right)\\ \begin{matrix}\frac{1}{2}R_{2}\rightarrow R_{2}\\ \longrightarrow\end{matrix}\left(\begin{array}{rrr|r}1&2&2&3\\0&1&2&1\\0&-2&0&-10\end{array}\right)\begin{matrix}2R_{2}+R_{3}\rightarrow R_{3}\\ \longrightarrow\end{matrix}\left(\begin{array}{rrr|r}1&2&2&3\\0&1&2&1\\0&0&4&-8\end{array}\right)\begin{matrix}\frac{1}{4}R_{3}\rightarrow R_{3}\\ \longrightarrow\end{matrix}\left(\begin{array}{rrr|r}1&2&2&3\\0&1&2&1\\0&0&1&-2\end{array}\right)$$

그러면 \(z=-2\)이고 \(y=5\), \(x=-3\)이다.


첨가행렬에서 계수행렬 부분을 기약 행사다리꼴로 만들어 방정식을 푸는 방법을 후방대입법(back substitution)이라고 한다.


위의 방정식을 후방대입법을 이용해서 풀자. 첨가행렬의 행사다리꼴을 기약 행사다리꼴로 만들면 된다.

$$\left(\begin{array}{rrr|r}1&2&2&3\\0&1&2&1\\0&0&1&-2\end{array}\right)\begin{matrix}-2R_{3}+R_{2}\rightarrow R_{1}\\-2R_{3}+R_{1}\rightarrow R_{1}\\ \longrightarrow\end{matrix}\left(\begin{array}{rrr|r}1&2&0&7\\0&1&0&5\\0&0&1&-2\end{array}\right)\begin{matrix}-2R_{2}+R_{1}\rightarrow R_{1}\\ \longrightarrow\end{matrix}\left(\begin{array}{rrr|r}1&0&0&-3\\0&1&0&5\\0&0&1&-2\end{array}\right)$$

그러면 \(x=-3\), \(y=5\), \(z=-2\)이다.


이러한 방정식의 풀이법을 가우스-조르단 소거법(Gauss-Jordan elimination)이라고 한다.


행사다리꼴에서 선두\(1\)이 있는 열에 해당하는 변수를 기본변수(basic variable)라 하고 선두\(1\)이 없는 열에 해당하는 변수를 자유변수(free variable)라고 한다.


방정식 \(\begin{cases}x+y+z=3&\\-3x-17y+z+w=1&\\4x-17y+8z-5w=1\end{cases}\)을 후방대입법으로 풀면 다음과 같다.

$$\left(\begin{array}{rrrr|r}1&1&1&0&3\\-3&-17&1&1&1\\4&-17&8&-5&1\end{array}\right)\begin{matrix}3R_{1}+R_{2}\rightarrow R_{2}\\-4R_{1}+R_{3}\rightarrow R_{3}\\ \longrightarrow\end{matrix}\left(\begin{array}{rrrr|r}1&1&1&0&3\\0&-14&4&1&10\\0&-21&4&-5&-11\end{array}\right)\begin{matrix}-\frac{1}{14}R_{2}\rightarrow R_{2}\\-21R_{2}+R_{3}\rightarrow R_{3}\\ \longrightarrow\end{matrix}\\ \left(\begin{array}{rrrr|r}1&1&1&0&3\\0&1&-\frac{4}{14}&-\frac{1}{14}&-\frac{10}{14}\\0&0&-2&-\frac{13}{2}&-26\end{array}\right)\begin{matrix}-\frac{1}{2}R_{3}\rightarrow R_{3}\\ \longrightarrow\end{matrix}\left(\begin{array}{rrrr|r}1&1&1&0&3\\0&1&-\frac{2}{7}&-\frac{1}{14}&-\frac{5}{7}\\0&0&1&\frac{13}{4}&13\end{array}\right)\begin{matrix}-R_{3}+R_{1}\rightarrow R_{1}\\ \frac{2}{7}R_{3}+R_{2}\rightarrow R_{2}\\ \longrightarrow\end{matrix}\\ \left(\begin{array}{rrrr|r}1&1&0&-\frac{13}{4}&-10\\0&1&0&\frac{12}{14}&\frac{21}{7}\\0&0&1&\frac{13}{4}&13\end{array}\right)\begin{matrix}R_{1}-R_{2}\rightarrow R_{2}\\ \longrightarrow\end{matrix}\left(\begin{array}{rrrr|r}1&0&0&-\frac{115}{28}&-13\\0&1&0&\frac{6}{7}&3\\0&0&1&\frac{13}{4}&13\end{array}\right)$$

\(w=s\)라 하면, \(\displaystyle x=-13+\frac{115}{28}s,\,y=3-\frac{6}{7}s,\,z=13-\frac{13}{4}s\)이다. \(x,\,y,\,z\)는 선두\(1\)이 있는 열에 해당하는 변수이므로 기본변수이나 \(w\)는 선두\(1\)이 없는 열에 해당하는 변수이므로 자유변수이다. 이때 \(\begin{pmatrix}-13\\3\\13\\0\end{pmatrix}\)을 특이해(particular solution), \(\begin{pmatrix}\frac{115}{28}\\-\frac{6}{7}\\-\frac{13}{4}\\1\end{pmatrix}\)을 영해(null solution)라고 한다.


참고자료

Linear algebra, Jinho Kwak, sungpyo Hong, Birkhauser

선형대수와 군, 이인석, 서울대학교출판문화원

선형대수학 Express, 김대수, 생능

반응형
Posted by skywalker222