[금융통계학] 1. 기초 이론
금융시장은 기업, 개인, 정부, 금융기관 등의 경제주체들이 금융상품을 거래하는 장소를 금융시장이라고 한다. 경제주체들이 금융시장에서 이익을 얻기 위해서는 많은 정보를 통해 정확한 의사결정을 해야 한다. 여기에 통계학을 이용하여 자료들을 정보화해 여기서 얻은 정보들로 의사결정을 한다.
일반적으로 동일한 현금에 대해 미래의 현금흐름보다 현재의 현금흐름을 선호한다. 즉 오늘의 1000원과 내일의 1000원은 가치가 다르고, 오늘의 1000원의 가치가 내일의 1000원의 가치보다 높다. 또한 미래의 현금흐름은 물가상승으로 인해 가치가 하락할 수 있고, 불확실성으로 인해 위험(손해를 볼 위험)이 존재한다.
위 사실로부터 사람들은 현재의 현금흐름을 포기하는 대가로 미래에 이자(interest)를 포함한 금액을 요구한다.
원금 \(P_{0}\)를 연이율 \(r\text{%}\)로 은행에 예금할 경우, \(t\)년후 그 가치는$$P_{t}=P_{0}(1+r)^{t}$$이다. 만약 위의 원금 \(P_{0}\)를 연이율 \(r\text{%}\)로 \(m\)회 복리계산을 하면, \(t\)년 후 그 가치는$$P_{t}=P_{0}\left(1+\frac{r}{m}\right)^{mt}(=P_{0}(1+r_{e})^{t})$$이고, 여기서$$r_{e}=\left(1+\frac{r}{m}\right)^{m}-1$$은 실효이자율이다. 이때 \(m\,\rightarrow\,\infty\)(연속복리)이면, 무리수 \(e\)의 정의인$$e=\lim_{m\,\rightarrow\,\infty}{\left(1+\frac{1}{m}\right)^{m}}$$로부터$$P_{t}=P_{0}e^{rt}$$이고, 이때의 실효이자율은$$r_{e}=e^{r}-1$$이며$$\frac{d}{dt}P_{t}=rP_{t}$$의 관계가 성립한다.
화폐의 현재가치(present value)는 미래의 현금흐름을 현재의 시점에서 평가한 금액으로 현가라고 한다. 화폐의 현재가치를 구하기 위해 그 화폐의 미래가치를 미래가치의 이자요소(\((1+r)^{t}\))로 나눈다. 이 과정을 할인(discounting)이라 하고, 이 때 사용하는 이자율을 할인율(discount rate)라고 한다. 화폐의 현재가치를 구하는 식은$$PV=P_{0}=\frac{P_{t}}{(1+r)^{t}}=P_{t}(1+r)^{-t}$$이고, 연속복리의 경우는$$PV=P_{0}=P_{t}e^{-rt}$$이다.
원금 \(P_{0}\)를 증권에 투자했다고 하고 \(t\)년 후의 증권가격을 \(P_{t}\)라 하자(투자금은 동일하다). 그러면 1년이 경과한 \(t\)시점에서의 증권의 산술수익률은$$r_{t}=\frac{P_{t}-P_{t-1}}{P_{t-1}}$$(\(P_{t-1}\)은 \(P_{t}\)의 1년 전 증권가격)이고, \(t\)시점에서의 배당금 \(D_{t}\)를 고려하면$$r_{t}=\frac{P_{t}+D_{t}-P_{t-1}}{P_{t-1}}$$이다.
이 증권에 대한 로그수익률은$$R_{t}=\ln\left(\frac{P_{t}+D_{t}}{P_{t-1}}\right)$$이고, 배당금을 고려하지 않으면$$R_{t}=\ln\left(\frac{P_{t}}{P_{t-1}}\right)$$이다. 이때 \(P_{t}=P_{t-1}e^{R_{t}}\)이다.
산술수익률이 갖는 값의 범위는 \([-1,\,\infty)\)이나 로그수익률이 갖는 값의 범위는 실수 전체이므로 로그수익률을 많이 사용한다.
통계의 시작은 조사하려는 집단 전체가 아닌 그 집단의 일부분만을 조사해서 전체의 특성을 파악하는 것이다. 여기서 조사하려는 집단 전체를 모집단(population), 조사하려는 집단의 일부분을 표본(sample)이라고 한다. 정확하게 조사를 하기 위해서는 모집단을 잘 섞은 다음 표본을 모집단에서 임의로 추출해야 한다(표본은 임의로 추출되므로 서로 독립적이다).
모집단에 대한 특성값(characteristic)들을 모수(parameter)라고 한다. 모수는 알려져 있지 않은 미지의 값이고, 모집단의 특성을 나타낸다. 예를 들어서 평균 \(\mu\)와 분산 \(\sigma^{2}\), 상관계수 \(\rho\)는 모수이다.
통계량으로부터 계산된 수량(quantity)을 통계량(statistic)이라고 한다. \(n\)개의 표본 \(X_{1},\,\cdots,\,X_{n}\)에 대해 표본평균(sample mean) \(\displaystyle\overline{X}=\frac{1}{n}\sum_{i=1}^{n}{X_{i}}\)은 통계량이다(\(X_{i}\)는 단순히 \(i\)번째 뽑힌 표본일 뿐이지 구체적인 값이 아니다). 표본분산 \(\displaystyle s^{2}=\frac{1}{n-1}\sum_{i=1}^{n}{(X_{i}-\overline{X})^{2}}\) 또한 통계량이다. 통계량이 모집단의 모수를 추정하는 데 사용되면, 추정량(estimator)이라 하고, 반대로 추정량이 표본으로부터 조사된 구체적인 값으로 계산되었다면, 추정치(estimate)라고 한다. 동일한 모집단에서 두 개 이상의 표본을 뽑으면 일반적으로 모수와 추정치 간의 차이가 존재하고, 이 차이를 표집오차(sampling error)라고 한다.
모집단으로부터 표본을 구한 다음 그 표본에 대해 모집단의 특성이 어떠한 가를 조사해야 한다. 이 표본으로부터 얻은 모집단의 특성을 모집단 전체의 특성으로 확장할 수 있는가를 가설검정(hypothesis testing)으로 확인하고, 이 과정을 통해 얻은 정보를 이용하여 의사결정(예측, prediction)을 하게 된다.
모집단의 모수에 대한 추정과 가설검정, 예측은 사건이 일어날 가능성을 수치화한 확률(probability)과 모집단의 특성을 나타내는 표본에 의존한다. 그렇기 때문에 잘못 구한 확률과 모집단, 고르게 추출되지 않은 표본은 잘못된 정보를 얻게 한다(Garbage in, garbage out: GIGO).
표본평균은 표본자료를 이용하여 구할 수 있고, 모평균 \(\mu\)를 추정하는데 가장 많이 이용된다. 가중평균(weighted mean)은 가중치의 합을 \(1\)로 놓고 표본에 가중치를 곱해서 구한다. 가중평균은 주식(또는 금융상품)의 포트폴리오나 학교 내신등급 산출에 사용된다. 표본분산은 표본이 평균으로부터 얼마나 멀리 흩어져 있는가를 나타내는 것으로 값이 작으면 표본들이 고르게 흩어져 있고, 값이 크면 한 쪽으로 치우친 정도가 큼을 나타낸다.
표본이 \(\{x_{1},\,\cdots,\,x_{n}\}\), 가중치가 \(\{w_{1},\,\cdots,\,w_{n}\}\)일 때, 표본평균 \(\overline{x}\), 가중평균 \(\overline{x}_{w}\), 표본분산 \(s^{2}\)는 다음과 같다.$$\begin{align*}\overline{X}&=\frac{1}{n}\sum_{i=1}^{n}{x_{i}}\\ \overline{x}_{w}&=\frac{\displaystyle\sum_{i=1}^{n}{w_{i}x_{i}}}{\displaystyle\sum_{i=1}^{n}{w_{i}}}\\s^{2}&=\frac{1}{n-1}\sum_{i=1}^{n}{(x_{i}-\overline{x})^{2}}\end{align*}$$표본분산에서 \(n-1\)로 나누는 이유는 편차 \(x_{i}-\overline{x}\)의 합이 \(0\)이기 때문이다.
기하평균은 금융과 관련된 자료를 분석할 때, 유용하게 사용되는 평균이다. 즉 표본이 \(\{x_{1},\,\cdots,\,x_{n}\}\)일 때의 기하평균은$$G=\left(\prod_{i=1}^{n}{x_{i}}\right)^{\frac{1}{n}}=\sqrt[n]{x_{1}\cdots x_{n}}$$이다.
\(P_{t}\)를 \(t\)시점에서의 자산(주가 또는 채권 또는 옵션)의 가격이라고 하자. 그러면 이 자산의 산술수익률은$$R_{t}=\frac{P_{t}-P_{t-1}}{P_{t-1}}=\frac{P_{t}}{P_{t-1}}-1$$이므로 수익률 \(R_{1},\,R_{2},\,\cdots,\,R_{T}\)의 평균 \(R\)을 식$$\begin{align*}(1+R)^{T}&=\frac{P_{T}}{P_{1}}=\frac{P_{T}}{P_{T-1}}\cdot\frac{P_{T-1}}{P_{T-2}}\cdots\frac{P_{2}}{P_{1}}\\&=(1+R_{T})(1+R_{T-1})\cdots(1+R_{2})(1+R_{1})\\&=\prod_{t=1}^{T}{(1+R_{t})}\end{align*}$$을 이용하여 다음과 같이 구할 수 있다.$$R=\left\{\prod_{t=1}^{T}{(1+R_{t})}\right\}^{\frac{1}{T}}-1$$
투자에서 위험을 최소화하고 투자수익을 최대화하기 위해 여러 종목에 분산투자 하는 것을 포트폴리오(portfolio)라고 한다.
한 투자자가 주당 2,000원 인 (가) 회사의 주식 100단위와, 주당 1,000원 인 (나) 회사의 주식 200단위로 구성된 포트폴리오 상품이 있다. 구입 시점에서 1년 후 (가) 회사의 주식은 주당 2,200원 이고, (나) 회사의 주식은 주당 800원 이다. 또한 1년 동안 (가) 회사의 주식은 주당 10원이 배당되었고, (나) 회사 주식은 주당 15원이 배당되었다. 1년동안 이 포트폴리오 상품의 산술수익률은$$R=\frac{2,200\cdot100+10\cdot100+800\cdot200+15\cdot200}{2,000\cdot100+1,000\cdot200}-1=-0.04$$이므로 보유기간 동안 \(4\text{%}\)의 손실을 본 것을 확인할 수 있다.
참고자료:
기초 금융 통계, 박유성, 김기환, 자유아카데미
금융인을 위한 통계분석, 이긍희, 한국금융연수원
금융공학, 전인태, 북스힐
https://ko.wikipedia.org/wiki/Garbage_in,_garbage_out
'확률및통계 > 금융통계학' 카테고리의 다른 글
[금융통계학] 6. 가설검정 (0) | 2019.02.14 |
---|---|
[금융통계학] 5. 표본통계량의 분포 (0) | 2019.02.13 |
[금융통계학] 4. 확률분포 (0) | 2019.02.12 |
[금융통계학] 3. 기댓값과 분산, 공분산, 포트폴리오 (0) | 2019.02.11 |
[금융통계학] 2. 확률과 확률변수 (0) | 2019.02.10 |