[금융통계학] 3. 기댓값과 분산, 공분산, 포트폴리오
확률변수 \(X\)의 기댓값(expectation value)(또는 평균(mean))은
\(X\)가 이산확률변수일 때,$$\mu=E(X)=\sum_{i=1}^{n}{x_{i}P(X=x_{i})},\,E(g(X))=\sum_{i=1}^{n}{g(x_{i})P(X=x_{i})}$$\(X\)가 연속확률변수일 때,$$\mu=E(X)=\int_{-\infty}^{\infty}{f(x)dx},\,E(g(X))=\int_{-\infty}^{\infty}{g(x)f(x)dx}$$로 정의된다. 기댓값은 실수이다.
확률변수 \(X,\,Y\)와 상수 \(a,\,b\)에 대해 다음 성질들이 성립한다.
(1) \(E(a)=a\)
(2) \(E(aX+b)=aE(X)+b\)
(3) \(E(aX+bY)=aE(X)+bE(Y)\)
갑, 을 두 회사의 주가는 각각 5000원, 2000원이고, 이 두 회사가 합병 시도를 하고 있다는 발표를 했다. 두 회사가 합병하게 되면, 시너지 효과에 의한 경쟁력 향상이 예상되어 현재 갑 회사의 주가는 5500원, 을 회사의 주가는 4000원이 될 것으로 예상되었다. 합병 논의 중인 현재의 갑 회사의 주가는 5400원, 을 회사의 주가는 3000원이다.(아래 표 참고)
|
합병 전 |
현재 |
합병 후 |
갑 회사 |
5000 |
5400 |
5500 |
을 회사 |
2000 |
3000 |
4000 |
이 두 회사의 주식은 합병이 성사될 확률이 \(0.8\) 또는 \(0.5\)라는 가정 하에서 거래되고 있다.
합병확률이 \(0.5\)이면,
갑 회사의 주식구입시 손익: \(0.5(5500-5400)+0.5(5000-5400)=-150<0\)
을 회사의 주식구입시 손익: \(0.5(4000-3000)+0.5(2000-3000)=0\)
합병확률이 \(0.8\)이면,
갑 회사의 주식구입시 손익: \(0.8(5500-5400)+0.2(5000-5400)=0\)
을 회사의 주식구입시 손익: \(0.8(4000-3000)+0.2(2000-3000)=600>0\)
위 결과를 다음과 같이 정리할 수 있다.
|
\(0.5\) |
\(0.8\) |
갑 회사 |
고평가 |
적정가 |
을 회사 |
적정가 |
저평가 |
위 표에서 적장가는 손익이 \(0\)이 되는 경우(손해나 이익이 모두 없으므로 주식가격이 적절함을 나타낸다)이고, 고평가는 주식의 가격이 높게 형성되는 경우이고, 저평가는 주식의 가격이 낮게 형성되는 경우이다.
적정가인 경우가 아닌 경우(고평가, 저평가)는 차익거래(또는 재정상태, arbitrage trading)가 존재한다. 차익거래로 발생되는 이익은 소액이지만 확실하게 얻을 수 있고, 고평가, 저평가 된 가격은 적정가로 이동하면서 차익거래(재정상태)는 존재하지 않는다.
기댓값이 \(\mu\)인 확률변수 \(X\)의 분산(variance)을$$\text{Var}(X)=E((X-E(X))^{2})=E((X-\mu)^{2})$$로 정의하고 \(\sigma^{2}\)로 나타낸다. 또한 \(X\)의 표준편차(standard deviation)를 분산의 양의 제곱근$$\sigma(X)=\sqrt{\text{Var}(X)}$$로 정의하고, \(\sigma\)로 나타낸다. 이때 등식 \(\text{Var}(X)=E((X-E(X))^{2})=E(X^{2})-\{E(X)\}^{2}\)가 성립한다.
두 확률변수 \(X,\,Y\)의 공분산을$$\text{Cov}(X,\,Y)=E((X-E(X))(Y-E(Y)))$$로 정의한다. 이때 다음의 두개의 등식$$\begin{align*}\text{Cov}(X,\,Y)&=E((X-E(X))(Y-E(Y)))=E(XY)-E(X)E(Y)\\ \text{Cov}(X,\,X)&=E((X-E(X))(X-E(X)))=E((X-E(X))^{2})=\text{Var}(X)\end{align*}$$가 성립한다.
확률변수 \(X,\,Y\)와 상수 \(a,\,b\)에 대해 다음 성질들이 성립한다.
(1) \(\text{Var}(a)=0\)
(2) \(\text{Var}(aX+b)=a^{2}\text{Var}(X)\)
(3) \(\text{Var}(aX+bY)=a^{2}\text{Var}(X)+2ab\text{Cov}(X,\,Y)+b^{2}\text{Var}(Y)\)
위의 (3)을 다음과 같이 확장할 수 있다.$$\text{Var}(aX+bY+cZ)=a^{2}\text{Var}(X)+b^{2}\text{Var}(Y)+c^{2}\text{Var}(Z)+2ab\text{Cov}(X,\,Y)+2bc\text{Cov}(Y,\,Z)+2ac\text{Cov}(X,\,Z)$$
\(O,\,P,\,Q\) 3개의 회사 주식으로 구성된 포트폴리오가 다음과 같고, 이 3개 회사의 수익률에 대한 분산과 공분산이 다음과 같다.
회사 |
주식 비중 |
기대수익률 |
O |
50% |
8% |
P |
10% |
12% |
Q |
40% |
16% |
\(\text{Var}(O)=0.20,\,\text{Var}(P)=0.30,\,\text{Var}(Q)=0.25\), \(\text{Cov}(O,\,P)=0.15,\,\text{Cov}(P,\,Q)=0.12,\,\text{Cov}(O,\,Q)=0.10\)
어떤 포트폴리오의 구성이 \(\displaystyle\sum_{i=1}^{n}{w_{i}X_{i}}\)(\(w_{i}\)는 자산 \(X_{i}\)에 대한 비중이고, \(\displaystyle\sum_{i=1}^{n}{w_{i}}=1\)이다.) \(R_{i}\)를 자산 \(X_{i}\)의 수익률이라 하면, 포트폴리오의 수익률 \(R_{p}\)는 \(\displaystyle R_{p}=\sum_{i=1}^{n}{w_{i}R_{i}}\)이고, 이 포트폴리오의 기대수익률은$$E(R_{p})=\sum_{i=1}^{n}{w_{i}E(R_{i})}$$이고, 수익률의 분산은$$\begin{align*}Var(R_{p})&=\text{Var}(w_{1}R_{1}+\cdots+w_{n}R_{n})\\&=w_{1}^{2}\text{Var}(R_{1})+\cdots+w_{n}^{2}\text{Var}(R_{n})+2w_{1}w_{2}\text{Cov}(R_{1},\,R_{2})+\cdots+2w_{n-1}w_{n}\text{Cov}(R_{n-1},\,R_{n})\end{align*}$$이다.
그러면 위의 예의 포트폴리오의 기대수익률은$$\begin{align*}E(R_{p})&=w_{o}E(R_{o})+w_{p}E(R_{p})+w_{q}E(R_{q})\\&=0.5\cdot0.8+0.1\cdot0.12+0.4\cdot0.6\\&=0.116\end{align*}$$이므로, 11.6%의 수익률을 기대할 수 있고, 수익률의 분산은$$\begin{align*}\text{Var}(R_{p})&=0.5^{2}\cdot0.2+0.1^{2}\cdot0.3+0.4^{2}\cdot0.25+2\cdot0.5\cdot0.1\cdot0.15+2\cdot0.5\cdot0.4\cdot0.1+2\cdot0.1\cdot0.4\cdot0.12\\&=0.158\end{align*}$$이다.
공분산은 두 변수간의 관계를 나타내지만, 변수가 갖는 측정단위의 영향을 받는다. 이것은 자료의 크기가 작으면 높은 연관성이 있다고 해도 공분산의 값이 작게 나오고, 자료의 크기가 크면 낮은 연관성이 있다고 해도 공분산의 값이 크게 나오는 현상이 발생함을 뜻한다. 이러한 문제를 해결하기 위해 공분산을 두 변수 각각의 개별적인 표준편차로 나눈 상관계수(correlation coefficient)$$\rho=\frac{\text{Cov}(X,\,Y)}{\sqrt{\text{Var}(X)}\sqrt{\text{Var}(Y)}}$$를 이용한다. \(-1\leq\rho\leq1\)이고, 상관계수의 절댓값이 클 수록 두 변수간의 선형관계가 선형이다. \(\rho>0\)이면, 두 변수는 양의 선형관계에 있고, \(\rho<0\)이면, 음의 선형관계에 있으며, \(\rho=0\)인 경우는 두 변수간 상관관계가 없다.
가장 좋은 포트폴리오는 기대수익률이 높고, 분산(위험성)이 적을수록 좋다. 그러므로 동일한 분산을 갖는 포트폴리오 중에서 기대수익률이 가장 높은것을, 동일한 기대수익률을 갖는 포트폴리오 중에서 분산이 가장 작은 것을 선택하는 것이 합리적이다. 이것을 지배원리(dominance principle)라고 한다.
갑 회사와 을 회사의 주식투자비율이 각각 \(w_{a},\,w_{b}\)일 때, 기대수익률과 수익률의 분산은$$\begin{align*}E(R_{p})&=w_{a}E(R_{a})+w_{b}E(R_{b})\\ \text{Var}(R_{p})&=\sigma_{p}^{2}=w_{a}^{2}\sigma_{a}^{2}+w_{b}^{2}\sigma_{b}^{2}+2w_{a}w_{b}\sigma_{ab}\end{align*}$$(\(\sigma_{a},\,\sigma_{b}\)는 각각 갑 회사와 을 회사의 수익률의 표준편차, \(\sigma_{ab}\)는 공분산)이다. 이때$$\sigma_{p}^{2}=w_{a}^{2}\sigma_{a}^{2}+(1-w_{a})^{2}\sigma_{b}^{2}+2w_{a}(1-w_{a})\sigma_{ab}$$이므로 분산(위험)이 최소화된 포트폴리오를 만들기 위해서 투자비율을 조정한다면$$\frac{d}{dw_{a}}\sigma_{p}^{2}=2w_{a}\sigma_{a}^{2}-2(1-w_{a})\sigma_{b}^{2}+2\sigma_{ab}-4w_{a}\sigma_{ab}=0$$이어야 하므로$$w_{a}=\frac{\sigma_{b}^{2}-\sigma_{ab}}{\sigma_{a}^{2}+\sigma_{b}^{2}-2\sigma_{ab}},\,w_{b}=1-w_{a}$$일 때, 포트폴리오의 분산이 최소가 된다.
확률변수 \(X,\,Y\)의 결합확률분포(joint probability distribution)가 다음과 같다고 하자.
\(y\)\\(x\) |
\(2\) |
\(4\) |
\(6\) |
\(8\) |
계 |
\(1\) |
\(0\) |
\(\displaystyle\frac{2}{12}\) |
\(\displaystyle\frac{1}{12}\) |
\(0\) |
\(\displaystyle\frac{3}{12}\) |
\(2\) |
\(\displaystyle\frac{3}{12}\) |
\(\displaystyle\frac{3}{12}\) |
\(\displaystyle\frac{2}{12}\) |
\(\displaystyle\frac{1}{12}\) |
\(\displaystyle\frac{9}{12}\) |
계 |
\(\displaystyle\frac{3}{12}\) |
\(\displaystyle\frac{5}{12}\) |
\(\displaystyle\frac{3}{12}\) |
\(\displaystyle\frac{1}{12}\) |
\(1\) |
이 결합확률분포에서$$P(X=4,\,Y=2)=\frac{3}{12},\,P(X=2)=P(X=2,\,Y=1)+P(X=2,\,Y=2)=\frac{3}{12}$$이고,$$P(X=2)=\frac{3}{12},\,P(X=4)=\frac{5}{12},\,P(X=6)=\frac{3}{12},\,P(X=8)=\frac{1}{12}$$이므로 다음의 확률분포
\(x\) |
\(2\) |
\(4\) |
\(6\) |
\(8\) | 계 |
\(P(X=x)\) |
\(\displaystyle\frac{3}{12}\) |
\(\displaystyle\frac{5}{12}\) |
\(\displaystyle\frac{3}{12}\) |
\(\displaystyle\frac{1}{12}\) | \(1\) |
를 \(X\)의 주변확률분포(marginal probability distribution)이라고 한다. 이와 같은 방법으로 \(Y\)의 주변확률분포를 다음과 같이 구할 수 있다. 여기서 \(P(X=x,\,Y=y)\)를 결합확률질량함수(joint probability mass function), \(P(X=x),\,P(Y=y)\)를 \(X\)와 \(Y\)의 주변확률질량함수(marginal probability mass function)라고 한다.
\(y\) |
\(1\) |
\(2\) |
계 |
\(P(Y=y)\) |
\(\displaystyle\frac{3}{12}\) |
\(\displaystyle\frac{9}{12}\) |
\(1\) |
위에서 구한 주변확률분포를 이용하여 \(X\)와 \(Y\)의 기댓값을 다음과 같이 구할 수 있고,$$\begin{align*}E(X)&=2\cdot\frac{3}{12}+4\cdot\frac{5}{12}+6\cdot\frac{3}{12}+8\cdot\frac{1}{12}=\frac{52}{12}\\E(Y)&=1\cdot\frac{3}{12}+2\cdot\frac{9}{12}=\frac{21}{12}\end{align*}$$분산 또한 다음과 같이 구할 수 있다.$$\begin{align*}\text{Var}(X)&=2^{2}\cdot\frac{3}{12}+4^{2}\cdot\frac{5}{12}+6^{2}\cdot\frac{3}{12}+8^{2}\cdot\frac{1}{12}-\left(\frac{52}{12}\right)^{2}=\frac{2}{9}\\ \text{Var}(Y)&=1^{2}\cdot\frac{3}{12}+2^{2}\cdot\frac{9}{12}-\left(\frac{21}{12}\right)^{2}=\frac{63}{144}\end{align*}$$
공분산은 다음과 같다.$$\text{Cov}(X,\,Y)=E(XY)-E(X)E(Y)=-\frac{12}{144}$$
연속확률변수 \(X,\,Y\)의 결합확률밀도함수(joint probability density function)가 \(f(x,\,y)\)일 때,$$\iint_{\mathbb{R}^{2}}{f(x,\,y)dxdy}=1$$이고, \(X\)와 \(Y\)의 주변확률밀도함수(marginal probability density function)를$$\begin{align*}f_{X}(x)=g(x)=\int_{-\infty}^{\infty}{f(x,\,y)dy},\,f_{Y}(y)=h(y)=\int_{-\infty}^{\infty}{f(x,\,y)dx}\end{align*}$$조건부확률밀도함수(conditional probability density function)를$$f(y|x)=\frac{f(x,\,y)}{g(x)},\,f(x|y)=\frac{f(x,\,y)}{h(y)}$$조건부 기댓값(conditional expectation)을$$E(Y|X)=\int_{-\infty}^{\infty}{yf(y|x)dy},\,E(X|Y)=\int_{-\infty}^{\infty}{xf(x|y)dx}$$로 정의한다.(이산확률변수의 경우, 적분을 합으로 바꾸고, 밀도->질량 이다.)
확률변수 \(X,\,Y\)가 독립이면, \(E(XY)=E(X)E(Y)\)가 되고, 결합확률밀도(질량)함수는 각 변수들의 주변확률밀도(질량)함수들의 곱이 된다.
또한 \(X,\,Y\)가 독립이면 \(E(XY)=E(X)E(Y)\)이므로 \(\text{Cov}(X,\,Y)=E(XY)-E(X)E(Y)=0\)이 되지만, 그 역은 성립하지 않는다.
참고자료:
기초 금융통계, 박유성, 김기환, 자유아카데미
금융인을 위한 통계분석, 이긍희, 한국금융연수원
재무위험관리사(1: 금융통계학), 금융투자교육원, 한국금융투자협회
'확률및통계 > 금융통계학' 카테고리의 다른 글
[금융통계학] 6. 가설검정 (0) | 2019.02.14 |
---|---|
[금융통계학] 5. 표본통계량의 분포 (0) | 2019.02.13 |
[금융통계학] 4. 확률분포 (0) | 2019.02.12 |
[금융통계학] 2. 확률과 확률변수 (0) | 2019.02.10 |
[금융통계학] 1. 기초 이론 (0) | 2019.01.16 |