반응형

[금융통계학] 4. 확률분포



이산확률분포


이산형 균일분포(discrete uniform distribution)는 표본공간의 원소의 개수가 \(n\)일 때, 각 사건이 발생할 확률이 \(\displaystyle\frac{1}{n}\)으로 일정한 확률분포이다. 즉 \(X\)가 이산형 균일분포를 따르는 확률변수일 때, 그 확률질량함수와 평균, 분산은 다음과 같다.$$\begin{align*}P(X=x_{i})&=\frac{1}{n}\,(i=1,\,\cdots,\,n)\\E(X)&=\frac{n+1}{2}\\ \text{Var}(X)&=\frac{n^{2}-1}{12}\end{align*}$$

동전의 앞 뒷면과, 주사위의 눈에 대한 확률분포는 이산형 균일분포를 따른다.


베르누이 시행(Bernoulli trial)은 결과가 오직 두 가지 뿐이다. 예를 들어 시행의 결과가 성공 또는 실패이거나 앞면 또는 뒷면인 시행은 베르누이 시행이다. 베르누이 시행에서 확률변수 \(X\)가 \(0\)과 \(1\)만을 값으로 갖고$$P(X=1)=p,\,P(X=0)=1-p$$인 확률변수 \(X\)는 베르누이 분포를 따른다고 한다. 이때$$\begin{align*}E(X)&=p\\ \text{Var}(X)&=p(1-p)\end{align*}$$이다. 

\(X_{1},\,\cdots,\,X_{n}\)을 베르누이 분포(Bernoulli distribution)를 따르는 확률변수라 하고, \(\displaystyle X=\sum_{i=1}^{n}{X_{i}}\)라고 하자. 그러면 \(X_{1},\,\cdots,\,X_{i}\)들은 서로 독립이므로$$\begin{align*}P(X=x)&=\binom{n}{x}p^{x}(1-p)^{n-x}\,(x=0,\,1,\,\cdots,\,n)\\E(X)&=E\left(\sum_{i=1}^{n}{X_{i}}\right)=\sum_{i=1}^{n}{E(X_{i})}=np\\ \text{Var}(X)&=\text{Var}\left(\sum_{i=1}^{n}{X_{i}}\right)=\sum_{i=1}^{n}{\text{Var}(X_{i})}=np(1-p)\end{align*}$$가 성립한다. 이 확률변수 \(X\)를 이항분포(binomial distribution)를 따른다고 하고, \(X\,\sim\,B(n,\,p)\)로 나타낸다.


다음은 짧은 기간동안 주식 가치의 변화를 나타낸 이항나무모형(binomial tree model)이다.

221

\(S_{0}\)는 투자한 원금, 윗방향 화살표는 하루 경과 후의 주가의 상승(\(u\))을 나타내며, 그 확률은 \(p\)이고, 아랫방향 화살표는 하루 경과 후의 주가의 하락(\(d\))을 나타내며, 그 확률은 \(1-p\)이다.

주가가 3일 연속으로 상승할 확률은 \(\displaystyle\binom{3}{3}p^{3}(1-p)^{3}\)이고, 적어도 한번 상승할 확률은 \(\displaystyle1-\binom{3}{0}p^{0}(1-p)^{3}=1-(1-p)^{3}\)이다.


연속확률분포


연속형 균등분포(continuous uniform distribution)는 연속확률변수가 특정한 영역 \([a,\,b]\)에서 같은 확률을 갖는 확률분포이다. 연속형 균등분포를 따르는 확률변수 \(X\)를 \(X\,\sim\,U(a,\,b)\)로 나타내고, 그 확률밀도함수는 다음과 같다.$$f(x)=\begin{cases}\displaystyle\frac{1}{b-a},&\,a\leq x\leq b\\0,&\,\text{otherwise}\end{cases}$$그러면 누적분포함수는$$F(x)=P(X\leq x)=\begin{cases}0,&\,x<a\\ \displaystyle\frac{x-a}{b-a},&\,a\leq x\leq b\\1,&\,x>b\end{cases}$$이고$$\begin{align*}E(X)&=\frac{a+b}{2}\\ \text{Var}(X)&=\frac{(b-a)^{2}}{12}\end{align*}$$이다.


연속확률분포 중에서 가장 많이 사용되는 확률분포는 정규분포(normal distribution)이다. 기댓값이 \(\mu\)이고 분산이 \(\sigma^{2}\)인 정규분포를 따르는 확률변수 \(X\)를 \(X\,\sim\,N(\mu,\,\sigma^{2})\)로 나타내고, 확률밀도함수는 다음과 같다.$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}$$이때$$\begin{align*}F(x)&=P(X\leq x)=\int_{-\infty}^{x}{\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(t-\mu)^{2}}{2\sigma^{2}}}dt}\\E(X)&=\int_{-\infty}^{\infty}{\frac{1}{\sqrt{2\pi}\sigma}xe^{\frac{(x-\mu)^{2}}{2\sigma^{2}}}dx}=\mu\\ \text{Var}(X)&=\int_{-\infty}^{\infty}{\frac{1}{\sqrt{2\pi}\sigma}(x-\mu)^{2}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}dx}=\sigma^{2}\end{align*}$$이다.


정규분포 곡선은 기댓값 \(\mu\)와 표준편차 \(\sigma\)의 값에 따라 모양이 변한다.

\(X\,\sim\,N(\mu,\,\sigma^{2})\)인 확률변수 \(X\)에 대해 \(\displaystyle Z=\frac{X-\mu}{\sigma}\)라고 하자. 그러면 \(Z\,\sim\,N(0,\,1^{2})\)이고, \(Z\)는 표준정규분포(standard normal distribution)를 따른다고 한다. 이 과정을 표준화라고 하고, 정규분포를 따르는 확률변수의 확률을 구할 때 이 과정$$P(a\leq X\leq b)=P\left(\frac{a-\mu}{\sigma}\leq Z\leq\frac{b-\mu}{\sigma}\right)$$을 거쳐서 구한다. \(Z\)의 확률밀도함수는$$f(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}$$이고,

다음 등식들이 성립한다.(위 그림 참고)$$\begin{align*}P(\mu-\sigma\leq X\leq\mu+\sigma)&=P(-1\leq Z\leq1)=\int_{-1}^{1}{\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}dz}=0.68\\P(\mu-2\sigma\leq X\leq\mu+2\sigma)&=P(-2\leq Z\leq2)=\int_{-2}^{2}{\frac{1}{2\pi}e^{-\frac{z^{2}}{2}}dz}=0.95\\P(\mu-3\sigma\leq X\leq\mu+3\sigma)&=P(-3\leq Z\leq3)=\int_{-3}^{3}{\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}dz}=0.997\end{align*}$$표준정규분포를 따르는 확률변수 \(Z\)의 확률밀도함수는 우함수이므로 이 성질과 표준정규분포표를 이용하여 정규분포를 따르는 확률변수에 대한 확률을 구할 수 있다.


기댓값과 분산을 이용하여 투자위험을 측정할 때, 투자수익을 다음 그림과 같이 정규분포를 따르는 확률변수라고 볼 수 있다.

여기서 \(E(R_{p})\)는 투자에 대한 기대수익률이고, 분산과 표준편차는 변동성(volatility)과 관련이 있다. 이 포트폴리오에서 이윤의 마지노선(하한)을 \(R_{L}\)이라고 하면, 투자이윤이 \(R_{L}\)이하로 떨어질 확률은 위 그림의 음영으로 표시된 부분(Shortfall risk)이다.

여기서 적절한 포트폴리오를 선택할 수 있는 기준으로 로이의 안전우선기준(Roy's safety first criterion)이 있다. 로이의 안전우선기준에서 적정투자(적정 포트폴리오)는 이윤이 특정 부족(shortfall)수준인 \(R_{L}\)이하로 떨어질 확률이 가장 작은 투자(포트폴리오)이다. 투자(포트폴리오)에 대한 이윤이 정규분포를 따르면, 로이의 안전우선기준은$$\text{SFRatio}=\frac{E(R_{p})-R_{L}}{\sigma_{p}}$$로 정의된다. 이 값이 커질수 위 그림의 음영부분이 작아지게 된다.


어떤 투자자가 포트폴리오의 기대수익률이 적어도 11%까지 원한다고 할 때, 다음 세 개의 포트폴리오의 기대수익률과 변동성(표준편차)을

 

 포트폴리오

기대수익률 \(E(R_{p})\) 

23% 

27% 

29% 

표준편차 \(\sigma_{p}\) 

30% 

41% 

65% 

로이의 안전우선기준식에 대입하면$$\begin{align*}SFR_{A}&=\frac{0.23-0.11}{0.3}=0.4\\SFR_{B}&=\frac{0.27-0.11}{0.41}=0.39\\SFR_{C}&=\frac{0.29-0.11}{0.65}=0.28\end{align*}$$이므로 포트폴리오 A를 선택하는 것이 최적의 선택이다.


확률변수 \(Y\)가 \(Y\,\sim\,N(\mu,\,\sigma^{2})\)라고 하자. 그러면 \(e^{Y}\)는 로그정규분포(lognormal distribution)를 따른다고 한다. 지수함수는 항상 0보다 크므로, 로그정규분포를 따르는 확률변수는 항상 양수이고 따라서 자산가격을 모형화하는데 유용하다.

\(X=e^{Y}\)가 로그정규분포를 따르면, \(X\,\sim\,\ln N(\mu,\,\sigma^{2})\)로 나타내고, 확률밀도함수는 다음과 같다.$$f(x)=\frac{1}{x\sqrt{2\pi}\sigma}e^{-\frac{1}{2\sigma^{2}}(\ln x-\mu)^{2}}\,(x>0)$$로그정규분포의 확률밀도함수는 정규분포의 경우처럼 기댓값 \(\mu\)와 표준편차 \(\sigma\)의 값에 따라 변한다.

\(X\,\sim\,\ln N(\mu,\,\sigma^{2})\)일 때,$$\begin{align*}E(X)&=e^{\left(\mu+\frac{1}{2}\sigma^{2}\right)}\\ \text{Var}(X)&=e^{2\mu+\sigma^{2}}(e^{\sigma^{2}}-1)\end{align*}$$이다.


\(t\)시점에서의 주가의 전기(\(t-1\)시점) 대비가 기댓값이 \(0\)이고, 표준편차가 \(0.02\)인 로그정규분포를 따른다고 하자. 즉, \(t\)시점에서의 주가를 \(P_{t}\), \(\displaystyle X=\frac{P_{t}}{P_{t-1}}\)라고 할 때 \(X\,\sim\,\ln N(0,\,0.02^{2})\)이므로 \(\ln X\,\sim\,N(0,\,0.02^{2})\)(\(\ln X\)는 로그수익률)이고, 이 로그수익률이 2%보다 클 확률은$$P(\ln X>0.02)=P(Z>1)=0.1587$$이다.

     

참고자료:

기초 금융통계, 박유성, 김기환, 자유아카데미

금융인을 위한 통계분석, 이긍희, 한국금융연수원

재무위험관리사(1: 금융통계학), 금융투자교육원, 한국금융투자협회

https://www.oreilly.com/library/view/the-theory-and/9781118067567/h2_fabo_9781118067567_oeb_c06_r1.html

https://en.wikipedia.org/wiki/Normal_distribution

https://financetrain.com/short-fall-risk-safety-first-ratio-and-optimal-portfolio-selection/

반응형
Posted by skywalker222