반응형

[금융수학] 8. 기초 확률론



러시아의 수학자 콜모고로프(Kolmogorov)는 르베그 적분이 확률론의 언어와 방법론이 될 수 있음을 주장했다. 다음은 르베그 적분론과 확률론에서 사용되는 용어와 표기법을 비교한 것이다. 여기서는 확률론의 표기를 사용할 것이다. 

르베그 적분 

확률론 

측도공간 \((X,\,\mathcal{A},\,\mu)\) 

표본공간 \((\Omega,\,\mathcal{F},\,P)\) 

 \(x\in X\)

\(\omega\in\Omega\) 

\(\sigma-\)대수 \(\mathcal{A}\) 

\(\sigma-\)체(field) \(\mathcal{F}\) 

가측집합 \(A\) 여집합 \(A^{c}\)

사건 \(E\) 여사건 \(E^{c}\)

 측도수렴

확률수렴 

측도 \(\mu\) 

확률측도 \(P\) 

\(A\)의 크기 \(\mu(A)\) 

\(E\)의 확률 \(P(E)\) 

가측함수 \(f\) 

확률변수 \(X(\omega)\) 

특성함수 \(\chi_{E}\) 

지시함수 \(\mathbf{1}_{E}\) 

 적분 \(\displaystyle\int_{X}{fd\mu}\)

기댓값 \(\displaystyle E(X)=\int_{\Omega}{XdP}\) 

 거의 모든곳에서(a.e.)

거의 확실히(almost surely, a.s.), 확률 1로 

조건부 측도 \(\mu_{A}(B)\) 

조건부 확률 \(P(B|A)\) 

푸리에 변환 \(\displaystyle\int_{-\infty}^{\infty}{e^{i\omega t}f(t)dt}\) 

특성함수 \(\displaystyle E(e^{itX})=\int_{\Omega}{e^{itX}dP}\) 


표본공간 \((\Omega,\,\mathcal{F},\,P)\)에서 함수 \(X:\Omega\,\rightarrow\,\mathbb{R}\)가 임의의 \(x\in\mathbb{R}\)에 대해$$\{X\leq x\}=X^{-1}[(-\infty,\,x]\in\mathcal{F}$$이면 가측함수의 정의에 의해 \(X\)는 가측함수이고, 이 함수 \(X\)를 확률변수(random variable)라고 하고, \(X\)의 분포(distribution)라고 정의되는 확률측도 \(\mu_{X}\)는 다음과 같이 정의된다.$$\mu_{X}(A)=P(X^{-1}[A])$$여기서 \(A\)는 \(\mathbb{R}\)의 보렐가측 부분집합이고, \(\mu_{X}(A)\)는 \(x\in X\)가 \(A\)에 속할 확률$$P(X\in A)=P(X^{-1}[A])$$를 나타낸다. 

가측함수 \(h:\mathbb{R}\,\rightarrow\,\mathbb{R}\)에 대하여 다음의 등식이 성립하고,$$\int_{\Omega}{h(XdP}=\int_{-\infty}^{\infty}{h(x)d\mu_{X}(x)}$$\(h(x)=|x|^{p}\)라 하면 다음이 성립한다.$$E(|X|^{p})=\int_{\Omega}{|X|^{p}dP}=\int_{-\infty}^{\infty}{|x|^{p}d\mu_{X}(x)}$$모든 \(A\in\mathcal{F}\)에 대하여 다음이 성립하면$$\mu_{X}(A)=\int_{A}{f(x)dx}$$\(f\)를 \(X\)의 확률밀도함수(probability density function)라고 하고 이때 \(X\)의 특성함수(characteristic function)를 다음과 같이 정의한다.$$E(e^{itX})=\int_{-\infty}^{\infty}{e^{itx}f(x)dx}$$\(X\)의 기댓값(expectation) 또는 평균(mean)을 다음과 같이 정의하고$$\mu=E(X)=\int_{-\infty}^{\infty}{xd\mu_{X}(x)}\left(=\int_{\Omega}{XdP}\right)$$\(X\)의 분산(variance)을$$\text{Var}(X)=E((X-E(X))^{2})=\int_{-\infty}^{\infty}{(x-\mu)^{2}d\mu_{X}(x)}$$로, \(X\)의 표준편차(standard deviation)를 분산의 양의 제곱근으로 다음과 같이 정의한다.$$\sigma(X)=\sqrt{\text{Var}(X)}$$동전을 던져서 앞면이 나올 확률을 \(p\)라고 하면 뒷면이 나올 확률은 \(1-p\)이다. \(\Omega=\{\omega_{1},\,\Omega_{2}\}\)라 하고 \(\sigma-\)체 \(\mathcal{F}\)를 \(\mathcal{F}=\{\emptyset,\,\Omega,\,\{\omega_{1}\},\,\{\omega_{2}\}\}\), 확률측도 \(P\)를$$P(\{\omega_{1}\})=p,\,P(\{\omega_{2}\})=1-p\,(P(\emptyset)=0,\,P(\Omega)=1)$$로 정의한다. 동전의 앞면을 \(\omega_{1}\)로, 뒷면을 \(\omega_{2}\)로 대응시키고, 확률변수 \(X:\Omega\,\rightarrow\,\mathbb{R}\)를$$X(\omega_{1})=0,\,X(\omega_{2})=1$$이라 하자. 그러면$$P(X^{-1}[\{0\}])=p,\,P(X^{-1}[\{1\}])=1-p$$이다. 

(시겔의 역설) \(X\)를 달러화(USD)와 원화(KRW) 사이의 미래의 환율을 나타내는 확률변수라고 하면 함수 \(\displaystyle y=\frac{1}{x}\)는 \(x>0\)에서 볼록함수이므로 젠센의 부등식에 의해 다음이 성립한다.$$\frac{1}{E(X)}\leq E\left(\frac{1}{X}\right)$$여기서 \(\displaystyle\frac{1}{X}\)는 원화를 달러로 바꾸는 환율이고 \(\displaystyle\frac{1}{E(X)}\neq E\left(\frac{1}{X}\right)\)이다. 이것은 어느 주어진 통화(달러화)의 관점에서 환율의 상승을 \(X\)의 평균 \(E(X)\)만큼 상대 통화(원화)의 관점에서 그만큼 비율로 환율의 평균이 감소할 필요가 없다는 것이다. 현재 1000(KRW/USD)인 환율이 1년 후 각각 \(\displaystyle\frac{1}{2}\)의 확률로 \(X=2000\)(KRW/USD)와 \(X=500\)(KRW/USD)의 값을 갖는다고 하면, 그 반대 방향의 환율 \(\displaystyle\frac{1}{X}\)는 현재 0.001(USD/KRW)이며, 각각 \(\displaystyle\frac{1}{2}\)의 확률로 \(\displaystyle\frac{1}{X}=0.0005\)(USD/KRW)과 \(\displaystyle\frac{1}{X}=0.002\)(USD/KRW)의 값을 가지므로 따라서$$\begin{align*}E(X)&=\frac{1}{2}\times2000+\frac{1}{2}\times500=1250(\text{KRW/USD})\\E\left(\frac{1}{X}\right)&=\frac{1}{2}\times0.0005+\frac{1}{2}\times0.002=0.00125(\text{USD/KRW})\end{align*}$$이므로 원화를 달러화로 환전해 보유하거나 반대로 달러화를 원화로 환전하든지 환율이 평균적으로 1.25배 오른다. 즉 어느 경우에나 같은 기대 수익률을 얻게 되고, 이것을 시겔의 역설(Siegel's paradox)이라고 한다. 역설은 틀린게 아닌 직관과 다르다는 것이다.


사건 \(A_{1},\,...,\,A_{n}\)이 다음의 식을 만족하면$$P(A_{1}\cap\cdots\cap A_{n})=P(A_{1})\cdots P(A_{n})$$\(A_{1},\,...,\,A_{n}\)는 서로 독립(independent)이라고 한다. 무한히 많은 사건들의 집합족 \(\{A_{\gamma}\}_{\gamma\in\Gamma}\)에 대해서 임의의 유한개의 부분집합 \(A_{\gamma_{1}},\,...,\,A_{\gamma_{n}}\)이 서로 독립이면 \(\{A_{\gamma}\}_{\gamma\in\Gamma}\)는 서로 독립이라고 한다.

두 사건 \(A,\,B\)가 서로 독립이면 \(A^{c},\,B\), \(A,\,B^{c}\), \(A^{c},\,B^{c}\)는 모두 서로 독립이다.

확률변수들의 열 \(X_{i}:\Omega\,\rightarrow\,\mathbb{R}\)가 임의의 보렐가측 \(B_{i}\subset\mathbb{R}\)에 대해 부분집합들의 열 \(\{X^{-1}[B_{i}]\}\)가 서로 독립이면 \(\{X_{i}\}\)를 서로 독립인 확률변수라고 한다.

(i) 부분 \(\sigma-\)체 \(\mathcal{F}_{i}\)들이 주어졌을 때 임의의 \(A_{1}\in\mathcal{F}_{1},\,...,\,A_{n}\in\mathcal{F}_{n}\)가 독립이면 \(\mathcal{F}_{i}\)를 서로 독립인 부분 \(\sigma-\)대수들이라고 한다.  

(ii) 확률변수 \(X\)와 부분 \(\sigma-\)체 \(\mathcal{F}\)가 주어졌을 때, 임의의 보렐 부분집합 \(I\subset\mathbb{R}\)와 \(A\in\mathcal{F}\)에 대해 \(X^{-1}[I]\)와 \(A\)가 서로 독립이면 \(X\)와 \(\mathcal{F}\)를 서로 독립이라고 한다. 

(iii) \(I\subset\mathbb{R}\)이 임의의 보렐집합을 나타낼 때 \(X^{-1}[I]\)를 포함하는 최소의 \(\sigma-\)대수를 \(\sigma(X)\)로 정의한다. 따라서 \(X\)와 \(\mathcal{F}\)가 서로 독립인 것은 \(\sigma(X)\)와 \(\mathcal{F}\)가 서로 독립인 것과 동치이다.


확률변수 \(X\)와 \(Y\)가 서로 독립이라고 하자. 그러면 임의의 보렐 가측함수 \(f:\mathbb{R}\,\rightarrow\,\mathbb{R}\)와 \(g:\mathbb{R}\,\rightarrow\,\mathbb{R}\)에 대해 \(f(X)\)와 \(g(Y)\)는 서로 독립이다. 

*참고: \(\sigma(f(X))\subset\sigma(X),\,\sigma(g(Y))\subset\sigma(Y)\)  


서로 독립인 확률변수 

(i) 임의의 보렐 가측집합 \(B_{i}\subset\mathbb{R}\)에 대해 다음이 성립한다.$$P(X_{1}\in B_{1},\,...,\,X_{n}\in B_{n})=P(X_{1}\in B_{1})\cdots P(X_{n})$$참고: \(P(X_{1}\in B_{1},\,X_{2}\in B_{2})=P(X_{1}^{-1}[B_{1}]\cap X_{2}^{-1}[B_{2}])=P(X_{1}^{-1}[B_{1}]\cap X_{2}^{-1}[B_{2}])=P(X_{1}\in B_{1})P(X_{2}\in B_{2})\)   

(ii) 모든 \(i\)에 대해 \(|E(X_{i})|<\infty\)이면 다음이 성립한다.$$E(X_{1}\cdots X_{n})=E(X_{1})\cdots E(X_{n})$$참고: \(\displaystyle X_{1}=\sum_{i}{\alpha_{i}\mathbf{1}_{A_{i}}},\,X_{2}=\sum_{j}{\beta_{j}\mathbf{1}_{j}}\)일 때$$E(X_{1}X_{2})=\sum_{i,\,j}{\alpha_{i}\beta_{j}P(A_{i}\cap B_{j})}=\left(\sum_{i}{\alpha_{i}P(A_{i})}\right)\left(\sum_{j}{\beta_{j}P(B_{j})}\right)=E(X_{1})E(X_{2})$$(iii) 모든 \(i\)에 대해 \(E(X_{i}^{2})<\infty\)이면 다음이 성립한다.$$\text{Var}(X_{1}+\cdots+X_{n})=\text{Var}(X_{1})+\cdots+\text{Var}(X_{n})$$\(\mathbb{R}\)에서 확률 \(P\)의 누적분포함수(cumulative distribution function, cdf)는 다음과 같이 정의되고$$F(x)=P(X\leq x)$$누적분포함수가 다음과 같을 때$$F(x)=\int_{-\infty}^{x}{f(t)dt}$$\(f(x)\)를 확률밀도함수라고 한다.  

누적분포함수는 단조증가함수이고 다음의 성질이 성립한다.$$\lim_{x\,\rightarrow\,-\infty}{F(x)}=0,\,\lim_{x\,\rightarrow\,\infty}{F(x)}=1,\,F(x)=\lim_{h\,\rightarrow\,0+}{F(x+h)},\,P(X<c)=\lim_{x\,\rightarrow\,c-}{F(x)}$$즉 누적분포함수는 우연속 함수이다.

표준정규분포를 따르는 확률변수 \(Z\)의 확률밀도함수는 \(\displaystyle f(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\)이고 따라서 다음이 성립한다.$$P(Z\leq z)=\int_{-\infty}^{z}{\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}dz}$$앞으로 표준정규분포의 누적분포함수를 \(\Phi(z)\)로 나타내겠다.         


확률변수 \(X\)의 모멘트 생성함수(moment generating function)는 0에 가까운 실수 \(t\)에 대해 다음과 같이 정의하고$$M_{X}(t)=E(e^{tx})$$두 확률분포가 같은지 확인하는데 이용된다. 


확률변수 \(X\)가 연속확률밀도함수 \(f_{X}\)를 갖는다고 하자. \(y=g(x)\)가 미분가능한 단조함수일 때 \(Y=g(X)\)라고 하면 다음이 성립한다.$$f_{Y}(y)=\frac{1}{|g'(g^{-1}(y))|}f_{X}(g^{-1}(y))$$\(g\)를 단조증가함수라 하자. \(a<b\)일 때$$P(X\in[a,\,b])=\int_{a}^{b}{f_{X}(x)dx}$$이고$$P(Y\in[g(a),\,g(b)])=\int_{g(a)}^{g(b)}{f_{Y}(y)dy}$$이다.$$\int_{a}^{b}{f_{X}(x)dx}=\int_{g(a)}^{g(b)}{f_{Y}(y)dy}$$이므로 위 식을 \(b\)에 대해 미분하면 \(f_{X}(b)=g'(b)f_{Y}(g(b))\)이고 \(y=g(b)\)라 하면 결과를 얻는다. \(g\)가 단조감소함수인 경우도 위와 같은 방법으로 보일 수 있다. 

\(X\)가 평균이 \(\mu\)고 표준편차가 \(\sigma\)인 정규분포의 확률변수일 때 그 확률밀도함수는 \(\displaystyle\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}\)이고 \(Y=e^{X}\,(X=\ln Y)\)라 하면 \(Y\)의 확률밀도함수는 다음과 같다.$$f_{Y}(y)=\frac{1}{\sigma y\sqrt{2\pi}}e^{-\frac{(\ln y-\mu)^{2}}{2\sigma^{2}}}$$이 확률변수 \(Y\)를 로그정규분포(lognormal distribution)의 확률밀도함수라고 한다. 

금융자산 \(S_{t}\)가 기하 브라운운동을 하면 \(\displaystyle S_{t}=S_{0}e^{\left(\mu-\frac{1}{2}\sigma^{2}\right)t+\sigma W_{t}}\)로 나타낼 수 있고,$$\ln Y_{t}=\ln S_{0}+\left(\mu-\frac{1}{2}\sigma^{2}\right)t+\sigma W_{t}$$이므로 \(X=\ln Y\)는 평균이 \(\displaystyle\ln S_{0}+\left(\mu-\frac{1}{2}\sigma^{2}\right)t\)이고 분산이 \(\sigma^{2}t\)(참고: 브라운 운동을 나타내는 \(W_{t}\)에 대해 \(\text{Var}(W_{t})=t\))인 정규분포를 따른다. 

확률변수 \(X\)가 연속확률밀도함수 \(f_{X}\)를 갖고 \(y=g(x)\)가 미분가능한 함수일 때 \(Y=g(X)\)라 하면 다음이 성립한다.$$f_{Y}(y)=\sum_{g(z)=y}{\frac{1}{|g'(z)|}f_{X}(z)}$$표준정규분포를 따르는 확률변수 \(Z\)에 대해 \(\displaystyle f_{Z}(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\)이고, \(Y=Z^{2}\)의 확률밀도함수를 구하자. \(g(z)=z^{2}\)라 하면 \(y\geq0\)에 대해 \(g^{-1}(y)=\pm\sqrt{y}\)이고$$\begin{align*}f_{Y}(y)&=\frac{1}{|-2\sqrt{y}|}f_{Z}(-\sqrt{y})+\frac{1}{|2\sqrt{y}|}f_{X}(\sqrt{y})\\&=\frac{1}{\sqrt{2\pi y}}e^{-\frac{y}{2}}\end{align*}$$이고 \(y<0\)일 때 \(f_{Y}(y)=0\)이다. 


큰 수의 약법칙(weak law of large numbers) \(X_{1},\,...,\,X_{n}\)이 서로 독립이고 분포가 동일하며 평균이 \(\mu\), 분산이 \(\sigma^{2}\)인 \(L^{2}\)확률변수라고 하자.$$S_{n}=\sum_{i=1}^{n}{X_{i}}$$라 하자. 그러면 임의의 \(\epsilon>0\)에 대해 다음이 성립한다.$$\lim_{n\,\rightarrow\,\infty}{P\left(\left|\frac{S_{n}}{n}-\mu\right|>\epsilon\right)}=0$$즉 \(n\,\rightarrow\,\infty\)일 때 \(\displaystyle\frac{1}{n}S_{n}\)은 \(\mu\)로 확률수렴(converge in probability)한다.

\(p=2\)인 경우의 체비셰프 부등식으로부터$$P\left(\left|\frac{1}{n}\sum_{i=1}^{n}{(S_{i}-\mu)}\right|>\epsilon\right)\leq\frac{1}{n^{2}\epsilon^{2}}\sum_{i=1}^{n}{E((X_{i}-\mu)^{2})}=\frac{\sigma^{2}}{n\epsilon^{2}}$$이고 극한 \(n\,\rightarrow\,\infty\)을 취하면 결과를 얻는다. 


큰 수의 강법칙(strong law of large numbers) \(X_{1},\,...,\,X_{n}\)이 서로 독립이고 분포가 동일하며 평균이 \(\mu\)인 \(L^{1}\)확률변수라고 하자.$$S_{n}=\sum_{i=1}^{n}{S_{i}}$$라고 하면 \(n\,\rightarrow\,\infty\)일 때 \(\displaystyle\frac{1}{n}S_{n}\,\rightarrow\,\mu\,a.s.\)이다.  


중심극한정리(central limit theorem) \(X_{1},\,...,\,X_{n}\)이 독립이고 동일한 분포를 갖는 \(L^{2}\)확률변수이고 평균이 \(\mu\), 분산이 \(\sigma^{2}\)이라 하자. 그러면 다음이 성립하고$$\lim_{n\,\rightarrow\,\infty}{P\left(\frac{S_{n}-n\mu}{\sigma\sqrt{n}}\leq x\right)}=\Phi(x)$$여기서 \(\Phi(x)\)는 표준정규분포의 누적분포함수이다. 


두 확률변수 \(X,\,Y\)에 대해 공분산(covariance)을$$\text{Cov}(X,\,Y)=E((X-E(X))(Y-E(Y)))$$으로, 상관계수(correlation)를$$\rho(X,\,Y)=\frac{\text{Cov}(X,\,Y)}{\sqrt{\text{Var}(X)}\sqrt{\text{Var}(Y)}}$$로 정의한다. 

확률변수 \(X,\,Y,\,Z\)에 대해 다음의 성질이 성립한다. 

(1) \(\text{Cov}(X,\,Y)=\text{Cov}(Y,\,X)\) 

(2) \(\text{Cov}(X,\,X)=\text{Var}(X)\)

(3) \(\text{Cov}(X,\,Y)=E(XY)-E(X)E(Y)\)

(4) \(\text{Cov}(X+Y,\,Z)=\text{Cov}(X,\,Z)+\text{Cov}(Y,\,Z)\)

(5) 상수 \(a\)에 대해 \(\text{Cov}(X,\,aY)=a\text{Cov}(X,\,Y)\) 

(6) 상수 \(a\)에 대해 \(\text{Cov}(X,\,a)=0\)

위의 성질과 코시-슈바르츠 정리에 의해 \(-1\leq\rho(X,\,Y)\leq1\)이고 \(Y=aX+b\)일 때 다음이 성립한다.$$\rho(X,\,Y)=\begin{cases}1&\,a>0\\-1&\,a<0\end{cases}$$

참고자료:

금융수학의 방법론, 최건호, 경문사   

반응형
Posted by skywalker222