Processing math: 61%

반응형

[금융수학] 8. 기초 확률론



러시아의 수학자 콜모고로프(Kolmogorov)는 르베그 적분이 확률론의 언어와 방법론이 될 수 있음을 주장했다. 다음은 르베그 적분론과 확률론에서 사용되는 용어와 표기법을 비교한 것이다. 여기서는 확률론의 표기를 사용할 것이다. 

르베그 적분 

확률론 

측도공간 (X,A,μ) 

표본공간 (Ω,F,P) 

 xX

ωΩ 

σ대수 A 

σ체(field) F 

가측집합 A 여집합 Ac

사건 E 여사건 Ec

 측도수렴

확률수렴 

측도 μ 

확률측도 P 

A의 크기 μ(A) 

E의 확률 P(E) 

가측함수 f 

확률변수 X(ω) 

특성함수 χE 

지시함수 1E 

 적분 Xfdμ

기댓값 E(X)=ΩXdP 

 거의 모든곳에서(a.e.)

거의 확실히(almost surely, a.s.), 확률 1로 

조건부 측도 μA(B) 

조건부 확률 P(B|A) 

푸리에 변환 eiωtf(t)dt 

특성함수 E(eitX)=ΩeitXdP 


표본공간 (Ω,F,P)에서 함수 X:ΩR가 임의의 xR에 대해{Xx}=X1[(,x]F이면 가측함수의 정의에 의해 X는 가측함수이고, 이 함수 X를 확률변수(random variable)라고 하고, X의 분포(distribution)라고 정의되는 확률측도 μX는 다음과 같이 정의된다.μX(A)=P(X1[A])여기서 AR의 보렐가측 부분집합이고, μX(A)xXA에 속할 확률P(XA)=P(X1[A])를 나타낸다. 

가측함수 h:RR에 대하여 다음의 등식이 성립하고,Ωh(XdP=h(x)dμX(x)h(x)=|x|p라 하면 다음이 성립한다.E(|X|p)=Ω|X|pdP=|x|pdμX(x)모든 AF에 대하여 다음이 성립하면μX(A)=Af(x)dxfX의 확률밀도함수(probability density function)라고 하고 이때 X의 특성함수(characteristic function)를 다음과 같이 정의한다.E(eitX)=eitxf(x)dxX의 기댓값(expectation) 또는 평균(mean)을 다음과 같이 정의하고μ=E(X)=xdμX(x)(=ΩXdP)X의 분산(variance)을Var(X)=E((XE(X))2)=(xμ)2dμX(x)로, X의 표준편차(standard deviation)를 분산의 양의 제곱근으로 다음과 같이 정의한다.σ(X)=Var(X)동전을 던져서 앞면이 나올 확률을 p라고 하면 뒷면이 나올 확률은 1p이다. Ω={ω1,Ω2}라 하고 σFF={,Ω,{ω1},{ω2}}, 확률측도 PP({ω1})=p,P({ω2})=1p(P()=0,P(Ω)=1)로 정의한다. 동전의 앞면을 ω1로, 뒷면을 ω2로 대응시키고, 확률변수 X:ΩRX(ω1)=0,X(ω2)=1이라 하자. 그러면P(X1[{0}])=p,P(X1[{1}])=1p이다. 

(시겔의 역설) X를 달러화(USD)와 원화(KRW) 사이의 미래의 환율을 나타내는 확률변수라고 하면 함수 y=1xx>0에서 볼록함수이므로 젠센의 부등식에 의해 다음이 성립한다.1E(X)E(1X)여기서 1X는 원화를 달러로 바꾸는 환율이고 1E(X)E(1X)이다. 이것은 어느 주어진 통화(달러화)의 관점에서 환율의 상승을 X의 평균 E(X)만큼 상대 통화(원화)의 관점에서 그만큼 비율로 환율의 평균이 감소할 필요가 없다는 것이다. 현재 1000(KRW/USD)인 환율이 1년 후 각각 12의 확률로 X=2000(KRW/USD)와 X=500(KRW/USD)의 값을 갖는다고 하면, 그 반대 방향의 환율 1X는 현재 0.001(USD/KRW)이며, 각각 12의 확률로 1X=0.0005(USD/KRW)과 1X=0.002(USD/KRW)의 값을 가지므로 따라서E(X)=12×2000+12×500=1250(KRW/USD)E(1X)=12×0.0005+12×0.002=0.00125(USD/KRW)이므로 원화를 달러화로 환전해 보유하거나 반대로 달러화를 원화로 환전하든지 환율이 평균적으로 1.25배 오른다. 즉 어느 경우에나 같은 기대 수익률을 얻게 되고, 이것을 시겔의 역설(Siegel's paradox)이라고 한다. 역설은 틀린게 아닌 직관과 다르다는 것이다.


사건 A1,...,An이 다음의 식을 만족하면P(A1An)=P(A1)P(An)A1,...,An는 서로 독립(independent)이라고 한다. 무한히 많은 사건들의 집합족 {Aγ}γΓ에 대해서 임의의 유한개의 부분집합 Aγ1,...,Aγn이 서로 독립이면 {Aγ}γΓ는 서로 독립이라고 한다.

두 사건 A,B가 서로 독립이면 Ac,B, A,Bc, Ac,Bc는 모두 서로 독립이다.

확률변수들의 열 Xi:ΩR가 임의의 보렐가측 BiR에 대해 부분집합들의 열 {X1[Bi]}가 서로 독립이면 {Xi}를 서로 독립인 확률변수라고 한다.

(i) 부분 σFi들이 주어졌을 때 임의의 A1F1,...,AnFn가 독립이면 Fi를 서로 독립인 부분 σ대수들이라고 한다.  

(ii) 확률변수 X와 부분 σF가 주어졌을 때, 임의의 보렐 부분집합 IRAF에 대해 X1[I]A가 서로 독립이면 XF를 서로 독립이라고 한다. 

(iii) IR이 임의의 보렐집합을 나타낼 때 X1[I]를 포함하는 최소의 σ대수를 σ(X)로 정의한다. 따라서 XF가 서로 독립인 것은 σ(X)F가 서로 독립인 것과 동치이다.


확률변수 XY가 서로 독립이라고 하자. 그러면 임의의 보렐 가측함수 f:RRg:RR에 대해 f(X)g(Y)는 서로 독립이다. 

*참고: σ(f(X))σ(X),σ(g(Y))σ(Y)  


서로 독립인 확률변수 

(i) 임의의 보렐 가측집합 BiR에 대해 다음이 성립한다.P(X1B1,...,XnBn)=P(X1B1)P(Xn)참고: P(X1B1,X2B2)=P(X11[B1]X12[B2])=P(X11[B1]X12[B2])=P(X1B1)P(X2B2)   

(ii) 모든 i에 대해 |E(Xi)|<이면 다음이 성립한다.E(X1Xn)=E(X1)E(Xn)참고: X1=iαi1Ai,X2=jβj1j일 때E(X1X2)=i,jαiβjP(AiBj)=(iαiP(Ai))(jβjP(Bj))=E(X1)E(X2)(iii) 모든 i에 대해 E(X2i)<이면 다음이 성립한다.Var(X1++Xn)=Var(X1)++Var(Xn)R에서 확률 P의 누적분포함수(cumulative distribution function, cdf)는 다음과 같이 정의되고F(x)=P(Xx)누적분포함수가 다음과 같을 때F(x)=xf(t)dtf(x)를 확률밀도함수라고 한다.  

누적분포함수는 단조증가함수이고 다음의 성질이 성립한다.lim즉 누적분포함수는 우연속 함수이다.

표준정규분포를 따르는 확률변수 Z의 확률밀도함수는 \displaystyle f(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}이고 따라서 다음이 성립한다.P(Z\leq z)=\int_{-\infty}^{z}{\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}dz}앞으로 표준정규분포의 누적분포함수를 \Phi(z)로 나타내겠다.         


확률변수 X의 모멘트 생성함수(moment generating function)는 0에 가까운 실수 t에 대해 다음과 같이 정의하고M_{X}(t)=E(e^{tx})두 확률분포가 같은지 확인하는데 이용된다. 


확률변수 X가 연속확률밀도함수 f_{X}를 갖는다고 하자. y=g(x)가 미분가능한 단조함수일 때 Y=g(X)라고 하면 다음이 성립한다.f_{Y}(y)=\frac{1}{|g'(g^{-1}(y))|}f_{X}(g^{-1}(y))g를 단조증가함수라 하자. a<b일 때P(X\in[a,\,b])=\int_{a}^{b}{f_{X}(x)dx}이고P(Y\in[g(a),\,g(b)])=\int_{g(a)}^{g(b)}{f_{Y}(y)dy}이다.\int_{a}^{b}{f_{X}(x)dx}=\int_{g(a)}^{g(b)}{f_{Y}(y)dy}이므로 위 식을 b에 대해 미분하면 f_{X}(b)=g'(b)f_{Y}(g(b))이고 y=g(b)라 하면 결과를 얻는다. g가 단조감소함수인 경우도 위와 같은 방법으로 보일 수 있다. 

X가 평균이 \mu고 표준편차가 \sigma인 정규분포의 확률변수일 때 그 확률밀도함수는 \displaystyle\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}이고 Y=e^{X}\,(X=\ln Y)라 하면 Y의 확률밀도함수는 다음과 같다.f_{Y}(y)=\frac{1}{\sigma y\sqrt{2\pi}}e^{-\frac{(\ln y-\mu)^{2}}{2\sigma^{2}}}이 확률변수 Y를 로그정규분포(lognormal distribution)의 확률밀도함수라고 한다. 

금융자산 S_{t}가 기하 브라운운동을 하면 \displaystyle S_{t}=S_{0}e^{\left(\mu-\frac{1}{2}\sigma^{2}\right)t+\sigma W_{t}}로 나타낼 수 있고,\ln Y_{t}=\ln S_{0}+\left(\mu-\frac{1}{2}\sigma^{2}\right)t+\sigma W_{t}이므로 X=\ln Y는 평균이 \displaystyle\ln S_{0}+\left(\mu-\frac{1}{2}\sigma^{2}\right)t이고 분산이 \sigma^{2}t(참고: 브라운 운동을 나타내는 W_{t}에 대해 \text{Var}(W_{t})=t)인 정규분포를 따른다. 

확률변수 X가 연속확률밀도함수 f_{X}를 갖고 y=g(x)가 미분가능한 함수일 때 Y=g(X)라 하면 다음이 성립한다.f_{Y}(y)=\sum_{g(z)=y}{\frac{1}{|g'(z)|}f_{X}(z)}표준정규분포를 따르는 확률변수 Z에 대해 \displaystyle f_{Z}(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}이고, Y=Z^{2}의 확률밀도함수를 구하자. g(z)=z^{2}라 하면 y\geq0에 대해 g^{-1}(y)=\pm\sqrt{y}이고\begin{align*}f_{Y}(y)&=\frac{1}{|-2\sqrt{y}|}f_{Z}(-\sqrt{y})+\frac{1}{|2\sqrt{y}|}f_{X}(\sqrt{y})\\&=\frac{1}{\sqrt{2\pi y}}e^{-\frac{y}{2}}\end{align*}이고 y<0일 때 f_{Y}(y)=0이다. 


큰 수의 약법칙(weak law of large numbers) X_{1},\,...,\,X_{n}이 서로 독립이고 분포가 동일하며 평균이 \mu, 분산이 \sigma^{2}L^{2}확률변수라고 하자.S_{n}=\sum_{i=1}^{n}{X_{i}}라 하자. 그러면 임의의 \epsilon>0에 대해 다음이 성립한다.\lim_{n\,\rightarrow\,\infty}{P\left(\left|\frac{S_{n}}{n}-\mu\right|>\epsilon\right)}=0n\,\rightarrow\,\infty일 때 \displaystyle\frac{1}{n}S_{n}\mu로 확률수렴(converge in probability)한다.

p=2인 경우의 체비셰프 부등식으로부터P\left(\left|\frac{1}{n}\sum_{i=1}^{n}{(S_{i}-\mu)}\right|>\epsilon\right)\leq\frac{1}{n^{2}\epsilon^{2}}\sum_{i=1}^{n}{E((X_{i}-\mu)^{2})}=\frac{\sigma^{2}}{n\epsilon^{2}}이고 극한 n\,\rightarrow\,\infty을 취하면 결과를 얻는다. 


큰 수의 강법칙(strong law of large numbers) X_{1},\,...,\,X_{n}이 서로 독립이고 분포가 동일하며 평균이 \muL^{1}확률변수라고 하자.S_{n}=\sum_{i=1}^{n}{S_{i}}라고 하면 n\,\rightarrow\,\infty일 때 \displaystyle\frac{1}{n}S_{n}\,\rightarrow\,\mu\,a.s.이다.  


중심극한정리(central limit theorem) X_{1},\,...,\,X_{n}이 독립이고 동일한 분포를 갖는 L^{2}확률변수이고 평균이 \mu, 분산이 \sigma^{2}이라 하자. 그러면 다음이 성립하고\lim_{n\,\rightarrow\,\infty}{P\left(\frac{S_{n}-n\mu}{\sigma\sqrt{n}}\leq x\right)}=\Phi(x)여기서 \Phi(x)는 표준정규분포의 누적분포함수이다. 


두 확률변수 X,\,Y에 대해 공분산(covariance)을\text{Cov}(X,\,Y)=E((X-E(X))(Y-E(Y)))으로, 상관계수(correlation)를\rho(X,\,Y)=\frac{\text{Cov}(X,\,Y)}{\sqrt{\text{Var}(X)}\sqrt{\text{Var}(Y)}}로 정의한다. 

확률변수 X,\,Y,\,Z에 대해 다음의 성질이 성립한다. 

(1) \text{Cov}(X,\,Y)=\text{Cov}(Y,\,X) 

(2) \text{Cov}(X,\,X)=\text{Var}(X)

(3) \text{Cov}(X,\,Y)=E(XY)-E(X)E(Y)

(4) \text{Cov}(X+Y,\,Z)=\text{Cov}(X,\,Z)+\text{Cov}(Y,\,Z)

(5) 상수 a에 대해 \text{Cov}(X,\,aY)=a\text{Cov}(X,\,Y) 

(6) 상수 a에 대해 \text{Cov}(X,\,a)=0

위의 성질과 코시-슈바르츠 정리에 의해 -1\leq\rho(X,\,Y)\leq1이고 Y=aX+b일 때 다음이 성립한다.\rho(X,\,Y)=\begin{cases}1&\,a>0\\-1&\,a<0\end{cases}

참고자료:

금융수학의 방법론, 최건호, 경문사   

반응형
Posted by skywalker222