[금융수학] 8. 기초 확률론
러시아의 수학자 콜모고로프(Kolmogorov)는 르베그 적분이 확률론의 언어와 방법론이 될 수 있음을 주장했다. 다음은 르베그 적분론과 확률론에서 사용되는 용어와 표기법을 비교한 것이다. 여기서는 확률론의 표기를 사용할 것이다.
르베그 적분 |
확률론 |
측도공간 (X,A,μ) |
표본공간 (Ω,F,P) |
x∈X |
ω∈Ω |
σ−대수 A |
σ−체(field) F |
가측집합 A 여집합 Ac |
사건 E 여사건 Ec |
측도수렴 |
확률수렴 |
측도 μ |
확률측도 P |
A의 크기 μ(A) |
E의 확률 P(E) |
가측함수 f |
확률변수 X(ω) |
특성함수 χE |
지시함수 1E |
적분 ∫Xfdμ |
기댓값 E(X)=∫ΩXdP |
거의 모든곳에서(a.e.) |
거의 확실히(almost surely, a.s.), 확률 1로 |
조건부 측도 μA(B) |
조건부 확률 P(B|A) |
푸리에 변환 ∫∞−∞eiωtf(t)dt |
특성함수 E(eitX)=∫ΩeitXdP |
표본공간 (Ω,F,P)에서 함수 X:Ω→R가 임의의 x∈R에 대해{X≤x}=X−1[(−∞,x]∈F이면 가측함수의 정의에 의해 X는 가측함수이고, 이 함수 X를 확률변수(random variable)라고 하고, X의 분포(distribution)라고 정의되는 확률측도 μX는 다음과 같이 정의된다.μX(A)=P(X−1[A])여기서 A는 R의 보렐가측 부분집합이고, μX(A)는 x∈X가 A에 속할 확률P(X∈A)=P(X−1[A])를 나타낸다.
가측함수 h:R→R에 대하여 다음의 등식이 성립하고,∫Ωh(XdP=∫∞−∞h(x)dμX(x)h(x)=|x|p라 하면 다음이 성립한다.E(|X|p)=∫Ω|X|pdP=∫∞−∞|x|pdμX(x)모든 A∈F에 대하여 다음이 성립하면μX(A)=∫Af(x)dxf를 X의 확률밀도함수(probability density function)라고 하고 이때 X의 특성함수(characteristic function)를 다음과 같이 정의한다.E(eitX)=∫∞−∞eitxf(x)dxX의 기댓값(expectation) 또는 평균(mean)을 다음과 같이 정의하고μ=E(X)=∫∞−∞xdμX(x)(=∫ΩXdP)X의 분산(variance)을Var(X)=E((X−E(X))2)=∫∞−∞(x−μ)2dμX(x)로, X의 표준편차(standard deviation)를 분산의 양의 제곱근으로 다음과 같이 정의한다.σ(X)=√Var(X)동전을 던져서 앞면이 나올 확률을 p라고 하면 뒷면이 나올 확률은 1−p이다. Ω={ω1,Ω2}라 하고 σ−체 F를 F={∅,Ω,{ω1},{ω2}}, 확률측도 P를P({ω1})=p,P({ω2})=1−p(P(∅)=0,P(Ω)=1)로 정의한다. 동전의 앞면을 ω1로, 뒷면을 ω2로 대응시키고, 확률변수 X:Ω→R를X(ω1)=0,X(ω2)=1이라 하자. 그러면P(X−1[{0}])=p,P(X−1[{1}])=1−p이다.
(시겔의 역설) X를 달러화(USD)와 원화(KRW) 사이의 미래의 환율을 나타내는 확률변수라고 하면 함수 y=1x는 x>0에서 볼록함수이므로 젠센의 부등식에 의해 다음이 성립한다.1E(X)≤E(1X)여기서 1X는 원화를 달러로 바꾸는 환율이고 1E(X)≠E(1X)이다. 이것은 어느 주어진 통화(달러화)의 관점에서 환율의 상승을 X의 평균 E(X)만큼 상대 통화(원화)의 관점에서 그만큼 비율로 환율의 평균이 감소할 필요가 없다는 것이다. 현재 1000(KRW/USD)인 환율이 1년 후 각각 12의 확률로 X=2000(KRW/USD)와 X=500(KRW/USD)의 값을 갖는다고 하면, 그 반대 방향의 환율 1X는 현재 0.001(USD/KRW)이며, 각각 12의 확률로 1X=0.0005(USD/KRW)과 1X=0.002(USD/KRW)의 값을 가지므로 따라서E(X)=12×2000+12×500=1250(KRW/USD)E(1X)=12×0.0005+12×0.002=0.00125(USD/KRW)이므로 원화를 달러화로 환전해 보유하거나 반대로 달러화를 원화로 환전하든지 환율이 평균적으로 1.25배 오른다. 즉 어느 경우에나 같은 기대 수익률을 얻게 되고, 이것을 시겔의 역설(Siegel's paradox)이라고 한다. 역설은 틀린게 아닌 직관과 다르다는 것이다.
사건 A1,...,An이 다음의 식을 만족하면P(A1∩⋯∩An)=P(A1)⋯P(An)A1,...,An는 서로 독립(independent)이라고 한다. 무한히 많은 사건들의 집합족 {Aγ}γ∈Γ에 대해서 임의의 유한개의 부분집합 Aγ1,...,Aγn이 서로 독립이면 {Aγ}γ∈Γ는 서로 독립이라고 한다.
두 사건 A,B가 서로 독립이면 Ac,B, A,Bc, Ac,Bc는 모두 서로 독립이다.
확률변수들의 열 Xi:Ω→R가 임의의 보렐가측 Bi⊂R에 대해 부분집합들의 열 {X−1[Bi]}가 서로 독립이면 {Xi}를 서로 독립인 확률변수라고 한다.
(i) 부분 σ−체 Fi들이 주어졌을 때 임의의 A1∈F1,...,An∈Fn가 독립이면 Fi를 서로 독립인 부분 σ−대수들이라고 한다.
(ii) 확률변수 X와 부분 σ−체 F가 주어졌을 때, 임의의 보렐 부분집합 I⊂R와 A∈F에 대해 X−1[I]와 A가 서로 독립이면 X와 F를 서로 독립이라고 한다.
(iii) I⊂R이 임의의 보렐집합을 나타낼 때 X−1[I]를 포함하는 최소의 σ−대수를 σ(X)로 정의한다. 따라서 X와 F가 서로 독립인 것은 σ(X)와 F가 서로 독립인 것과 동치이다.
확률변수 X와 Y가 서로 독립이라고 하자. 그러면 임의의 보렐 가측함수 f:R→R와 g:R→R에 대해 f(X)와 g(Y)는 서로 독립이다.
*참고: σ(f(X))⊂σ(X),σ(g(Y))⊂σ(Y)
서로 독립인 확률변수
(i) 임의의 보렐 가측집합 Bi⊂R에 대해 다음이 성립한다.P(X1∈B1,...,Xn∈Bn)=P(X1∈B1)⋯P(Xn)참고: P(X1∈B1,X2∈B2)=P(X−11[B1]∩X−12[B2])=P(X−11[B1]∩X−12[B2])=P(X1∈B1)P(X2∈B2)
(ii) 모든 i에 대해 |E(Xi)|<∞이면 다음이 성립한다.E(X1⋯Xn)=E(X1)⋯E(Xn)참고: X1=∑iαi1Ai,X2=∑jβj1j일 때E(X1X2)=∑i,jαiβjP(Ai∩Bj)=(∑iαiP(Ai))(∑jβjP(Bj))=E(X1)E(X2)(iii) 모든 i에 대해 E(X2i)<∞이면 다음이 성립한다.Var(X1+⋯+Xn)=Var(X1)+⋯+Var(Xn)R에서 확률 P의 누적분포함수(cumulative distribution function, cdf)는 다음과 같이 정의되고F(x)=P(X≤x)누적분포함수가 다음과 같을 때F(x)=∫x−∞f(t)dtf(x)를 확률밀도함수라고 한다.
누적분포함수는 단조증가함수이고 다음의 성질이 성립한다.lim즉 누적분포함수는 우연속 함수이다.
표준정규분포를 따르는 확률변수 Z의 확률밀도함수는 \displaystyle f(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}이고 따라서 다음이 성립한다.P(Z\leq z)=\int_{-\infty}^{z}{\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}dz}앞으로 표준정규분포의 누적분포함수를 \Phi(z)로 나타내겠다.
확률변수 X의 모멘트 생성함수(moment generating function)는 0에 가까운 실수 t에 대해 다음과 같이 정의하고M_{X}(t)=E(e^{tx})두 확률분포가 같은지 확인하는데 이용된다.
확률변수 X가 연속확률밀도함수 f_{X}를 갖는다고 하자. y=g(x)가 미분가능한 단조함수일 때 Y=g(X)라고 하면 다음이 성립한다.f_{Y}(y)=\frac{1}{|g'(g^{-1}(y))|}f_{X}(g^{-1}(y))g를 단조증가함수라 하자. a<b일 때P(X\in[a,\,b])=\int_{a}^{b}{f_{X}(x)dx}이고P(Y\in[g(a),\,g(b)])=\int_{g(a)}^{g(b)}{f_{Y}(y)dy}이다.\int_{a}^{b}{f_{X}(x)dx}=\int_{g(a)}^{g(b)}{f_{Y}(y)dy}이므로 위 식을 b에 대해 미분하면 f_{X}(b)=g'(b)f_{Y}(g(b))이고 y=g(b)라 하면 결과를 얻는다. g가 단조감소함수인 경우도 위와 같은 방법으로 보일 수 있다.
X가 평균이 \mu고 표준편차가 \sigma인 정규분포의 확률변수일 때 그 확률밀도함수는 \displaystyle\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}이고 Y=e^{X}\,(X=\ln Y)라 하면 Y의 확률밀도함수는 다음과 같다.f_{Y}(y)=\frac{1}{\sigma y\sqrt{2\pi}}e^{-\frac{(\ln y-\mu)^{2}}{2\sigma^{2}}}이 확률변수 Y를 로그정규분포(lognormal distribution)의 확률밀도함수라고 한다.
금융자산 S_{t}가 기하 브라운운동을 하면 \displaystyle S_{t}=S_{0}e^{\left(\mu-\frac{1}{2}\sigma^{2}\right)t+\sigma W_{t}}로 나타낼 수 있고,\ln Y_{t}=\ln S_{0}+\left(\mu-\frac{1}{2}\sigma^{2}\right)t+\sigma W_{t}이므로 X=\ln Y는 평균이 \displaystyle\ln S_{0}+\left(\mu-\frac{1}{2}\sigma^{2}\right)t이고 분산이 \sigma^{2}t(참고: 브라운 운동을 나타내는 W_{t}에 대해 \text{Var}(W_{t})=t)인 정규분포를 따른다.
확률변수 X가 연속확률밀도함수 f_{X}를 갖고 y=g(x)가 미분가능한 함수일 때 Y=g(X)라 하면 다음이 성립한다.f_{Y}(y)=\sum_{g(z)=y}{\frac{1}{|g'(z)|}f_{X}(z)}표준정규분포를 따르는 확률변수 Z에 대해 \displaystyle f_{Z}(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}이고, Y=Z^{2}의 확률밀도함수를 구하자. g(z)=z^{2}라 하면 y\geq0에 대해 g^{-1}(y)=\pm\sqrt{y}이고\begin{align*}f_{Y}(y)&=\frac{1}{|-2\sqrt{y}|}f_{Z}(-\sqrt{y})+\frac{1}{|2\sqrt{y}|}f_{X}(\sqrt{y})\\&=\frac{1}{\sqrt{2\pi y}}e^{-\frac{y}{2}}\end{align*}이고 y<0일 때 f_{Y}(y)=0이다.
큰 수의 약법칙(weak law of large numbers) X_{1},\,...,\,X_{n}이 서로 독립이고 분포가 동일하며 평균이 \mu, 분산이 \sigma^{2}인 L^{2}확률변수라고 하자.S_{n}=\sum_{i=1}^{n}{X_{i}}라 하자. 그러면 임의의 \epsilon>0에 대해 다음이 성립한다.\lim_{n\,\rightarrow\,\infty}{P\left(\left|\frac{S_{n}}{n}-\mu\right|>\epsilon\right)}=0즉 n\,\rightarrow\,\infty일 때 \displaystyle\frac{1}{n}S_{n}은 \mu로 확률수렴(converge in probability)한다.
p=2인 경우의 체비셰프 부등식으로부터P\left(\left|\frac{1}{n}\sum_{i=1}^{n}{(S_{i}-\mu)}\right|>\epsilon\right)\leq\frac{1}{n^{2}\epsilon^{2}}\sum_{i=1}^{n}{E((X_{i}-\mu)^{2})}=\frac{\sigma^{2}}{n\epsilon^{2}}이고 극한 n\,\rightarrow\,\infty을 취하면 결과를 얻는다.
큰 수의 강법칙(strong law of large numbers) X_{1},\,...,\,X_{n}이 서로 독립이고 분포가 동일하며 평균이 \mu인 L^{1}확률변수라고 하자.S_{n}=\sum_{i=1}^{n}{S_{i}}라고 하면 n\,\rightarrow\,\infty일 때 \displaystyle\frac{1}{n}S_{n}\,\rightarrow\,\mu\,a.s.이다.
중심극한정리(central limit theorem) X_{1},\,...,\,X_{n}이 독립이고 동일한 분포를 갖는 L^{2}확률변수이고 평균이 \mu, 분산이 \sigma^{2}이라 하자. 그러면 다음이 성립하고\lim_{n\,\rightarrow\,\infty}{P\left(\frac{S_{n}-n\mu}{\sigma\sqrt{n}}\leq x\right)}=\Phi(x)여기서 \Phi(x)는 표준정규분포의 누적분포함수이다.
두 확률변수 X,\,Y에 대해 공분산(covariance)을\text{Cov}(X,\,Y)=E((X-E(X))(Y-E(Y)))으로, 상관계수(correlation)를\rho(X,\,Y)=\frac{\text{Cov}(X,\,Y)}{\sqrt{\text{Var}(X)}\sqrt{\text{Var}(Y)}}로 정의한다.
확률변수 X,\,Y,\,Z에 대해 다음의 성질이 성립한다.
(1) \text{Cov}(X,\,Y)=\text{Cov}(Y,\,X)
(2) \text{Cov}(X,\,X)=\text{Var}(X)
(3) \text{Cov}(X,\,Y)=E(XY)-E(X)E(Y)
(4) \text{Cov}(X+Y,\,Z)=\text{Cov}(X,\,Z)+\text{Cov}(Y,\,Z)
(5) 상수 a에 대해 \text{Cov}(X,\,aY)=a\text{Cov}(X,\,Y)
(6) 상수 a에 대해 \text{Cov}(X,\,a)=0
위의 성질과 코시-슈바르츠 정리에 의해 -1\leq\rho(X,\,Y)\leq1이고 Y=aX+b일 때 다음이 성립한다.\rho(X,\,Y)=\begin{cases}1&\,a>0\\-1&\,a<0\end{cases}
참고자료:
금융수학의 방법론, 최건호, 경문사
'확률및통계 > 금융수학' 카테고리의 다른 글
[금융수학] 10. 확률과정, 브라운운동 (0) | 2020.08.29 |
---|---|
[금융수학] 9. 조건부 기댓값 (0) | 2020.08.28 |
[금융수학] 7. 르베그 측도 (0) | 2020.08.26 |
[금융수학] 6. 거리공간 (0) | 2020.08.25 |
[금융수학] 5. 미분방정식 (0) | 2020.08.24 |