Loading [MathJax]/jax/output/HTML-CSS/jax.js

반응형

[금융통계학] 2. 확률과 확률변수



확률


확률을 정의하기 위해서는 표본공간(sample space)과 사건(event)을 정의해야 한다. 표본공간은 어떤 임의의 실험(random experiment)(또는 시행(trial))에서 가능한 결과들의 집합이고, 사건은 표본공간의 부분집합으로써 특정한 실험이 일어나는 결과들의 집합이다.

동전던지기를 한 번 시행했을 때, 결과는 앞면(H) 또는 뒷면(T) 뿐이므로 이 실험의 표본공간은 S={H,T}이고, 동전던지기를 두 번 시행했을 때, 결과는 HH, HT, TH, TT이므로, 이 실험의 표본공간은 S={HH,HT,TH,TT}이다. 두 경우 모두 이산형 표본공간이다.

주가는 전일 대비 상하 15% 범위 이내로 움직이도록 제한되어있다. 그러면 어느 기업의 주가의 단순수익률의 표본공간은 S={r|15%r15%}이고, 연속형 표본공간이다.

표본공간 S의 두 사건 A,B에 대하여 합사건을 AB, 곱사건을 AB, 여사건을 Ac, 배반사건(상호 배반)을 AB,AB=으로 정의한다.


표본공간 S의 원소가 n개이고, 사건 A의 원소의 개수가 k개 이면, 사건 A가 일어날 확률(probability)은P(A)=kn이다. 이것은 확률의 고전적 정의이다.

고전적 확률의 정의를 이용하여 동전을 두 번 던졌을 때, 앞면이 두 번 나올 확률을 계산하자. 이 사건을 A라고 하면, A={HH}, S={HH,HT,TH,TT}이므로 P(A)=14이다.


표본공간 S 의 부분집합인 사건 A에 대한 확률 P(A)는 다음의 세 공리들을 만족시킨다.

(1) 0P(A)1

(2) P(S)=1

(3) 배반사건 A1,A2,,Ai,에 대하여P(i=1Ai)=i=1P(Ai)이 성질들을 공리적 확률이라고 한다.


표본공간 S와 사건 A,B에 대하여 다음 성질들이 성립한다.

(1) P(Ac)=1P(A)

(2) P(AB)=P(ABc)=P(A)P(AB)

(3) P(AB)=P(A)+P(B)P(AB)

공리적 확률의 성질을 이용하여 위의 성질들을 증명할 수 있다.

(1): S=AAc이고, AAc는 배반사건이므로1=P(S)=P(AAc)=P(A)+P(Ac)이고 따라서 P(Ac)=1P(A)이다.

(2): A=(AB)(ABc)이고 ABABc는 배반사건이므로P(A)=P((AB)(ABc))=P(AB)+P(ABc)이고 따라서 P(AB)=P(ABc)=P(A)P(AB)이다.

(3): AB=(ABc)B이고 ABcB는 배반사건이므로P(AB)=P(ABc)+P(B)이고, (2)에 의해 P(ABc)=P(A)P(AB)이므로 따라서 P(AB)=P(A)+P(B)P(AB)이다.

(3)을 다음과 같이 확장할 수 있다.P(ABC)=P(A)+P(B)+P(C)P(AB)P(BC)P(AC)+P(ABC)


어느 은행의 예금자 중에서 예금 비율이 5%이상 증가한 예금자의 비율은 20%이고, 예금자 중에서 대출이 5%이상 증가한 예금자의 비율은 30%, 예금 비율이 5%이상 증가하고 대출이 5%이상 증가한 예금자의 비율은 10%이다.

은행 예금자 중에서 예금 비율이 5%이상 증가하는 사건을 A, 예금자 중에서 대출이 5%이상 증가하는 사건을 B라고 하자. 그러면P(A)=0.2,P(B)=0.3,P(AB)=0.1이므로P(AB)=P(A)+P(B)P(AB)=0.4이다.


표본공간 S와 사건 A,B에 대하여 사건 B가 일어났다는 조건 하에서 사건 A가 발생할 확률을 사건 B에서의 사건 A의 조건부 확률(conditional probability)이라 하고,P(A|B)=P(AB)P(B)로 정의된다. 이때P(AB)=P(A)P(B|A)=P(B)P(A|B)가 성립하고 이것을 다음과 같이 확장할 수 있다.P(ABC)=P(A)P(B|A)P(C|AB)


경제활동이 위축될 통계적 확률이 18%, 이 상황에서 장기채권의 수익률이 하락할 확률이 76%라고 한다.

경제활동이 위축되는 사건을 A, 장기채권의 수익률이 하락하는 사건을 B라고 하면,P(A)=0.18,P(B|A)=0.76이므로P(AB)=P(A)P(B|A)=0.137이다.


두 사건 A,B에 대하여 P(A|B)=P(A) 또는 P(B|A)=P(B)이면, 두 사건 A,B를 독립(independent)이라고 한다. 즉, 사건 A(B)가 일어날 확률이 사건 B(A)에 관계없이 일정하면, AB는 독립이라고 하고 이때 다음 등식이 성립한다.P(AB)=P(A)P(B)


사건 A에서의 사건 B의 조건부 확률은 P(B|A)이고, 다음과 같이 나타낼 수 있다.P(B|A)=P(AB)P(A)=P(A|B)P(B)P(A|B)P(B)+P(A|Bc)P(Bc)

이 식을 다음과 같이 확장할 수 있다. B1,,Bn을 표본공간의 분할이라 하자. 그러면 사건 A에서의 사건 Bk의 조건부 확률은P(Bk|A)=P(ABk)P(A)=P(A|Bk)P(Bk)ni=1P(A|Bi)P(Bi)이고, 이것을 베이즈 정리(Bayes' theorem)라고 한다.


어느 산업단지에 입주한 기업등 중의 5%가 도산한다고 한다. 모 은행에서 이 산업단지에 입주한 기업들의 도산 가능성을 조사하기 위해 신용평가기관을 통해 조사한 결과, 최근 1년간 도산한 기업 중 불량으로 판정된 기업은 95%, 최근 1년간 도산하지 않은 기업 중 우량으로 판정된 기업은 90%이다.

기업이 도산하는 사건을 B, 도산하지 않는 사건을 Bc, 신용평가기관의 조사 결과 불량으로 판정되는 사건을 N, 우량으로 판정되는 사건을 G라고 하면,P(B)=0.05,P(Bc)=0.95,P(N|B)=0.95,P(G|B)=0.05,P(N|Bc)=0.1,P(G|Bc)=0.9이다.

그러면 이 산업단지에 입주한 기업의 신용평가 조사결과가 불량으로 판정되었을 때, 도산할 확률은P(B|N)=P(BN)P(N)=P(N|B)P(B)P(N|B)P(B)+P(N|Bc)P(Bc)=0.950.050.950.05+0.100.95=13이고, 신용평가 조사결과가 우량으로 판정되었을 때, 도산하지 않을 확률을P(Bc|G)=P(BcG)P(G)=P(G|Bc)P(Bc)P(G|B)P(G)+P(G|Bc)P(Bc)=0.900.950.050.05+0.900.95=342343이다.


확률변수


확률변수(random variable)는 표본공간에 있는 실험(또는 실행)의 결과를 숫자로 나타내는 함수이다. 즉 확률변수는 표본공간의 각 원소들을 실수로 대응하는 함수이다. 확률변수는 특정한 값으로 나타낼 수 있는 이산(discrete)확률변수와 일정한 범위 안에서 연속적인 값을 취하는 연속(continuous)확률변수로 구분된다. 동전 앞면의 수는 이산확률변수이고, 키, 몸무게, 시간은 연속확률변수이다. 참고로 연속확률변수가 하나의 가질 확률은 0이다.


이산확률변수 X의 확률분포가 다음과 같다고 하자.

X 

x1 

x2 

 

xn 

계 

P(X=xi) 

p1 

p2 

 

pn 

1 

P(X=xi)=pi를 확률질량함수(probability mass function)라고 하고, 이때 ni=1P(X=xi)=1이다.


연속확률변수 X의 경우는 P(xXx+dx)=f(x)dx인 함수 f(x)(0)를 연속확률변수 X의 확률밀도함수(probability density function)라고 하고, 이때f(x)dx=1,P(aXb)=baf(x)dx이다.


확률변수 X의 누적분포함수(cumulative distribution function)을 다음과 같이 정의한다.F(x)=P(Xx)X가 이산확률변수이면,F(x)=P(Xx)=txP(X=t)연속확률변수이면,F(x)=P(Xx)=xf(t)dt이다.


참고자료:

기초 금융통계, 박유성, 김기환, 자유아카데미

금융인을 위한 통계분석, 이긍희, 한국금융연수원

재무위험관리사(1: 금융통계학), 금융투자교육원, 한국금융투자협회       

반응형
Posted by skywalker222