Loading [MathJax]/jax/output/HTML-CSS/jax.js

반응형

[수리통계학] 4. 확률변수와 분포(2)



두 확률변수 X,Y의 결합누적분포함수(joint cumulative distribution function)는F(x,y)=P(Xx,Yy)로 정의된다.


(a) X,Y가 이산확률변수이면, X,Y의 결합누적분포함수는 F(x,y)=sxtyf(s,t)이고,

(b) X,Y가 연속확률변수이면, X,Y의 의 결합누적분포함수는 F(x,y)=xyf(s,t)dtds이다.    

 

X,Y가 이산확률변수이고, f(x,y)가 결합확률질량함수일 때, X가 취하는 값인 xY가 취하는 값인 y에 대해 함수g(x)=yf(x,y),h(y)=xf(x,y)를 각각 XY의 주변확률질량함수(marginal probability mass function)라고 한다. 


3개의 아스피린과, 4개의 완화제, 2개의 진정제 중에서 2개를 고를 때, X를 아스피린의 개수, Y를 진정제의 개수라고 하면, 결합확률질량함수는f(x,y)=(3x)(2y)(42xy)(92)(x=0,1,2,y=0,1,2,0x+y2)이고, 각 경우에 따른 확률은 다음 표와 같다.

 

x=0 

x=1 

x=2 

계 

y=0 

16 

13 

112 

712 

y=1 

29 

16 

0 

718 

y=2 

136 

0 

0 

136 

계 

512 

12 

112 

1 

열의 합계는 X=0,1,2일 확률이고 다음과 같이 나타낼 수 있다.g(x)=2y=0f(x,y)(x=0,1,2) 

같은 방법으로 행의 합계는 Y=0,1,2일 확률이고 다음과 같이 나타낼 수 있다.h(y)=2x=0f(x,y)(y=0,1,2)


XY가 연속확률변수이고 f(x,y)가 결합확률밀도함수일 때, 함수g(x)=f(x,y)dy,h(y)=f(x,y)dx(<x,y<)를 각각 XY의 주변확률밀도함수(marginal probability density function)라고 한다.


다음의 결합확률밀도함수f(x,y)={23(x+2y),(0<x<1,0<y<1)0,(otherwise)에 대해 XY의 주변확률밀도함수를 구하면g(x)=f(x,y)dy=1023(x+2y)dy=23(x+1)h(y)=f(x,y)dy=1023(x+2y)dx=13(1+4y)이다. 위의 함수는 모두 0<x<1,0<y<1인 경우이고, 그 이외의 경우는 0이다.


두 이산확률변수 X,Y의 결합확률질량함수를 f(x,y)라 하자.

X가 취하는 값인 xY가 취하는 값인 y에 대한 X,Y의 조건부확률질량함수(conditional probability mass function)f(x|y)=f(x,y)fY(y),f(y|x)=f(x,y)fX(x)이고, 여기서 fX(x)(>0)fY(y)(>0)는 각각 XY에 대한 주변확률질량함수이다.


앞의 예(아스피린, 진정제, 완화제 문제)에서f(X=0|Y=1)=29718=47,f(X=1|Y=1)=16718=37,f(X=2|Y=1)=0718=0이다.


두 연속확률변수 X,Y의 결합확률밀도함수를 f(x,y)라 하자.

X가 취하는 값인 xY가 취하는 값인 y에 대해서 Y=y가 주어졌을 때의 X의 조건부확률밀도함수(conditional probability density function) f(x|y)X=x가 주어졌을 때의 Y의 조건부확률밀도함수 f(y|x)는 다음과 같다.f(x|y)=f(x,y)h(y),f(y|x)=f(x,y)g(x)(g(x)0,h(y)0)여기서 g(x)(>0)h(y)(>0)는 각각 XY에 대한 주변확률밀도함수이다.


앞의 예(주변확를밀도함수를 구하는 문제)에서 Y=y로 주어진 X의 조건부확률밀도함수는f(x|y)=f(x,y)h(y)=23(x+2y)13(1+4y)=2x+4y1+4y(0<x<1)이고, 그 이외의 경우는 f(x|y)=0이다.f(x|12)=2x+4121+412=23(x+1)이므로P(X12|Y=12)=12023(x+1)dx=512이다.


확률변수 X,Y가 독립일 필요충분조건은

(a) 이산확률변수의 경우, 결합확률질량함수 f(x,y)가 주변확률질량함수 fX(x),fY(y)의 곱으로 나타내어지는 것이다. 즉f(x,y)=fX(x)fY(y)

(b) 연속확률변수의 경우, 결합확률밀도함수 f(x,y)가 주변확률밀도함수 g(x),h(y)의 곱으로 나타내어지는 것이다. 즉f(x,y)=g(x)h(y)


참고자료:

Johh E Freund's Mathematical Statistics with Applications 8th edition, Irwon Miller, Marylees Miller, Pearson

Introduction to Mathematical Statistics 7th edition, Hogg, McKean, Craig, Pearson

수리통계학, 허문열, 송문섭, 박영사  

반응형
Posted by skywalker222