[수리통계학] 4. 확률변수와 분포(2)
두 확률변수 X,Y의 결합누적분포함수(joint cumulative distribution function)는F(x,y)=P(X≤x,Y≤y)로 정의된다.
(a) X,Y가 이산확률변수이면, X,Y의 결합누적분포함수는 F(x,y)=∑s≤x∑t≤yf(s,t)이고,
(b) X,Y가 연속확률변수이면, X,Y의 의 결합누적분포함수는 F(x,y)=∫x−∞∫y−∞f(s,t)dtds이다.
X,Y가 이산확률변수이고, f(x,y)가 결합확률질량함수일 때, X가 취하는 값인 x와 Y가 취하는 값인 y에 대해 함수g(x)=∑yf(x,y),h(y)=∑xf(x,y)를 각각 X와 Y의 주변확률질량함수(marginal probability mass function)라고 한다.
3개의 아스피린과, 4개의 완화제, 2개의 진정제 중에서 2개를 고를 때, X를 아스피린의 개수, Y를 진정제의 개수라고 하면, 결합확률질량함수는f(x,y)=(3x)(2y)(42−x−y)(92)(x=0,1,2,y=0,1,2,0≤x+y≤2)이고, 각 경우에 따른 확률은 다음 표와 같다.
|
x=0 |
x=1 |
x=2 |
계 |
y=0 |
16 |
13 |
112 |
712 |
y=1 |
29 |
16 |
0 |
718 |
y=2 |
136 |
0 |
0 |
136 |
계 |
512 |
12 |
112 |
1 |
열의 합계는 X=0,1,2일 확률이고 다음과 같이 나타낼 수 있다.g(x)=2∑y=0f(x,y)(x=0,1,2)
같은 방법으로 행의 합계는 Y=0,1,2일 확률이고 다음과 같이 나타낼 수 있다.h(y)=2∑x=0f(x,y)(y=0,1,2)
X와 Y가 연속확률변수이고 f(x,y)가 결합확률밀도함수일 때, 함수g(x)=∫∞−∞f(x,y)dy,h(y)=∫∞−∞f(x,y)dx(−∞<x,y<∞)를 각각 X와 Y의 주변확률밀도함수(marginal probability density function)라고 한다.
다음의 결합확률밀도함수f(x,y)={23(x+2y),(0<x<1,0<y<1)0,(otherwise)에 대해 X와 Y의 주변확률밀도함수를 구하면g(x)=∫∞−∞f(x,y)dy=∫1023(x+2y)dy=23(x+1)h(y)=∫∞−∞f(x,y)dy=∫1023(x+2y)dx=13(1+4y)이다. 위의 함수는 모두 0<x<1,0<y<1인 경우이고, 그 이외의 경우는 0이다.
두 이산확률변수 X,Y의 결합확률질량함수를 f(x,y)라 하자.
X가 취하는 값인 x와 Y가 취하는 값인 y에 대한 X,Y의 조건부확률질량함수(conditional probability mass function)는f(x|y)=f(x,y)fY(y),f(y|x)=f(x,y)fX(x)이고, 여기서 fX(x)(>0)와 fY(y)(>0)는 각각 X와 Y에 대한 주변확률질량함수이다.
앞의 예(아스피린, 진정제, 완화제 문제)에서f(X=0|Y=1)=29718=47,f(X=1|Y=1)=16718=37,f(X=2|Y=1)=0718=0이다.
두 연속확률변수 X,Y의 결합확률밀도함수를 f(x,y)라 하자.
X가 취하는 값인 x와 Y가 취하는 값인 y에 대해서 Y=y가 주어졌을 때의 X의 조건부확률밀도함수(conditional probability density function) f(x|y)와 X=x가 주어졌을 때의 Y의 조건부확률밀도함수 f(y|x)는 다음과 같다.f(x|y)=f(x,y)h(y),f(y|x)=f(x,y)g(x)(g(x)≠0,h(y)≠0)여기서 g(x)(>0)와 h(y)(>0)는 각각 X와 Y에 대한 주변확률밀도함수이다.
앞의 예(주변확를밀도함수를 구하는 문제)에서 Y=y로 주어진 X의 조건부확률밀도함수는f(x|y)=f(x,y)h(y)=23(x+2y)13(1+4y)=2x+4y1+4y(0<x<1)이고, 그 이외의 경우는 f(x|y)=0이다.f(x|12)=2x+4⋅121+4⋅12=23(x+1)이므로P(X≤12|Y=12)=∫12023(x+1)dx=512이다.
확률변수 X,Y가 독립일 필요충분조건은
(a) 이산확률변수의 경우, 결합확률질량함수 f(x,y)가 주변확률질량함수 fX(x),fY(y)의 곱으로 나타내어지는 것이다. 즉f(x,y)=fX(x)fY(y)
(b) 연속확률변수의 경우, 결합확률밀도함수 f(x,y)가 주변확률밀도함수 g(x),h(y)의 곱으로 나타내어지는 것이다. 즉f(x,y)=g(x)h(y)
참고자료:
Johh E Freund's Mathematical Statistics with Applications 8th edition, Irwon Miller, Marylees Miller, Pearson
Introduction to Mathematical Statistics 7th edition, Hogg, McKean, Craig, Pearson
수리통계학, 허문열, 송문섭, 박영사
'확률및통계 > 수리통계학' 카테고리의 다른 글
[수리통계학] 6. 이산확률변수와 관련된 분포들 (0) | 2018.11.21 |
---|---|
[수리통계학] 5. 기댓값과 적률, 공분산, 조건부기댓값 (0) | 2018.11.20 |
[수리통계학] 3. 확률변수와 분포(1) (0) | 2018.11.18 |
[수리통계학] 2. 확률 (0) | 2018.11.17 |
[수리통계학] 1. 표본공간과 사건, 순열과 조합, 이항계수 (0) | 2018.11.16 |