[수리통계학] 4. 확률변수와 분포(2)
두 확률변수 X,Y의 결합누적분포함수(joint cumulative distribution function)는F(x,y)=P(X≤x,Y≤y)로 정의된다.
(a) X,Y가 이산확률변수이면, X,Y의 결합누적분포함수는 F(x,y)=∑s≤x∑t≤yf(s,t)이고,
(b) X,Y가 연속확률변수이면, X,Y의 의 결합누적분포함수는 F(x,y)=∫x−∞∫y−∞f(s,t)dtds이다.
X,Y가 이산확률변수이고, f(x,y)가 결합확률질량함수일 때, X가 취하는 값인 x와 Y가 취하는 값인 y에 대해 함수g(x)=∑yf(x,y),h(y)=∑xf(x,y)를 각각 X와 Y의 주변확률질량함수(marginal probability mass function)라고 한다.
3개의 아스피린과, 4개의 완화제, 2개의 진정제 중에서 2개를 고를 때, X를 아스피린의 개수, Y를 진정제의 개수라고 하면, 결합확률질량함수는f(x,\,y)=\frac{\displaystyle\binom{3}{x}\binom{2}{y}\binom{4}{2-x-y}}{\displaystyle\binom{9}{2}}\,(x=0,\,1,\,2,\,y=0,\,1,\,2,\,0\leq x+y\leq2)이고, 각 경우에 따른 확률은 다음 표와 같다.
|
x=0 |
x=1 |
x=2 |
계 |
y=0 |
\displaystyle\frac{1}{6} |
\displaystyle\frac{1}{3} |
\displaystyle\frac{1}{12} |
\displaystyle\frac{7}{12} |
y=1 |
\displaystyle\frac{2}{9} |
\displaystyle\frac{1}{6} |
0 |
\displaystyle\frac{7}{18} |
y=2 |
\displaystyle\frac{1}{36} |
0 |
0 |
\displaystyle\frac{1}{36} |
계 |
\displaystyle\frac{5}{12} |
\displaystyle\frac{1}{2} |
\displaystyle\frac{1}{12} |
1 |
열의 합계는 X=0,\,1,\,2일 확률이고 다음과 같이 나타낼 수 있다.g(x)=\sum_{y=0}^{2}{f(x,\,y)}\,(x=0,\,1,\,2)
같은 방법으로 행의 합계는 Y=0,\,1,\,2일 확률이고 다음과 같이 나타낼 수 있다.h(y)=\sum_{x=0}^{2}{f(x,\,y)}\,(y=0,\,1,\,2)
X와 Y가 연속확률변수이고 f(x,\,y)가 결합확률밀도함수일 때, 함수g(x)=\int_{-\infty}^{\infty}{f(x,\,y)dy},\,h(y)=\int_{-\infty}^{\infty}{f(x,\,y)dx}\,(-\infty<x,\,y<\infty)를 각각 X와 Y의 주변확률밀도함수(marginal probability density function)라고 한다.
다음의 결합확률밀도함수f(x,\,y)=\begin{cases}\displaystyle\frac{2}{3}(x+2y),&\,(0<x<1,\,0<y<1)\\0,&\,(\text{otherwise})\end{cases}에 대해 X와 Y의 주변확률밀도함수를 구하면\begin{align*}g(x)&=\int_{-\infty}^{\infty}{f(x,\,y)dy}=\int_{0}^{1}{\frac{2}{3}(x+2y)dy}=\frac{2}{3}(x+1)\\h(y)&=\int_{-\infty}^{\infty}{f(x,\,y)dy}=\int_{0}^{1}{\frac{2}{3}(x+2y)dx}=\frac{1}{3}(1+4y)\end{align*}이다. 위의 함수는 모두 0<x<1,\,0<y<1인 경우이고, 그 이외의 경우는 0이다.
두 이산확률변수 X,\,Y의 결합확률질량함수를 f(x,\,y)라 하자.
X가 취하는 값인 x와 Y가 취하는 값인 y에 대한 X,\,Y의 조건부확률질량함수(conditional probability mass function)는f(x|y)=\frac{f(x,\,y)}{f_{Y}(y)},\,f(y|x)=\frac{f(x,\,y)}{f_{X}(x)}이고, 여기서 f_{X}(x)(>0)와 f_{Y}(y)(>0)는 각각 X와 Y에 대한 주변확률질량함수이다.
앞의 예(아스피린, 진정제, 완화제 문제)에서f(X=0|Y=1)=\frac{\frac{2}{9}}{\frac{7}{18}}=\frac{4}{7},\,f(X=1|Y=1)=\frac{\frac{1}{6}}{\frac{7}{18}}=\frac{3}{7},\,f(X=2|Y=1)=\frac{0}{\frac{7}{18}}=0이다.
두 연속확률변수 X,\,Y의 결합확률밀도함수를 f(x,\,y)라 하자.
X가 취하는 값인 x와 Y가 취하는 값인 y에 대해서 Y=y가 주어졌을 때의 X의 조건부확률밀도함수(conditional probability density function) f(x|y)와 X=x가 주어졌을 때의 Y의 조건부확률밀도함수 f(y|x)는 다음과 같다.f(x|y)=\frac{f(x,\,y)}{h(y)},\,f(y|x)=\frac{f(x,\,y)}{g(x)}\,(g(x)\neq0,\,h(y)\neq0)여기서 g(x)(>0)와 h(y)(>0)는 각각 X와 Y에 대한 주변확률밀도함수이다.
앞의 예(주변확를밀도함수를 구하는 문제)에서 Y=y로 주어진 X의 조건부확률밀도함수는\begin{align*}f(x|y)&=\frac{f(x,\,y)}{h(y)}=\frac{\frac{2}{3}(x+2y)}{\frac{1}{3}(1+4y)}\\&=\frac{2x+4y}{1+4y}\,(0<x<1)\end{align*}이고, 그 이외의 경우는 f(x|y)=0이다.f\left(x|\frac{1}{2}\right)=\frac{2x+4\cdot\frac{1}{2}}{1+4\cdot\frac{1}{2}}=\frac{2}{3}(x+1)이므로P\left(X\leq\frac{1}{2}|Y=\frac{1}{2}\right)=\int_{0}^{\frac{1}{2}}{\frac{2}{3}(x+1)dx}=\frac{5}{12}이다.
확률변수 X,\,Y가 독립일 필요충분조건은
(a) 이산확률변수의 경우, 결합확률질량함수 f(x,\,y)가 주변확률질량함수 f_{X}(x),\,f_{Y}(y)의 곱으로 나타내어지는 것이다. 즉f(x,\,y)=f_{X}(x)f_{Y}(y)
(b) 연속확률변수의 경우, 결합확률밀도함수 f(x,\,y)가 주변확률밀도함수 g(x),\,h(y)의 곱으로 나타내어지는 것이다. 즉f(x,\,y)=g(x)h(y)
참고자료:
Johh E Freund's Mathematical Statistics with Applications 8th edition, Irwon Miller, Marylees Miller, Pearson
Introduction to Mathematical Statistics 7th edition, Hogg, McKean, Craig, Pearson
수리통계학, 허문열, 송문섭, 박영사
'확률및통계 > 수리통계학' 카테고리의 다른 글
[수리통계학] 6. 이산확률변수와 관련된 분포들 (0) | 2018.11.21 |
---|---|
[수리통계학] 5. 기댓값과 적률, 공분산, 조건부기댓값 (0) | 2018.11.20 |
[수리통계학] 3. 확률변수와 분포(1) (0) | 2018.11.18 |
[수리통계학] 2. 확률 (0) | 2018.11.17 |
[수리통계학] 1. 표본공간과 사건, 순열과 조합, 이항계수 (0) | 2018.11.16 |