반응형

7. 연속확률변수와 관련된 분포들



연속확률변수 \(X\)의 확률밀도함수가 다음과 같을 때, \(X\)는 균등분포(uniform distribution)를 따른다고 한다.$$f(x)=\begin{cases}\frac{1}{\beta-\alpha},&\,(\alpha<x<\beta)\\0,&\,(\text{otherwise})\end{cases}$$여기서 \(\alpha,\,\beta\)는 \(\alpha<\beta\)인 상수이고,$$\begin{align*}\mu&=E(X)=\int_{\alpha}^{\beta}{\frac{1}{\beta-\alpha}xdx}=\frac{1}{2}(\alpha+\beta)\\ \sigma^{2}&=\text{Var}(X)=E(X^{2})-\{E(X)\}^{2}=\frac{(\beta-\alpha)^{2}}{12}\,\left(\because\,E(X^{2})=\frac{\beta^{3}-\alpha^{3}}{3(\beta-\alpha)}=\frac{\beta^{2}+\beta\alpha+\alpha^{2}}{3}\right)\end{align*}$$이다.

(균등분포의 확률밀도함수의 그래프)


다음의 함수$$f(x)=\begin{cases}kx^{\alpha-1}e^{-\frac{x}{\beta}},&\,(x>0)\\0,&\,(\text{otherwise})\end{cases}\,(\alpha,\,\beta>0)$$의 적분이 \(1\)이 되게 하는 \(k\)를 구하자.$$\int_{-\infty}^{\infty}{f(x)dx}=\int_{0}^{\infty}{kx^{\alpha-1}e^{-\frac{x}{\beta}}dx}=k\beta^{\alpha}\int_{0}^{\infty}{y^{\alpha-1}e^{-y}dy}\,(x=\beta y)$$이 적분식의 오른쪽은 다음과 같이 정의되는 감마함수(gamma function)이다.$$\Gamma(\alpha)=\int_{0}^{\infty}{y^{\alpha-1}e^{-y}dy},\,(\alpha>0)$$ $$\int_{0}^{\infty}{kx^{\alpha-1}e^{-\frac{x}{\beta}}dx}=k\beta^{\alpha}\Gamma(\alpha)=1$$이어야 하므로 \(\displaystyle k=\frac{1}{\beta^{\alpha}\Gamma(\alpha)}\)이고, 이 결과를 이용하여 다음과 같이 감마분포(gamma distribution)를 정의할 수 있다.


연속확률변수 \(X\)의 확률밀도함수가 다음과 같을 때, \(X\)는 감마분포를 따른다고 한다.$$f(x)=\begin{cases}\displaystyle\frac{1}{\Gamma(\alpha)}x^{\alpha-1}e^{-\frac{x}{\beta}},&\,(x>0)\\0,&\,(\text{otherwise})\,(\alpha,\,\beta>0)\end{cases}$$

(감마분포의 확률밀도함수의 그래프)


감마분포의 적률생성함수는 \(M_{X}(t)=(1-\beta t)^{-\alpha}\,(\alpha,\,\beta>0)\)이다.

증명: \(X\)를 감마분포를 따르는 연속확률변수라고 하면$$\begin{align*}E(e^{tX})&=\int_{-\infty}^{\infty}{e^{tx}f(x)}=\frac{1}{\beta^{\alpha}\Gamma(\alpha)}\int_{0}^{\infty}{e^{tx}x^{\alpha-1}e^{-\frac{x}{\beta}}dx}\\&=\frac{1}{\beta^{\alpha}\Gamma(\alpha)}\int_{-\infty}^{\infty}{x^{\alpha-1}e^{\frac{-(\beta t-1)x}{\beta}}dx}\\&=\frac{1}{\beta^{\alpha}\Gamma(\alpha)}\Gamma(\alpha)\left(\frac{\beta}{1-\beta t}\right)^{\alpha}\\&=(1-\beta t)^{-\alpha}\end{align*}$$이므로 따라서 \(M_{X}(t)=(1-\beta t)^{-\alpha}\)이다.


감마분포의 적률생성함수를 이용하여 평균과 분산을 구하면 다음과 같다.$$\begin{align*}\mu&=E(X)=\alpha\beta\\ \sigma^{2}&=\text{Var}(X)=E(X^{2})-\{E(X)\}^{2}=\alpha\beta^{2}\end{align*}$$


연속확률변수 \(X\)의 확률밀도함수가 다음과 같을 때, \(X\)는 지수분포(exponential distribution)를 따른다고 한다.$$f(x)=\begin{cases}\frac{1}{\lambda}e^{-\frac{x}{\lambda}},&\,(x>0)\\0,&\,(\text{otherwise})\end{cases}$$

지수분포는 감마분포에서 \(\alpha=1,\,\beta=\lambda\)인 경우이다. 그러면 지수분포의 적률생성함수와 평균, 분산은 다음과 같다.$$\begin{align*}M_{X}(t)&=\frac{1}{1-\lambda t}\\ \mu&=E(X)=\lambda\\ \sigma^{2}&=\text{Var}(X)=\lambda^{2}\end{align*}$$


연속확률변수 \(X\)의 확률밀도함수가 다음과 같을 때, \(X\)는 평균이 \(\mu\)이고, 분산이 \(\sigma^{2}\)인 정규분포(normal distribution)를 따른다고 하고 \(X\,\sim\,N(\mu,\,\sigma^{2})\)로 나타낸다.$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}$$

(정규분포의 확률밀도함수의 그래프)


정규분포를 따르는 확률변수의 확률밀도함수의 적분이 \(1\)이 됨을 보이자. \(\displaystyle z=\frac{x-\mu}{\sigma}\)라 하면$$\begin{align*}\int_{-\infty}^{\infty}{\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}dx}=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty}{e^{-\frac{1}{2}z^{2}}dz}\end{align*}$$이고, \(\displaystyle\int_{-\infty}^{\infty}{e^{-\frac{z^{2}}{2}}dz}=\sqrt{2\pi}\)이므로 따라서$$\int_{-\infty}^{\infty}{\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{(x-\mu)^{2}}{2\sigma}}dx}=1$$이다.


정규분포를 따르는 확률변수 \(X\)의 적률생성함수는 다음과 같다.$$M_{X}(t)=e^{\mu t+\frac{1}{2}\sigma^{2}t^{2}}$$

증명:$$\begin{align*}M_{X}(t)&=\int_{-\infty}^{\infty}{e^{tx}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}dx}\\&=\int_{-\infty}^{\infty}{\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{-2tx\sigma^{2}+(x-\mu)^{2}}{2\sigma^{2}}}dx}\\&=e^{\mu t+\frac{1}{2}\sigma^{2}t^{2}}\int_{-\infty}^{\infty}{\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-(\mu+t\sigma^{2})^{2})}{2\sigma^{2}}}dx}\\&=e^{\mu t+\frac{1}{2}\sigma^{2}t^{2}}\end{align*}$$


적률생성함수를 이용하여 평균과 분산을 구하면$$\begin{align*}E(X)&=\mu\\ \text{Var}(X)&=\sigma^{2}\end{align*}$$이다.


\(\mu=0,\,\sigma=1\)인 정규분포를 표준정규분포(standard normal distribution)이라 한다. 이때의 확률변수는 \(\displaystyle Z=\frac{X-\mu}{\sigma}\)이고, \(Z\,\sim\,N(0,\,1^{2})\)로 나타낸다. 표준정규분포의 누적분포함수는 다음과 같다.$$P(Z\leq z)=\int_{-\infty}^{z}{\frac{1}{\sqrt{2\pi}}e^{-\frac{x^{2}}{2}}dx}$$표준정규분포의 확률밀도함수는 우함수이므로$$\int_{-\infty}^{0}{\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}dz}=\int_{0}^{\infty}{\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}dz}=0.5$$이다.  


참고자료:

John E Freund's Mathematical Statistics 8th edition, Irwon Miller, Marylees Miller, Pearson

수리통계학, 허문열, 송문섭, 박영사

http://www.math.ntu.edu.tw/~hchen/teaching/StatInference/notes/lecture9.pdf 

반응형
Posted by skywalker222