반응형

[수리통계학] 14. 가설검정



하나 이상의 확률표본들의 분포에 대한 어떤 주장 또는 추측을 통계적 가설(statistical hypothesis)이라고 한다. 입증하고자 하는 가설을 대립가설(alternative hypothesis)이라고 하고 \(H_{1}\)로 나타내며, 대립가설이 참이라는 확실한 근거가 없을 때 받아들이는 가설을 귀무가설(null hypothesis)이라고 하고 \(H_{0}\)로 나타낸다. 귀무가설과 대립가설 중 하나를 채택하고 나머지를 기각하는 결정을 내리는 과정을 가설검정(hypothesis testing)이라 하고, 귀무가설 \(H_{0}\)을 기각시키는 검정통계량의 관측값의 영역을 기각역(critical region), 그 나머지 영역을 채택역(acceptance region)이라고 한다.

\(H:\,\theta=\theta_{0}\)처럼 모수값이 한 점으로 표시되는 가설을 단순가설(simple hypothesis), \(H:\,\theta>\theta_{0}\)처럼 모수값이 범위로 표시되는 가설을 복합가설(composite hypothesis)이라고 한다. 귀무가설을 단순가설로, 대립가설을 복합가설로 나타낸다.

가설검정을 할 때, 검정의 기준을 결정하는 통계량인 검정통계량(test statistic)을 구해서 귀무가설과 대립가설을 결정한다. 예를 들어서 모표준편차 \(\sigma\)가 알려진 정규모집단에서 가설검정을 할 때의 검정통계량은 \(\displaystyle Z=\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\)이고, 모표준편차가 알려지지 않은 30 미만의 표본수를 갖는 모집단에서 가설검정을 할 때의 검정통계량은 \(\displaystyle T=\frac{\overline{X}-\mu}{\frac{S}{\sqrt{n}}}\)이다.

가설검정을 하다 보면 다음의 두 종류의 오류가 발생한다.

(1) 귀무가설이 사실일 때 귀무가설을 기각하는 오류. 제 1종 오류(type I error)라고 하고 이 오류를 범할 확률을 \(\alpha\)로 나타낸다.

(2) 귀무가설이 거짓일 때 귀무가설을 채택하는 오류. 제 2종 오류(type II error)라고 하고 이 오류를 범할 확률을 \(\beta\)로 나타낸다.

위의 두 오류를 다음의 표로 나타낼 수 있다.

 검정결과\실제현상

\(H_{0}\)가 참 

\(H_{1}\)이 참 

\(H_{0}\)를 채택 

옳은 결정(오류 없음) 

제 2종 오류(\(\beta\)) 

\(H_{1}\)을 채택 

제 1종 오류(\(\alpha\)) 

옳은 결정(오류 없음) 

*참고: \(\alpha+\beta=1\)이므로 \(\alpha\)가 감소하면 \(\beta\)가 증가하고 반대로 \(\beta\)가 감소하면 \(\alpha\)가 증가한다.  

\(H_{0}\)가 사실일 때, 검정통계량이 기각역에 속할 확률을 기각역의 크기(size)라고 하고 따라서 기각역의 크기는 제 1종 오류를 범할 확률 \(\alpha\)이다. 이 확률 \(\alpha\)를 검정의 유의수준(level of significance)이라고 한다. 검정통계량의 관측값에 대하여 귀무가설 \(H_{0}\)를 기각할 수 있는 최소의 유의수준을 p값(p-value)이라고 한다.(아래 그림 참고)


다음의 순서대로 가설검정을 수행한다.

1. 귀무가설 \(H_{0}\)과 대립가설 \(H_{1}\)을 설정하고 \(\alpha\)를 설정한다.

2. 검정통계량의 표본분포를 이용하여 크기 \(\alpha\)의 기각역을 구한다.

3. 주어진 자료들을 이용하여 검정통계량의 값을 계산한다.

4. 검정통계량의 값이 기각역에 속하는지 확인하고, 그 결과로부터 귀무가설을 기각 또는 채택(또는 결정을 보류)한다.


가설검정을 할 때 \(H_{0}:\,\theta=\theta_{0},\,H_{1}:\,\theta\neq\theta_{0}\)인 경우를 양측대립가설(two-sided alternative)이라고 하고 이 때의 검정을 양쪽꼬리검정(two-tailed test)이라고 한다.(아래 그림 참고)

(위 그림에서 음영 부분은 양쪽꼬리검정의 기각역이다)


\(H_{0}:\,\theta=\theta_{0},\,H_{1}:\,\theta>\theta_{0}\) 또는 \(H_{0}:\,\theta=\theta_{0},\,H_{1}:\,\theta<\theta_{0}\)인 경우를 단측대립가설(one-sided alternative)이라고 하고 이 때의 검정을 한쪽꼬리검정(one-tailed test)이라고 한다.(아래 그림 참고)

(위 그림에서 음영 부분은 한쪽꼬리검정의 기각역이다. 왼쪽 그림은 \(H_{1}:\,\mu>\mu_{0}\)의 기각역을 나타낸 것이고, 오른쪽 그림은 \(H_{1}:\,\mu<\mu_{0}\)의 기각역을 나타낸 것이다.)


어느 제과점에서 제조된 8온스의 과자 묶음의 표준편차는 0.16온스라고 한다. 이 과자 묶음이 제대로 만들어졌는지(평균무게가 8온스 인지) 확인하기 위해 25개의 묶음(확률포본)을 추출했고, 이 표본들의 평균 무게가 \(\overline{x}=8.091\)임을 알아냈다. 

\(\mu>8\)이면 제과점이 손해를 보고 \(\mu<8\)이면 손님들이 손해를 보기 때문에 대립가설 \(\mu\neq8\)에 대해 귀무가설 \(\mu=8\)을 신뢰수준 \(0.01\)에서 위의 절차대로 검정을 하면

1. \(H_{0}:\,\mu=8,\,H_{1}:\,\mu\neq8\), \(\alpha=0.01\)

2. 검정통계량은 \(\displaystyle z=\frac{\overline{x}-\mu}{\frac{\sigma}{\sqrt{n}}}\)이고 \(z\leq-2.575(=-z_{0.005})\) 또는 \(z\geq2.575(=z_{0.005})\)이면 귀무가설을 기각한다.

3. \(\overline{x}=8.091,\,\mu=8,\,\sigma=0.16,\,n=25\)를 이용하여 검정통계량을 계산하면 \(\displaystyle z=\frac{8.091-8}{\frac{0.16}{\sqrt{25}}}=2.84\)이다.

4. \(z=2.84>2.575\)이므로 기각역에 있고 따라서 귀무가설을 기각한다(제조과정을 조정해야 한다).


특정 종류의 리본은 정해진 조건에 맞추기 위해 평균 185파운드의 내구력을 필요로 한다. 어떤 통에서 5개의 확률표본 리본의 내구력이 각각 171.6, 191.8, 178.3, 184.9, 189.1이면, 대립가설 \(\mu<185\)에 대한 귀무가설 \(\mu=185\)를 유의수준 \(0.05\)에서 위의 절차대로 검정을 하면

1. \(H_{0}:\,\mu=185,\,H_{1}:\,\mu<185\), \(\alpha=0.05\)

2. 검정통계량은 모표준편차를 모르기 때문에 \(\displaystyle t=\frac{\overline{x}-\mu}{\frac{s}{\sqrt{n}}}\)이고 \(t\leq-2.132(=-t_{0.05,\,4})\)이면 귀무가설을 기각한다.

3. 표본평균과 표본표준편차는 각각 \(\overline{x}=183.1,\,s=8.2\)이고, \(\mu=185,\,n=5\)이므로 검정통계량은 \(\displaystyle t=\frac{183.1-185}{\frac{8.2}{\sqrt{5}}}=-0.49\)이다.

4. \(t=-0.49>-2.132\)이므로 귀무가설을 기각할 수 없다. 또한 이 표본들이 정해진 조건을 만족시킨다고 하면 제 2종 오류를 범하게 된다.


담배회사에서 어떤 한 종류의 담배에 포함된 평균 니코틴 함유량이 다른 종류의 담배보다 0.20mg 많다는 것을 보이기 위해 실험한 결과 첫번째 종류의 \(n_{1}=50\)개의 담배의 평균 니코틴 함유량은 \(\overline{x}=2.61\text{mg}\), 표준편차는 \(s_{1}=0.12\text{mg}\)이고, 다른 종류의 \(n_{2}=40\)개의 담배의 평균 니코틴 함유량은 \(\overline{x}=2.38\text{mg}\), 표준편차는 \(s_{2}=0.14\text{mg}\)이다. 귀무가설 \(\mu_{1}-\mu_{2}=0.20\)을 대립가설 \(\mu_{1}-\mu_{2}\neq0.20\)에 대하여 유의수준 \(0.05\)에서 위의 절차대로 검정을 하면

1. \(H_{0}:\,\mu_{1}-\mu_{2}=0.20,\,H_{1}:\,\mu_{1}-\mu_{2}\neq0.20\), \(\alpha=0.05\)

2. 검정통계량은 \(\displaystyle z=\frac{\overline{(x_{1}}-\overline{x_{2}})-\delta}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}}\)이고 \(z\leq-1.96\) 또는 \(z\geq1.96\)이면 귀무가설을 기각한다.

3. \(\overline{x_{1}}=2.61,\,\overline{x_{2}}=2.38,\,\delta=0.20,\,\sigma_{1}=s_{1}=0.12,\,\sigma_{2}=s_{2}=0.14,\,n_{1}=50,\,n_{2}=40\)을 이용하여 검정통계량을 계산하면 \(\displaystyle z=\frac{(2.61-2.38)-0.20}{\sqrt{\frac{0.12^{2}}{50}+\frac{0.14^{2}}{40}}}=1.08\)이다.

4. \(z=1.08<1.96\)이므로 귀무가설을 기각할 수 없다. 이것은 \(|2.61-2.38|=0.23\)과 \(0.20\)의 차이가 우연에 의한 것임을 나타낸다.


어느 반도체의 18개 부품의 두께 측정값의 분산은 \(s^{2}=0.68\)(단위는 \(\text{inch}\times10^{-3}\))이다. 두께의 변동성의 분산이 \(0.36\)보다 작은 분산으로 주어지면 부품의 제조에 문제가 없다고 한다. 부품의 모집단이 정규모집단이라고 하면 대립가설 \(\sigma^{2}>0.36\)에 대해 귀무가설 \(\sigma^{2}=0.36\)을 유의수준 \(0.05\)에서 위의 절차대로 검정을 하면

1. \(H_{0}:\,\sigma^{2}=0.36,\,H_{1}:\,\sigma^{2}>0.36\), \(\alpha=0.05\)

2. 검정통계량은 \(\displaystyle\chi^{2}=\frac{(n-1)s^{2}}{\sigma^{2}}\)이고 \(\chi^{2}\geq27.587(=\chi^{2}_{0.05,\,17})\)이면 귀무가설을 기각한다.

3. \(s^{2}=0.68,\,\sigma^{2}=0.36,\,n=18\)을 이용하여 검정통계량을 계산하면 \(\displaystyle\chi^{2}=\frac{17\cdot0.68}{0.36}=32.11\)이다.

4. \(\chi^{2}=32.11>27.587\)이므로 귀무가설을 기각한다. 이것은 부품의 제조에 문제가 있음을 뜻하고 따라서 수정되어야 한다.


두 종류의 건축자재의 장력의 변이를 비교하는 실험을 해서 \(n_{1}=13,\,s_{1}^{2}=19.2,\,n_{2}=16,\,s_{2}^{2}=3.5\)(관측단위는 \(\text{inch}^{2}\times10^{3}\))의 결과를 얻었다. 두 종류의 건축자재들을 정규모집단이라고 할 때, 대립가설 \(\sigma_{1}^{2}\neq\sigma_{2}^{2}\)에 대하여 귀무가설 \(\sigma_{1}^{2}=\sigma_{2}^{2}\)를 유의수준 \(0.02\)에서 위의 절차대로 검정을 하면

1. \(H_{0}:\,\sigma_{1}^{2}=\sigma_{2}^{2},\,H_{1}:\,\sigma_{1}^{2}\neq\sigma_{2}^{2}\), \(\alpha=0.02\)

2. 검정통계량은 \(\displaystyle F=\frac{s_{1}^{2}}{s_{2}^{2}}\)이고 \(F\geq3.67(=F_{0.01,\,12,\,15})\)이면 귀무가설을 기각한다.

3. \(s_{1}^{2}=1.92,\,s_{2}^{2}=0.35\)를 이용하여 검정통계량을 계산하면 \(\displaystyle F=\frac{s_{1}^{2}}{s_{2}^{2}}=\frac{19.2}{3.5}=5.49\)이다.

4. \(F=5.49>3.67\)이므로 귀무가설을 기각한다. 따라서 두 종류의 건축자재의 장력의 변이는 다르다.


어느 석유회사가 전체 자가용 소유주의 20% 이하로 자사의 가솔린을 이용하지 않는다고 주장한다. 200명의 확률표본을 추출해서 22명이 이 석유회사의 가솔린을 사용하지 않음을 알게 되었고, 유의수준 \(0.01\)에서 위의 절차대로 가설검정을 하면

1. \(H_{0}:\,p=0.20,\,H_{1}:\,p<0.20\), \(\alpha=0.01\)

2. 검정통계량은 \(\displaystyle z=\frac{\hat{p}-p}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}\)이고 \(z\leq-2.33\)이면 귀무가설을 기각한다.

3. \(\displaystyle\hat{p}=\frac{22}{200}=0.11,\,p=0.20,\,n=200\)을 이용하여 검정통계량을 계산하면 \(\displaystyle z=\frac{0.11-0.22}{\sqrt{\frac{0.20\cdot0.80}{200}}}=-3.18\)이다.

4. \(z=-3.18<-2.33\)이므로 귀무가설을 기각한다. 따라서 자가용 소유주의 20% 이하가 이 석유회사의 가솔린을 이용하지 않는다.


참고자료:

John E Freund's Mathematical Statistics with Applications 8th edition, Irwon Miller, Marylees Miller, Pearson

수리통계학, 허문열, 송문섭, 박영사           

반응형
Posted by skywalker222