반응형

[금융통계학] 6. 가설검정



가설(hypothesis)은 실질적인 증명 이전에 세우는 모집단의 특성에 대한 진술(경험적 또는 논리적으로 검정되는 조건 또는 명제)이고, 검정(test)은 모집단에서 임의로 추출된 표본을 통해 모집단의 특성을 합리적으로 파악하고자 하는 과정이다. 

가설검정(hypothesis testing)은 두 개의 가설을 설정하고 수집된 정보를 바탕으로 두 가설 중 어떤 가설을 선택하는게 맞는 지를 확인하는 것이다. 가설검정은 먼저 연구의 목적을 정한다(검정을 위한 가설설정). 여기서의 두 가설은 귀무가설(null hypothesis) \(H_{0}\)과 대립가설(alternative hypothesis) \(H_{1}\)로 나뉘는데 대립가설은 주장하고자 하는 가설이고, 귀무가설은 대립가설에 반대되는 가설이다.

귀무가설은 통상적으로 비교하는 값과 차이가 없다는 가설이고, 예를 들면, 다음과 같다.$$H_{0}:\,\mu=0.05,\,H_{0}:\,\mu_{A}=\mu_{B}$$(작은 것들 중에서 가장 큰 것이 불만족스러우면 나머지는 무시해도 된다)

대립가설은  뚜렷한 증거가 있을 때 주장하고자 하는 가설로 통상적으로 차이가 있다는 가설이다. 대립가설은 단측검정(one-sided test)가설과 양측검정(two-sided test)가설로 구분된다. 

단측검정의 예:$$H_{1}:\,\mu>0.05,\,H_{1}:\,\mu<0.05,\,H_{1}:\,\mu_{A}>\mu_{B},\,H_{1}:\,\mu_{A}<\mu_{B}$$양측검정의 예:$$H_{1}:\,\mu\neq0.05,\,H_{1}:\,\mu_{A}\neq\mu_{B}$$ 

귀무가설과 대립가설 중 하나를 선택하기 이전에 확실한 근거가 있기 전까지는 귀무가설(현재의 사실)을 참이라고 가정한다. 이것은 '무죄추정의 원칙'과 같은 것이다. 


어느 자산운용사가 지난해 운용한 펀드의 평균수익률이 9.1%이고 올해 6개월간 새로 개발한 펀드의 평균수익률은 10%로 나타났다. 이때 새로 개발한 펀드의 수익률이 지난해 운용한 펀드의 수익률보다 높은지 확인하기 위한 가설을 다음과 같이 세울 수 있다.$$H_{0}:\,p=7.5,\,H_{1}:\,p>7.5$$(\(p\leq7.5\)의 최댓값은 7.5이다)


가설검정을 하다 보면 두 가지 오류가 발생할 수 있다. 그 첫번째 오류는 귀무가설이 참인데 귀무가설을 기각하는 오류로, 제 1종 오류(type-I error)라고 하고(무죄인데 유죄판결), 두번째 오류는 첫번째 오류와 반대로 귀무가설이 거짓인데 귀무가설을 기각하지 않는 오류로, 제 2종 오류(type-II error)라고 한다(유죄인데 무죄판결).

가설검정을 할 때, 이 두 오류를 모두 줄여야 하나 하나의 오류를 줄이면 다른 오류가 늘어나게 된다. 제 1종 오류의 최대한계를 사전에 정한 다음, 제 2종 오류를 줄이는 방법으로 오류를 줄인다. 제 1종 오류가 발생할 확률의 최댓값을 유의수준(significance level)이라 하고 \(\alpha\)로 나타낸다. 이때 \(\alpha=0.05,\,0.01,\,0.1\)을 주로 사용한다. 제 2종 오류는 \(\beta\)로 나타내는데 \(1-\beta\)는 틀린 귀무가설을 기각해서 귀무가설의 오류를 찾을 확률인 검정력(power of a test)을 나타낸다. 귀무가설이 옳다는 전제조건 하에서 주어진 관측값보다 벗어날 확률을 유의확률(significance probability)(또는 p-값(value))이라고 한다. 


가설검정은 다음의 순서대로 진행한다.

1. 귀무가설(\(H_{0}\))과 대립가설(\(H_{1}\))을 세운다.

2. 유의수준 \(\alpha\)를 설정한다.

3. 표본을 이용하여 검정통계량(test statistic)을 구한다. 예를들어 모평균 \(\mu\)를 추정할 때의 검정통계량은 모분산 \(\sigma^{2}\)을 알 때와 모를 때(표본분산 \(S^{2}\)) 각각 다음과 같다.$$Z=\frac{\overline{X}-\mu}{\displaystyle\frac{\sigma}{\sqrt{n}}},\,T=\frac{\overline{X}-\mu}{\displaystyle\frac{S}{\sqrt{n}}}$$

4. 귀무가설이 옳다는 전제조건 하에서 검정통계량이 따르는 표본분포를 구한다.

5. 4의 표본분포를 바탕으로 유의수준에 해당하는 검정통계량인 기각역을 찾거나 유의확률을 구한다.

6. 가설검정을 실행해서 귀무가설을 기각하거나 기각하지 않는다.


일반적으로 모평균의 가설검정은 다음의 세 가지 중 하나이다.$$\begin{align*}H_{0}&:\,\mu=\mu_{0},\,H_{1}:\,\mu>\mu_{0}\\H_{0}&:\,\mu=\mu_{0},\,H_{1}:\,\mu<\mu_{0}\\H_{0}&:\,\mu=\mu_{0},\,H_{1}:\,\mu\neq\mu_{0}\end{align*}$$이때 표본평균 \(\overline{X}\)의 표본분포를 이용하게 되는데 위의 경우에서 \(\overline{X}>c\), \(\overline{X}<c\), \(\overline{X}\neq c\)인 영역에서 귀무가설 \(H_{0}\)를 기각하게 하는 \(c\)를 임계값(critical value)이라고 한다. 다시 말하면 표본분포가 임계값보다 크고, 작고, 다른 영역에서 귀무가설을 기각하게 되고, 이때 이 영역을 기각역(rejection region)이라고 하고 기각역은 유의수준에 의해 결정된다. 기각역의 여집합을 채택역(acceptance region)이라고 한다.

앞에서도 언급했듯이 모평균을 검정하기 위한 검정통계량은 모분산을 알 때,$$Z=\frac{\overline{X}-\mu}{\displaystyle\frac{\sigma}{\sqrt{n}}}\,\sim\,N(0,\,1^{2})$$이고, 모분산을 모를 때, 표본분산이 \(S^{2}\)이면,$$T=\frac{\overline{X}-\mu}{\displaystyle\frac{S}{\sqrt{n}}}\,\sim\,t_{\alpha}(n-1)$$(\(\alpha\)는 유의수준)이다. 그러면 모평균의 가설검정에서 대립가설에 따른 기각역은 다음과 같다.

대립가설 

기각역 

모분산을 모를 때 

모분산을 알 때 

\(H_{1}:\,\mu>\mu_{0}\) 

\(\displaystyle\frac{\overline{X}-\mu}{\frac{S}{\sqrt{n}}}>t_{\alpha}(n-1)\) 

\(\displaystyle\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}>z_{\alpha}\) 

\(H_{1}:\,\mu<\mu_{0}\) 

\(\displaystyle\frac{\overline{X}-\mu}{\frac{S}{\sqrt{n}}}<t_{\alpha}(n-1)\) 

\(\displaystyle\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\) 

\(H_{1}:\,\mu\neq\mu_{0}\) 

\(\displaystyle\left|\frac{\overline{X}-\mu}{\frac{S}{\sqrt{n}}}\right|>t_{\alpha}(n-1)\) 

\(\displaystyle\left|\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right|>z_{\alpha}\) 


어떤 투자회사에서 관리하는 펀드의 연간수익률은 정규분포를 따르고 분산은 16%이다. 이 투자회사엣는 평균 연간수익률이 적어도 9.5%라고 주장하고 있다. 이 주장을 검증하기 위해 이 투자회사에서 관리하는 펀드 중 25개를 임의로 추출해 평균 연간수익률이 10%라는 사실을 알아냈다. \(\alpha=0.05\)(5% 유의수준)로 놓고 가설검정을 실시하면$$H_{0}:\,\mu=0.95,\,H_{1}:\,\mu>0.95$$이고 \(\displaystyle\overline{X}\,\sim\,N\left(\mu,\,\left(\frac{4}{5}\right)^{2}\right)\)이므로$$P(\overline{X}>c)=P\left(Z>\frac{c-9.5}{\frac{4}{5}}\right)=0.05$$이고 \(\displaystyle P(Z>1.645)=0.05,\,\frac{c-0.95}{\frac{4}{5}}=1.645\)이므로 임계값은 \(c=10.816\)이다. \(c>10\)이므로 기각역 바깥에 있고, 따라서 귀무가설을 기각하지 못한다(10%의 연간수익률은 이 투자회사의 주장을 뒷받침하지 못한다). p-값을 구하면$$P(\overline{X}>10)=P\left(Z>\frac{10-9.5}{\frac{\sqrt{16}}{\sqrt{25}}}\right)=P(Z>0.625)=0.2655>0.05=\alpha$$이므로 10% 연간수익률은 투자자문회사의 주장을 전혀 반영하지 못한다.


어느 투자자문회사에서 운영하는 자산의 1-기간 단순수익률은 평균이 적어도 3%라고 주장하고 있다. 이 주장을 검증하기 위해 이 투자자문회사에서 운영하는 포트폴리오 중 15개를 임의로 추출해 평균이 3.2%, 분산이 2%라는 사실을 알아냈다. \(\alpha=0.01\)(1% 유의수준)로 놓고 가설검정을 실시하면$$H_{0}:\,\mu=3.0,\,H_{1}:\,\mu>3.0$$이고$$T=\frac{\overline{X}-\mu}{\frac{s}{\sqrt{n}}}\,\sim\,t_{0.01}(14)$$, \(\displaystyle P(T>2.624),\,\frac{c-3.0}{\frac{\sqrt{2}}{15}}=2.624\)이므로 임계값은 \(c=3.96\)이다. \(\overline{X}=3.2\)이고 \(c>\overline{X}=3.2\)이므로 귀무가설을 기각하지 못한다.


일반적으로 모분산의 가설검정은 모평균의 가설검정처럼 다음의 세 가지 중 하나이다.$$\begin{align*}H_{0}&:\,\sigma^{2}=\sigma_{0}^{2},\,H_{1}:\,\sigma^{2}>\sigma_{0}^{2}\\H_{0}&:\,\sigma^{2}=\sigma_{0}^{2},\,H_{1}:\,\sigma^{2}<\sigma_{0}^{2}\\H_{0}&:\,\sigma^{2}=\sigma_{0}^{2},\,H_{1}:\,\sigma^{2}\neq\sigma_{0}^{2}\end{align*}$$정규분포를 따르는 모집단에서 크기가 \(n\)인 표본의 분산이 \(S^{2}\), 유의수준이 \(\alpha\)일 때,$$\frac{(n-1)S^{2}}{\sigma_{0}^{2}}\,\sim\,\chi_{\alpha}^{2}(n-1)$$이고, 모분산의 가설검정에서 대립가설에 따른 기각역은 다음과 같다.

대립가설

기각역 

\(H_{1}:\,\sigma^{2}>\sigma_{0}^{2}\) 

\(\displaystyle\frac{(n-1)S^{2}}{\sigma_{0}^{2}}>\chi_{\alpha}^{2}(n-1)\) 

\(H_{1}:\,\sigma^{2}<\sigma_{0}^{2}\) 

\(\displaystyle\frac{(n-1)S^{2}}{\sigma_{0}^{2}}<\chi_{1-\alpha}^{2}(n-1)\) 

\(H_{1}:\,\sigma^{2}\neq\sigma_{0}^{2}\) 

\(\displaystyle\frac{(n-1)S^{2}}{\sigma_{0}^{2}}>\chi_{\frac{\alpha}{2}}^{2}(n-1)\) 또는 \(\displaystyle\frac{(n-1)S^{2}}{\sigma_{0}^{2}}<\chi_{1-\frac{\alpha}{2}}^{2}(n-1)\) 

위의 표를 이용하여 임계값 \(c\)를 구할 수 있고, 각 대립가설에 따른 임계값은 다음과 같다.$$\begin{align*}c&=\frac{\sigma_{0}^{2}\chi_{\alpha}^{2}(n-1)}{n-1}\,(H_{1}:\,\sigma^{2}>\sigma_{0}^{2})\\c&=\frac{\sigma_{0}^{2}\chi_{(1-\alpha)}^{2}(n-1)}{n-1}\,(H_{1}:\,\sigma^{2}<\sigma_{0}^{2})\\c_{1}&=\frac{\sigma_{0}^{2}\chi_{\left(1-\frac{\alpha}{2}\right)}^{2}(n-1)}{n-1},\,c_{2}=\frac{\sigma_{0}^{2}\chi_{\frac{\alpha}{2}}^{2}(n-1)}{n-1}\,(H_{1}:\,\sigma^{2}\neq\sigma_{0}^{2})\,(c_{1}<c_{2})\end{align*}$$


미국의 S&P 500지수의 수익률의 표준편차는 20%로 알려져있다. 수익률이 작다고 해도 표준편차의 75%인 15% 정도의 수익률의 표준편차를 유지할 수 있는 투자자문회사를 선택하려 한다. 어느 한 투자자문회사는 최근 19년간 수익률의 표준편차가 19%였으나 이것은 최근 2년간 잠깐 일어났었던 일이고 평소의 표준편차는 15% 이하라고 주장하고 있다. \(\alpha=0.05\)로 놓고 가설검정을 실시하면$$H_{0}:\,\sigma=15,\,H_{1}:\,\sigma>15$$이고 \(n=10\)이므로 \(\chi_{0.05}^{2}(9)=16.919\)이고 \(\displaystyle c=\frac{15^{2}\cdot16.919}{9}=422.975\), \(S^{2}=19^{2}=361\)이므로 \(c>S^{2}\)이고 이것은 \(S^{2}\)이 기각역에 있지 않음을 뜻한다. 따라서 귀무가설을 기각하지 않는다(투자자문회사의 주장이 틀렸다고 할 수 없다).


참고자료:

기초 금융통계, 박유성, 김기환, 자유아카데미

금융인을 위한 통계분석, 이긍희, 한국금융연수원

재무위험관리사(1: 금융통계학), 금융투자교육원, 한국금융투자협회   

반응형
Posted by skywalker222