[금융통계학] 6. 가설검정
가설(hypothesis)은 실질적인 증명 이전에 세우는 모집단의 특성에 대한 진술(경험적 또는 논리적으로 검정되는 조건 또는 명제)이고, 검정(test)은 모집단에서 임의로 추출된 표본을 통해 모집단의 특성을 합리적으로 파악하고자 하는 과정이다.
가설검정(hypothesis testing)은 두 개의 가설을 설정하고 수집된 정보를 바탕으로 두 가설 중 어떤 가설을 선택하는게 맞는 지를 확인하는 것이다. 가설검정은 먼저 연구의 목적을 정한다(검정을 위한 가설설정). 여기서의 두 가설은 귀무가설(null hypothesis) H0과 대립가설(alternative hypothesis) H1로 나뉘는데 대립가설은 주장하고자 하는 가설이고, 귀무가설은 대립가설에 반대되는 가설이다.
귀무가설은 통상적으로 비교하는 값과 차이가 없다는 가설이고, 예를 들면, 다음과 같다.H0:μ=0.05,H0:μA=μB(작은 것들 중에서 가장 큰 것이 불만족스러우면 나머지는 무시해도 된다)
대립가설은 뚜렷한 증거가 있을 때 주장하고자 하는 가설로 통상적으로 차이가 있다는 가설이다. 대립가설은 단측검정(one-sided test)가설과 양측검정(two-sided test)가설로 구분된다.
단측검정의 예:H1:μ>0.05,H1:μ<0.05,H1:μA>μB,H1:μA<μB양측검정의 예:H1:μ≠0.05,H1:μA≠μB
귀무가설과 대립가설 중 하나를 선택하기 이전에 확실한 근거가 있기 전까지는 귀무가설(현재의 사실)을 참이라고 가정한다. 이것은 '무죄추정의 원칙'과 같은 것이다.
어느 자산운용사가 지난해 운용한 펀드의 평균수익률이 9.1%이고 올해 6개월간 새로 개발한 펀드의 평균수익률은 10%로 나타났다. 이때 새로 개발한 펀드의 수익률이 지난해 운용한 펀드의 수익률보다 높은지 확인하기 위한 가설을 다음과 같이 세울 수 있다.H0:p=7.5,H1:p>7.5(p≤7.5의 최댓값은 7.5이다)
가설검정을 하다 보면 두 가지 오류가 발생할 수 있다. 그 첫번째 오류는 귀무가설이 참인데 귀무가설을 기각하는 오류로, 제 1종 오류(type-I error)라고 하고(무죄인데 유죄판결), 두번째 오류는 첫번째 오류와 반대로 귀무가설이 거짓인데 귀무가설을 기각하지 않는 오류로, 제 2종 오류(type-II error)라고 한다(유죄인데 무죄판결).
가설검정을 할 때, 이 두 오류를 모두 줄여야 하나 하나의 오류를 줄이면 다른 오류가 늘어나게 된다. 제 1종 오류의 최대한계를 사전에 정한 다음, 제 2종 오류를 줄이는 방법으로 오류를 줄인다. 제 1종 오류가 발생할 확률의 최댓값을 유의수준(significance level)이라 하고 α로 나타낸다. 이때 α=0.05,0.01,0.1을 주로 사용한다. 제 2종 오류는 β로 나타내는데 1−β는 틀린 귀무가설을 기각해서 귀무가설의 오류를 찾을 확률인 검정력(power of a test)을 나타낸다. 귀무가설이 옳다는 전제조건 하에서 주어진 관측값보다 벗어날 확률을 유의확률(significance probability)(또는 p-값(value))이라고 한다.
가설검정은 다음의 순서대로 진행한다.
1. 귀무가설(H0)과 대립가설(H1)을 세운다.
2. 유의수준 α를 설정한다.
3. 표본을 이용하여 검정통계량(test statistic)을 구한다. 예를들어 모평균 μ를 추정할 때의 검정통계량은 모분산 σ2을 알 때와 모를 때(표본분산 S2) 각각 다음과 같다.Z=¯X−μσ√n,T=¯X−μS√n
4. 귀무가설이 옳다는 전제조건 하에서 검정통계량이 따르는 표본분포를 구한다.
5. 4의 표본분포를 바탕으로 유의수준에 해당하는 검정통계량인 기각역을 찾거나 유의확률을 구한다.
6. 가설검정을 실행해서 귀무가설을 기각하거나 기각하지 않는다.
일반적으로 모평균의 가설검정은 다음의 세 가지 중 하나이다.H0:μ=μ0,H1:μ>μ0H0:μ=μ0,H1:μ<μ0H0:μ=μ0,H1:μ≠μ0이때 표본평균 ¯X의 표본분포를 이용하게 되는데 위의 경우에서 ¯X>c, ¯X<c, ¯X≠c인 영역에서 귀무가설 H0를 기각하게 하는 c를 임계값(critical value)이라고 한다. 다시 말하면 표본분포가 임계값보다 크고, 작고, 다른 영역에서 귀무가설을 기각하게 되고, 이때 이 영역을 기각역(rejection region)이라고 하고 기각역은 유의수준에 의해 결정된다. 기각역의 여집합을 채택역(acceptance region)이라고 한다.
앞에서도 언급했듯이 모평균을 검정하기 위한 검정통계량은 모분산을 알 때,Z=¯X−μσ√n∼N(0,12)이고, 모분산을 모를 때, 표본분산이 S2이면,T=¯X−μS√n∼tα(n−1)(α는 유의수준)이다. 그러면 모평균의 가설검정에서 대립가설에 따른 기각역은 다음과 같다.
대립가설 |
기각역 |
|
모분산을 모를 때 |
모분산을 알 때 |
|
H1:μ>μ0 |
¯X−μS√n>tα(n−1) |
¯X−μσ√n>zα |
H1:μ<μ0 |
¯X−μS√n<tα(n−1) |
¯X−μσ√n |
H1:μ≠μ0 |
|¯X−μS√n|>tα(n−1) |
|¯X−μσ√n|>zα |
어떤 투자회사에서 관리하는 펀드의 연간수익률은 정규분포를 따르고 분산은 16%이다. 이 투자회사엣는 평균 연간수익률이 적어도 9.5%라고 주장하고 있다. 이 주장을 검증하기 위해 이 투자회사에서 관리하는 펀드 중 25개를 임의로 추출해 평균 연간수익률이 10%라는 사실을 알아냈다. α=0.05(5% 유의수준)로 놓고 가설검정을 실시하면H0:μ=0.95,H1:μ>0.95이고 ¯X∼N(μ,(45)2)이므로P(¯X>c)=P(Z>c−9.545)=0.05이고 P(Z>1.645)=0.05,c−0.9545=1.645이므로 임계값은 c=10.816이다. c>10이므로 기각역 바깥에 있고, 따라서 귀무가설을 기각하지 못한다(10%의 연간수익률은 이 투자회사의 주장을 뒷받침하지 못한다). p-값을 구하면P(¯X>10)=P(Z>10−9.5√16√25)=P(Z>0.625)=0.2655>0.05=α이므로 10% 연간수익률은 투자자문회사의 주장을 전혀 반영하지 못한다.
어느 투자자문회사에서 운영하는 자산의 1-기간 단순수익률은 평균이 적어도 3%라고 주장하고 있다. 이 주장을 검증하기 위해 이 투자자문회사에서 운영하는 포트폴리오 중 15개를 임의로 추출해 평균이 3.2%, 분산이 2%라는 사실을 알아냈다. α=0.01(1% 유의수준)로 놓고 가설검정을 실시하면H0:μ=3.0,H1:μ>3.0이고T=¯X−μs√n∼t0.01(14), P(T>2.624),c−3.0√215=2.624이므로 임계값은 c=3.96이다. ¯X=3.2이고 c>¯X=3.2이므로 귀무가설을 기각하지 못한다.
일반적으로 모분산의 가설검정은 모평균의 가설검정처럼 다음의 세 가지 중 하나이다.H0:σ2=σ20,H1:σ2>σ20H0:σ2=σ20,H1:σ2<σ20H0:σ2=σ20,H1:σ2≠σ20정규분포를 따르는 모집단에서 크기가 n인 표본의 분산이 S2, 유의수준이 α일 때,(n−1)S2σ20∼χ2α(n−1)이고, 모분산의 가설검정에서 대립가설에 따른 기각역은 다음과 같다.
대립가설 |
기각역 |
H1:σ2>σ20 |
(n−1)S2σ20>χ2α(n−1) |
H1:σ2<σ20 |
(n−1)S2σ20<χ21−α(n−1) |
H1:σ2≠σ20 |
(n−1)S2σ20>χ2α2(n−1) 또는 (n−1)S2σ20<χ21−α2(n−1) |
위의 표를 이용하여 임계값 c를 구할 수 있고, 각 대립가설에 따른 임계값은 다음과 같다.c=σ20χ2α(n−1)n−1(H1:σ2>σ20)c=σ20χ2(1−α)(n−1)n−1(H1:σ2<σ20)c1=σ20χ2(1−α2)(n−1)n−1,c2=σ20χ2α2(n−1)n−1(H1:σ2≠σ20)(c1<c2)
미국의 S&P 500지수의 수익률의 표준편차는 20%로 알려져있다. 수익률이 작다고 해도 표준편차의 75%인 15% 정도의 수익률의 표준편차를 유지할 수 있는 투자자문회사를 선택하려 한다. 어느 한 투자자문회사는 최근 19년간 수익률의 표준편차가 19%였으나 이것은 최근 2년간 잠깐 일어났었던 일이고 평소의 표준편차는 15% 이하라고 주장하고 있다. α=0.05로 놓고 가설검정을 실시하면H0:σ=15,H1:σ>15이고 n=10이므로 χ20.05(9)=16.919이고 c=152⋅16.9199=422.975, S2=192=361이므로 c>S2이고 이것은 S2이 기각역에 있지 않음을 뜻한다. 따라서 귀무가설을 기각하지 않는다(투자자문회사의 주장이 틀렸다고 할 수 없다).
참고자료:
기초 금융통계, 박유성, 김기환, 자유아카데미
금융인을 위한 통계분석, 이긍희, 한국금융연수원
재무위험관리사(1: 금융통계학), 금융투자교육원, 한국금융투자협회
'확률및통계 > 금융통계학' 카테고리의 다른 글
[금융통계학] 5. 표본통계량의 분포 (0) | 2019.02.13 |
---|---|
[금융통계학] 4. 확률분포 (0) | 2019.02.12 |
[금융통계학] 3. 기댓값과 분산, 공분산, 포트폴리오 (0) | 2019.02.11 |
[금융통계학] 2. 확률과 확률변수 (0) | 2019.02.10 |
[금융통계학] 1. 기초 이론 (0) | 2019.01.16 |